logo of meituan

美团【北斗实习】大模型算法研究员

实习兼职核心本地商业-美团平台地点:北京 | 上海状态:招聘

任职要求


1. 博士在读优先,计算机、人工智能、自动化、数学、物理等相关专业。
2.在强化学习、语言模型、机器学习等一个或多个领域有较深入的研究者。
3. 好奇心驱动,具有出色的分析、解决…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


【课题说明】 
探索本地生活服务场景下的AI原生应用优化,包括Agentic RL相关前沿领域与业务的结合,拥有独特的垂直领域高质量数据(本地生活场景),获得在业内最前沿的大模型认知和技术积累,既能做前沿  Research,也有直接的落地场景。
【研究方向】
1. 探索模型通过 RL Scaling 等方式使用成套工具解决复杂问题的行动和规划能力,包括 Human in the Loop 多轮交互下 Agent 基础建模的新方案、以及与复杂环境的交互学习能力。
2. 探索模型在 Non-Rule Based Outcome 场景下利用复杂信息进行有效 Reasoning 推理的范式,包括 Proactive Agent 的建模方案 。
3. 探索研究更多内在奖励的机制,从而激发模型主动学习和自我更新的能力。
4. 探索构建长期记忆机制,为下一代高效的推理模型、长序列推理及建模提供基础。
包括英文材料
强化学习+
机器学习+