美团【北斗实习】大模型应用算法工程师【全球多国的Agentic推荐】

实习兼职核心本地商业-业务研发平台2026-04-03地点：北京状态：招聘

扫码手机上打开

任职要求

海内外高校在校本科生（大三及以上）、硕士生及博士生，且以下条件至少满足一项：
1）超级学霸：专业成绩排名前1%。
2）学术达人：在顶级期刊或学术会议…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

【课题子主题】【搜推】面向全球多国的Agentic推荐
【课题说明】
随着业务发展，keeta推荐面临多国家不同文化和餐饮环境的挑战，包括：1. 冷启动问题突出，推荐系统对本地的商家缺少理解，新市场和新用户缺乏交互数据，系统难以推荐符合本地用户偏好、受欢迎的餐厅；2. 不同国家面临非常多的本地事件，例如中东斋月、巴西狂欢节、极端天气等，传统模型依赖历史行为数据难以及时对不同事件下的需求进行响应。 本课题拟引入 Agent 与多轮强化学习技术，构建具备策略生成、动态调控与反馈优化能力的搜推一体化推荐框架，提升系统在跨文化复杂场景下的响应速度和推荐效果。
【建议研究方向】
1. 面向冷启动的语义理解与推荐建模，构建统一的商家与内容语义表征体系，通过世界知识和多模态信息建模，提升系统对不同国家餐饮供给的理解能力，并结合相似用户与商家的迁移泛化，在低数据与新市场场景下提升推荐效果。
2. 基于世界模型的推荐环境建模，构建统一的推荐世界模型，对用户偏好、商家供给及环境因素进行联合建模，学习需求随场景变化的动态规律，并通过用户反馈模拟器支持策略的离线评估与推演，提升系统对复杂环境的建模能力。
3. Agent驱动的推荐决策与强化学习，基于世界模型，将推荐建模为序列决策问题，引入Agent进行动态策略生成，并结合多轮强化学习与在线反馈持续优化排序与流量分配策略，以提升长期推荐效果与跨场景适应能力。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料