美团【北斗实习】大模型应用算法工程师【全球多国的Agentic推荐】
实习兼职核心本地商业-业务研发平台地点:北京状态:招聘
任职要求
海内外高校在校本科生(大三及以上)、硕士生及博士生,且以下条件至少满足一项: 1)超级学霸:专业成绩排名前1%。 2)学术达人:在顶级期刊或学术会议…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
【课题子主题】【搜推】面向全球多国的Agentic推荐 【课题说明】 随着业务发展,keeta推荐面临多国家不同文化和餐饮环境的挑战,包括:1. 冷启动问题突出,推荐系统对本地的商家缺少理解,新市场和新用户缺乏交互数据,系统难以推荐符合本地用户偏好、受欢迎的餐厅;2. 不同国家面临非常多的本地事件,例如中东斋月、巴西狂欢节、极端天气等,传统模型依赖历史行为数据难以及时对不同事件下的需求进行响应。 本课题拟引入 Agent 与多轮强化学习技术,构建具备策略生成、动态调控与反馈优化能力的搜推一体化推荐框架,提升系统在跨文化复杂场景下的响应速度和推荐效果。 【建议研究方向】 1. 面向冷启动的语义理解与推荐建模,构建统一的商家与内容语义表征体系,通过世界知识和多模态信息建模,提升系统对不同国家餐饮供给的理解能力,并结合相似用户与商家的迁移泛化,在低数据与新市场场景下提升推荐效果。 2. 基于世界模型的推荐环境建模,构建统一的推荐世界模型,对用户偏好、商家供给及环境因素进行联合建模,学习需求随场景变化的动态规律,并通过用户反馈模拟器支持策略的离线评估与推演,提升系统对复杂环境的建模能力。 3. Agent驱动的推荐决策与强化学习,基于世界模型,将推荐建模为序列决策问题,引入Agent进行动态策略生成,并结合多轮强化学习与在线反馈持续优化排序与流量分配策略,以提升长期推荐效果与跨场景适应能力。
包括英文材料