logo of meituan

美团【北斗实习】大模型算法工程师-【国际化业务】

实习兼职核心本地商业-业务研发平台地点:北京状态:招聘

任职要求


海内外高校在校本科生(大三及以上)、硕士生及博士生,且以下条件至少满足一项:
1)超级学霸:专业成绩排名前1%。
2)学术达人:在顶级期刊或学术会议上以第一作者身份发表论文(或导师一作,自己为二作)。
3)竞赛大神:在顶级大赛上获奖。
4)工程高手:有大厂实验室的实习经验,或有贡献突出的开源项目。

工作职责


【课题说明】
外卖业务在国际市场上展现出前所未有的增长潜力,全球化运营对智能化提出更高要求。本课题致力于运用大模型技术,结合后训练、多模态、强化学习等手段,打造覆盖智能客服、智能审核、智能外呼的下一代全球服务系统,核心在于高效完成跨文化背景下的复杂任务。 
【建议研究方向】 
1.任务型对话的强化学习与后训练:研究如何结合强化学习激励与高效后训练方法,使大模型能精准理解并高效完成全球用户、商家及骑手提出的多模态复杂服务任务。 
2.少样本多模态理解与推理:探索在数据相对稀疏的海外市场中,如何构建强大的多模态大模型,以支持对用户、骑手、商家上传图文的高效合规审核与风险识别。 
3.外呼场景下的可控对话:研究通过可控生成技术并有效融入领域知识,提升大模型在招聘、商家/骑手沟通等多语言智能外呼任务中对话的自然度、信息准确性与目标达成率。
包括英文材料
相关职位

logo of meituan
校招核心本地商业-点

1.深入参与行业内主流大模型落地场景的技术迭代,包括:生成式检索/推荐、RAG、推理优化等,持续提高模型的推理性能与效果; 2.跟进Deep Research,Agent RL等前沿技术,并在点评搜推以及大模型应用场景中探索落地,持续改善用户体验。

更新于 2025-05-23
logo of meituan
实习核心本地商业-业

【课题说明】 通用模型往往难以兼顾多样化的场景需求,容易出现泛化能力强但针对性不足的问题。针对这一挑战,本课题聚焦于研究面向具体业务或应用场景的强化学习训练优化策略,通过引入场景特定的奖励函数、环境建模和数据采样机制,提升模型在特定任务下的表现能力与适应性。课题重点突破模型在细粒度场景下的泛化能力不足、奖励稀疏、训练效率低等问题,为大模型的行业落地提供有力支撑。 【建议研究方向】 1.场景特定奖励设计:针对不同业务场景,定制化设计奖励函数,提升模型在目标任务中的表现能力。 2.环境模拟与数据生成:构建高保真场景模拟环境,开发高效的数据采样与生成机制,提升强化学习训练效率。 3.迁移与泛化能力增强:研究多场景迁移学习与元强化学习方法,提升模型从通用能力到场景定制能力的转化效率。 4.推理增强型RAG系统:基于图结构的知识融合、混合模型的协同推理架构和强化学习驱动的优化方法,进一步提升RAG系统能力。 5.基于价值观约束的大模型风险控制与安全防护。

更新于 2025-05-27
logo of meituan
实习核心本地商业-业

【课题说明】 以大模型对话技术为核心,探索前沿技术问题。研究方向包括角色扮演、个性化对话、记忆管理,拟人化,数字人等,主要业务场景包括运营,招聘,销售,审核等。目标是构建覆盖多个场景的Agent系统,实现“技术驱动业务范式”的升级转变。 【建议研究方向】 1. 大模型个性化(Personalized LLM):通过角色扮演、用户行为数据挖掘与建模、上下文理解等方法,分析用户情感状态,提升模型的个性化回复能力。 2. 面向语音交互的拟人化技术(Voice Agent):优化大模型在语音对话场景的效果,提升大模型的拟人化水平,探索下一代端到端语音对话大模型的技术实现。 3. 记忆管理与增强(Memory):通过优化模型长上下文能力、设计记忆抽取与管理模块,提升系统的记忆能力。 4. 基于LLM的RL(LLM-based RL):通过强化学习,提升模型规划、决策、推理等能力。 我们将提供充足的计算资源和良好的工作自由度,目标是产出有影响力的工作,解决业务实践中的问题。

更新于 2025-05-27
logo of meituan
实习核心本地商业-业

【课题说明】 大模型研发正从“人类数据时代”跨入“经验时代”,评估已然是大模型研发的重点和难点。具体而言,评估驱动的行业大模型研发下半场范式主要包括两方面内容:①行业核心问题定义和评估归因;②Post-Training多阶段协同的效果提升。本课题基于美团的本地生活业务,精选销售、履约、医药和客服四个代表性行业,旨在探索评估驱动的行业大模型研发的下半场范式。 【建议研究方向】 1.行业大模型通用评估方案探索。 2.行业模型reward设计与探索。 3.面向行业推理能力建设的通用自动化样本构建方法和评估归因方法。 4.面向行业推理能力增强的通用强化训练方案。 5.销售、履约、医药和客服行业大模型训练。

更新于 2025-05-27