logo of meituan

美团【北斗】大模型算法工程师(多模态/后训练/DeepSearch/RL)

校招全职核心本地商业-业务研发平台地点:北京状态:招聘

任职要求


1.硕士及以上学历,博士优先,计算机、数学或统计学等相关专业。
2.在Query理解,召回,相关性,排序,智能交互等方面有深入实践,具备大模型相关经验者优先。
3.扎实的深度学习理论基础,精通主流深度学习框架(如TensorflowPytorch),拥有大模型SFTRAG、DPO/PPO等大模型实操经验优先。
4.具备较强的coding能力,熟练使用Python/C++等语言,在ACL/EMNLP/ICML/CILR/NIPS/CVPR/ICCV等顶会有论文发表经历优先
5.优秀的分析、解决问题能力,对AGI的未来趋势与挑战有浓厚兴趣。
6.精通至少一种深度学习框架(如TensorFlow, PyTorch),并具备良好的编程能力(Python, Java等)。		
7.对解决挑战性问题充满激情,较强的责任心、主动性和韧性,能良好的沟通协作。

岗位亮点:
1.拥有业界一流的团队,成员大多来自国内外名校,团队内有多位北斗、博士,可全方位支持前沿技术研究; 
2.核心业务支撑,参与前沿的大型模型技术研究和落地,探索大模型技术在实际业务场景中的应用; 
3.当前美团核心的GPU落地场景之一,和团队一起探索学习异构计算领域的前沿技术,个人成长快
4.创新型团队扁平化管理,研究成果直接连接数亿用户的实际生活,国内最好的大模型后训练应用土壤。

工作职责


研究方向一:大模型智能体Agent技术研究​
​1.研究多轮长对话中的上下文管理技术,提高模型的连贯性和一致性,并探索基于用户特征和历史交互的定制对话策略,设计针对特定业务场景的微调和适应技术,提升模型在实际应用中的表现。​
2.探索智能体调用和使用多个外部工具的方法,通过端到端后训练的方式增强其解决实际问题的能力。深度研究智能体的自我评估和学习机制,实现智能体的持续优化和能力提升。​
3.优化LLM长链路的多轮工具调用能力,提升工具调用时的精确性及用户的实际交互体验。​
4.设计并完善针对特定任务场景的Auto-Eval能力,指导模型迭代方向。
研究方向二:深度搜索(Deep Search/Research)技术研究​
1.研究面向深度搜索场景的工具学习方法,基于SFT/RLHF后训练算法赋予搜索智能体高效的工具调用能力。​
2.对齐行业最前沿的研究进展,深入研究不同工具调用环境下的大模型后训练能力边界,并基于实际业务场景进行迭代优化。​
​研究方向三:多模态基础模型能力建设​
1.研究多模态数据(文本、语音、图像等)的语义融合与表示方法,提升模型对复杂内容的理解能力。
2.探索多模态模型在推理任务中的表现,研究如何通过工具调用增强模型的推理能力。​
3.设计高效的多模态模型架构,优化模型的参数规模、训练效率和推理性能,提升基础模型的通用性与适应性。
​研究方向四:大模型分布式后训练及推理加速技术​
1.后训练方向:样本IO吞吐优化:使用多线程读取、数据管道流水线编排、数据压缩等技术,实现分布式环境下高性能的样本IO pipeline;​计算图编译与高效执行:通过图编译、Kernel优化、算子融合等手段,提升计算图的执行效率;高性能并行训练:包括DP/TP/PP/SP/CP/EP等并行策略及其他训练超参数的自动寻优,故障自动恢复,弹性计算等;强化学习训练效率优化:通过rollout速度优化、多模型多阶段流水线编排、负载均衡等手段优化RL训练效率。
2.推理加速方向:负责实现和优化大模型在线推理系统,提升推理性能,包括不限于:架构设计、算子开发、通信优化等; 研究并实现各种模型推理加速手段如并行策略、混合精度、MOE、FP8等技术,加速模型推理速度; 设计和开发高效的离线、在线推理系统,优化SGLang、vLLM等推理框架,加速整体推理性能。
包括英文材料
学历+
大模型+
深度学习+
TensorFlow+
PyTorch+
SFT+
RAG+
Python+
C+++
ICML+
CVPR+
ICCV+
Java+
相关职位

logo of meituan
校招核心本地商业-业

1.参与美团全球化业务中智能客服、智能审核、智能外呼等核心场景的大模型应用研发与落地工作。 2.针对跨文化、多语言、少样本等复杂业务挑战,研究并应用强化学习、多模态学习、高效后训练等前沿技术,对大模型进行深度优化与能力增强,提升模型在实际业务中的表现。 3.主要研究方向包括但不限于: a. 任务型对话技术攻关: 研究强化学习与高效后训练方法在多模态任务型对话中的应用,优化全球用户的复杂服务请求处理与任务达成效果。 b. 少样本多模态理解与推理: 探索在海外数据稀疏环境下,通过少样本学习等手段构建强大的多模态理解与推理能力,支持高效合规审核及风险识别。 c. 可控对话生成与知识融合: 面向智能外呼等场景,研究多语言环境下可控对话生成及知识融合技术,提升沟通的自然度、准确性和业务转化率,并追踪前沿技术动态,推动创新落地。

更新于 2025-05-23
logo of meituan
校招核心本地商业-业

研究方向一:垂域LLM研究与构建​ 1.基座模型架构设计与优化:参与大语言模型基座架构的设计,研究前沿技术,如稀疏激活、混合精度训练等,同时优化模型的训练和推理流程。​ 2.技术创新与突破:参与前沿技术研究,如多任务学习、跨模态理解等,推动模型在复杂任务上的性能提升;探索Transformer替代架构,突破现有模型scaling law限制;同时挑战学术benchmark,为模型的性能树立新的行业标杆。​ 3.强化学习算法研究:参与大语言模型后训练阶段的强化学习算法研究,包括基于AI和环境反馈的强化学习(RLXF)算法。同时探索奖励模型与反馈机制,研究可泛化的细粒度过程监督和奖励建模,探索基于细粒度反馈的强化学习算法。​ 4.垂域模型定制化构建:领域认知智能突破,探索小样本场景自演进架构设计、可信推理机制构建等方向,同时建立面向AGI的模型评价体系新范式。​ 5.跨部门协作与落地:与公司数据科学家、算法工程师、产品团队紧密合作,将研究成果快速转化为实际应用,推动大语言模型在更多场景的落地。​​ 研究方向二:垂域MLLM研究与构建​ ​1.研究多模态表征与大语言模型融合的前沿技术,设计和实现创新算法,研究异质数据的统一编解码模型,适配多种模态下的特征统一,实现高效微调与优化。​ 2.探索强化学习(RL)在多模态大模型中的应用,包括强化学习增强的多模态生成、跨模态对齐、偏好建模及自适应优化,提升多模态理解与推理能力。 ​3.持续追踪多模态与强化学习结合的最新研究进展,优化现有多模态系统架构,提升性能、效率与可扩展性,推动多模态强化学习在智能体交互、决策推理等任务中的应用。 ​4.构建技术评估体系,通过多场景验证推动多模态理解、生成及强化学习优化策略的落地应用,提升多模态大模型的泛化能力和实际应用价值。​​ 研究方向三:基于角色扮演的虚拟数字助理 ​​1. 角色扮演技术(Role-Playing):通过模型优化、Agent构建,在人设、拟人性、情感等取得显著提升。 ​2. 记忆管理与增强(Memory):通过模型长上下文,记忆抽取与管理,提升系统的记忆能力。 ​3. 个性化技术:通过用户行为数据挖掘与建模,结合多轮对话上下文理解,分析用户情感状态,提升模型的个性化回复能力。 ​4. 基于Agent的数字助理:通过Agent构建和基于RL的优化,实现数字助理的能力复刻和增强

更新于 2025-05-23
logo of meituan
实习核心本地商业-业

【课题说明】 外卖业务在国际市场上展现出前所未有的增长潜力,全球化运营对智能化提出更高要求。本课题致力于运用大模型技术,结合后训练、多模态、强化学习等手段,打造覆盖智能客服、智能审核、智能外呼的下一代全球服务系统,核心在于高效完成跨文化背景下的复杂任务。 【建议研究方向】 1.任务型对话的强化学习与后训练:研究如何结合强化学习激励与高效后训练方法,使大模型能精准理解并高效完成全球用户、商家及骑手提出的多模态复杂服务任务。 2.少样本多模态理解与推理:探索在数据相对稀疏的海外市场中,如何构建强大的多模态大模型,以支持对用户、骑手、商家上传图文的高效合规审核与风险识别。  3.外呼场景下的可控对话:研究通过可控生成技术并有效融入领域知识,提升大模型在招聘、商家/骑手沟通等多语言智能外呼任务中对话的自然度、信息准确性与目标达成率。

更新于 2025-05-27
logo of meituan
校招核心本地商业-业

以大模型对话技术为核心,探索前沿技术问题,研究方向主要为垂域模型的研究与构建。目标是为用户提供专属的玩乐变美便捷生活小助手,实现“技术驱动业务范式”的升级转变,最终助力商业价值全面提升。 研究方向一:Agent能力增强 基于Agent的用户助理,研究提升Agent自主规划能力,并通过Agent构建和基于后训练的优化,实现数字助理的能力复刻和增强。 研究方向二:强化学习算法研究 参与大语言模型后训练阶段的强化学习算法研究,包括基于AI和环境反馈的强化学习(RLXF)算法。同时探索奖励模型与反馈机制,研究可泛化的细粒度过程监督和奖励建模,探索基于细粒度反馈的强化学习算法。 研究方向三:垂域模型定制化构建 领域认知智能突破,探索小样本场景自演进架构设计、可信推理机制构建等方向,同时建立面向AGI的模型评价体系新范式。 研究方向四:精准上下文理解与长程依赖建模 研究如何高效、准确地捕获和利用复杂的项目级上下文信息(如整个代码库、依赖关系、API文档、Issue跟踪等),探索能够处理超长代码序列、理解跨文件依赖和项目架构的先进模型结构与表征方法,以支持更精准、更全局的代码智能,从而提升业务研发在存量代码中迭代的效率。

更新于 2025-05-23