logo of meituan

美团大模型基础研究与能力增强

社招全职核心本地商业-基础研发平台地点:北京 | 上海状态:招聘

任职要求


1.对NLP大模型相关领域一个或多个方向有深入的研究经历,且有相关实际项目经验。
2.熟练使用深度学习框架(比如PyTorch),熟悉和实操 MegatronDeepSpeed 等开源训练框架。
3.具备扎实的大模型训练和调优背景,熟悉主流的大语言模型(Deepseek、Qwen、Llama等)及其他开源模型。
加分项:
1.在知名开源大模型,或大模型应用项目中有核心贡献者优先。
2.有过预训练经验、深度推理、强化学习等方向的经验。
3.发表过高水平论文,或在算法竞赛、基准榜单中获得优异成绩。

工作职责


基础算法研究
一、推理思考
1.开发链式思考、思维树等推理增强技术,优化模型对复杂业务逻辑推理、策略规划等任务的深度理解。
2.探索通过大规模强化学习持续提升模型推理能力。
3. 构建业务逻辑推理评测基准,推动模型思维链的可解释性研究。
二、多模态端到端
1.研发语音-文本跨模态对齐与联合表示学习算法,解决语义鸿沟问题,提升模型对语音指令理解、语音到文本生成的鲁棒性。
2.探索语音交互场景下的多模态增强技术(如语音情感分析、端到端语音对话生成),推动模型在智能客服、语音助手的应用落地。
三、生活服务领域增强
1.大模型基座知识能力增强,打造生活服务领域基座,赋能美团各类大模型应用场景;
2.探索预训练增强阶段的大规模高质量数据自动合成、Scaling Law、长链条复杂推理反思能力增强;
3.建设生活服务chat模型与智能体,通过强化学习等方式增强模型推理反思、复杂指令遵循、高情商交互等能力。

应用算法研究
一、深度推理、规划与决策能力强化
1.优化大模型在逻辑推理、多步规划、复杂决策、多轮多步工具调用等任务上的表现,探索如RL scaling、Test-time scaling等前沿技术。
2.构建能够处理模糊与不完全信息、进行自主假设与验证的推理框架。赋能大模型实现精准的工具调用与智能体协同。
二、高度拟人化交互与专业沟通能力构建
1.赋予模型深度理解与分析专业领域问题的能力,包括隐性需求挖掘和复杂语境下的语义理解。
2.探索多轮对话中的上下文记忆、情绪感知、共情表达与高情商交互技巧,实现稳定人设、知识遵循与高度自然的对话风格。
3.研究模型主动感知用户全面信息、进行预判性服务与信息推送的策略,而非被动响应,打造能真正吸引用户持续对话的自主交互。
三、多智能体协作研发范式与前沿技术应用
1.设计和研究多智能体间的动态协调、知识/记忆共享与冲突解决机制,实现“1+1>>2”的协同效应。
2.推动面向智能体的大模型研发新范式,探索大模型智能体在环境感知、记忆与知识库管理、复杂指令遵循等基础能力的统一建模与提升路径。
四、BA Agent 核心能力构建
1.定义并主导包括自助取数、多维分析、归因洞察、智能可视化等关键模块的技术路径。
2.研究和改进现有的强化学习算法,实现端到端Agent性能优化,提升Agent鲁棒性与泛化能力。
3.构建面向领域任务的DeepResearch能力,提升Agent在多步骤信息检索、工具调用、推理规划等任务中的表现。
包括英文材料
NLP+
大模型+
深度学习+
PyTorch+
Megatron+
DeepSpeed+
Llama+
强化学习+
算法+
相关职位

logo of meituan
校招核心本地商业-基

基础算法研究 一、推理思考 1.开发链式思考、思维树等推理增强技术,优化模型对复杂业务逻辑推理、策略规划等任务的深度理解。 2.探索通过大规模强化学习持续提升模型推理能力。 3. 构建业务逻辑推理评测基准,推动模型思维链的可解释性研究。 二、多模态端到端 1.研发语音-文本跨模态对齐与联合表示学习算法,解决语义鸿沟问题,提升模型对语音指令理解、语音到文本生成的鲁棒性。 2.探索语音交互场景下的多模态增强技术(如语音情感分析、端到端语音对话生成),推动模型在智能客服、语音助手的应用落地。 三、生活服务领域增强 1.大模型基座知识能力增强,打造生活服务领域基座,赋能美团各类大模型应用场景; 2.探索预训练增强阶段的大规模高质量数据自动合成、Scaling Law、长链条复杂推理反思能力增强; 3.建设生活服务chat模型与智能体,通过强化学习等方式增强模型推理反思、复杂指令遵循、高情商交互等能力。 应用算法研究 一、深度推理、规划与决策能力强化 1.优化大模型在逻辑推理、多步规划、复杂决策、多轮多步工具调用等任务上的表现,探索如RL scaling、Test-time scaling等前沿技术。 2.构建能够处理模糊与不完全信息、进行自主假设与验证的推理框架。赋能大模型实现精准的工具调用与智能体协同。 二、高度拟人化交互与专业沟通能力构建 1.赋予模型深度理解与分析专业领域问题的能力,包括隐性需求挖掘和复杂语境下的语义理解。 2.探索多轮对话中的上下文记忆、情绪感知、共情表达与高情商交互技巧,实现稳定人设、知识遵循与高度自然的对话风格。 3.研究模型主动感知用户全面信息、进行预判性服务与信息推送的策略,而非被动响应,打造能真正吸引用户持续对话的自主交互。 三、多智能体协作研发范式与前沿技术应用 1.设计和研究多智能体间的动态协调、知识/记忆共享与冲突解决机制,实现“1+1>>2”的协同效应。 2.推动面向智能体的大模型研发新范式,探索大模型智能体在环境感知、记忆与知识库管理、复杂指令遵循等基础能力的统一建模与提升路径。 四、基于强化学习的智能体优化方法研究 1.研究和改进现有的强化学习算法,实现端到端Agent性能优化,提升Agent鲁棒性与泛化能力。 2.构建面向领域任务的DeepResearch能力,提升Agent在多步骤信息检索、工具调用、推理规划等任务中的表现。

更新于 2025-05-23
logo of baidu
社招MEG

-模型能力优化:面向百度搜索业务进行基础模型优化,包括但不限于 MoE 稀疏化策略、预训练任务设计、Post-Training 任务优化,基于强化学习的推理能力增强等工作 -模型成本优化:通过优化 MoE 路由策略、Latent Attention 结构优化等手段,提升推理效率,降低部署成本 -算法研究与创新:组内工作发表于 ACL/NeurIPS/ICLR 等会议,积极跟踪学术界和工业界技术进展,设计并实现相关算法创新,推动搜索基础模型的持续进步 -跨团队协作:与数据科学家、架构工程师等跨职能团队紧密合作,确保算法方案能够有效落地

更新于 2025-02-26
logo of baidu
实习MEG

- 模型能力优化:面向百度搜索业务进行基础模型优化,包括但不限于 MoE 稀疏化策略、预训练任务设计、Post-Training 任务优化,基于强化学习的推理能力增强等工作 - 模型成本优化:通过优化 MoE 路由策略、Latent Attention 结构优化等手段,提升推理效率,降低部署成本 - 算法研究与创新:组内工作发表于 ACL/NeurIPS/ICLR 等会议,积极跟踪学术界和工业界技术进展,设计并实现相关算法创新,推动搜索基础模型的持续进步 - 跨团队协作:与数据科学家、架构工程师等跨职能团队紧密合作,确保算法方案能够有效落地

更新于 2025-09-09
logo of jd
校招安全方向

1.大模型在漏洞挖掘中的算法研究与优化:研究大语言模型在代码分析、漏洞挖掘中的应用,探索模型对代码语义理解、数据流/控制流分析的增强能力;优化模型对漏洞特征的检测能力,降低误报和漏检;结合领域知识对通用/安全大模型进行微调,提升对特定漏洞的识别性能; 2.数据工程与知识库构建:构建自动化漏洞挖掘系统,集成动静态分析技术;维护漏洞知识图谱,关联代码模式、攻击场景和修复方案;输出可复用漏洞挖掘框架及报告;协助攻防演练与漏洞复现; 3.前沿技术跟踪与创新:跟进AI4Security领域最新进展,提出技术改进方案;分析模型决策逻辑,增强漏洞检测结果的可解释性,辅助安全专家验证;参与学术论文发表、专利撰写或开源项目贡献。

更新于 2025-05-16