logo of meituan

美团【大模型北斗实习】面向真实物理世界的大规模智能体研究(Agent In Real Life)

实习兼职核心本地商业-美团平台地点:北京 | 上海状态:招聘

任职要求


1)硕士及以上学历,计算机科学、人工智能或相关专业背景。
2)熟练掌握 Python,熟悉 PyTorchTensorFlow深度学习框架。
3)扎实的 LLMAgent 系统理论基础。
4)熟悉 RL 算法框架,具备将 RL 应用于 Agent 决策优化的实践经验。
5)具备设计复杂 Agent 系统架构的能力,包括记忆机制、规划模块、执行模块等核心组件。
加分项:
1)在NeurIPSICLRICML、ACL、EMNLP等顶级会议发表过 Agent 系统或相关技术的论文。
2)参与过开源 Agent 项目(如LangChainAutoGPT 等)的开发或有重要贡献。
3)具备多 Agent 系统设计和协作机制研究经验,了解 Agent 间通信和任务分配技术。
4)有构建端到端 Agent 系统的实际项目经验,能够解决生产环境中的鲁棒性和可靠性问题。

工作职责


随着 LLM 与 RL 技术的飞速发展,具备自主决策与执行能力的 Agent 系统成为 AI 领域的前沿研究方向。本课题聚焦于构建能够在真实物理世界(餐饮、购物、旅行规划等)复杂场景下自主运行的 Agent 系统,解决传统 AI 系统难以应对的多步骤规划、长期目标追踪、环境适应性等核心挑战。主要研究内容包括但不限于:
1)自主规划与决策:研究基于 LLM 的 CoT 等的复杂推理机制,使 Agent 能够自主分解并解决如"为一家四口安排一个周末出游计划,包括交通、住宿、餐饮和活动"等多步骤任务;开发能够在规划失败时进行自我修正和重新规划的自适应决策框架,突破传统 Agent 在复杂场景下的规划瓶颈。
2)强化学习驱动的自主优化:应用前沿强化学习算法(如PPO、GRPO、RL)优化 Agent 的决策系统,通过用户反馈和任务完成度构建复杂奖励函数;研究如何在高维状态空间和长期依赖问题中有效进行奖励分配,解决真实复杂物理场景中典型的延迟反馈和稀疏奖励挑战。
3)多 Agent 协作与分布式决策:设计基于角色分工的多 Agent 协作框架,使不同专长的 Agent 能够协同解决复杂任务,如"美食专家 Agent 负责菜品推荐,规划 Agent 负责整体行程安排"等;研究 Agent 间的通信协议和共识机制,解决分布式决策中的冲突协调和资源分配问题。
包括英文材料
学历+
Python+
PyTorch+
TensorFlow+
深度学习+
大模型+
AI agent+
算法+
NeurIPS+
ICML+
LangChain+
AutoGPT+
系统设计+
相关职位

logo of meituan
实习核心本地商业-基

本课题聚焦大模型在复杂场景下的高阶认知能力突破,面向真实需求构建具备自主推理与协作进化能力的智能系统。通过前沿算法创新与工业级场景验证,助力研究者攻克高度自适应智能体架构设计、复杂决策优化等关键技术难题。 核心研究内容包括: 1)构建复杂情境推理框架:开发能够处理模糊信息、进行合理假设并自主验证的决策系统,突破不完全数据下的逻辑闭环能力。 2)建立多智能体协作范式:研究分层任务拆解机制与分布式决策架构,实现跨智能体的动态协调与效能优化。 3)设计任务驱动进化机制:结合强化学习与反思模型,持续提升智能体在业务场景中的自主适应与问题排查能力。 4)开发模型可解释性框架:创新推理过程可视化技术,建立决策依据追溯机制,显著降低模型幻觉风险。 5)探索人机协同新形态:构建具备环境感知与交互进化能力的智能助手,推动大模型在真实场景的可靠落地。

更新于 2025-05-23
logo of meituan
实习核心本地商业-基

Post-training是联结大模型通用知识和人类偏好的桥梁,在规范知识输出、提升推理能力、对齐人类偏好等方面起到了关键作用。本课题专注于大模型Post-training相关前沿算法研究,包括但不限于: 1)训练机制设计和优化:包括数据建设、指令微调,人类偏好和安全对齐,奖励模型、强化学习及效果评估等方向,优化模型文本创作、逻辑推理、指令遵循、代码生成、工具调用等能力,提升模型可控性和安全性。 2)Post-training前沿研究:面向下一代推理基座的架构设计,test-time compute训练范式,思维链学习,多智能体和自博弈强化学习,提升模型的复杂任务处理能力和智能水平。

更新于 2025-05-23
logo of meituan
实习核心本地商业-基

多模态理解与生成能力是大模型实现通用人工智能的核心基石之一,涵盖了跨视觉、语言等多种模态的信息处理与创造。本课题致力于探索统一的多模态大模型架构,打通理解与生成之间的壁垒,研究如何在单一模型框架下实现对多模态信息的深度理解与高质量生成,从而构建具备更强泛化能力和创造性的通用人工智能大模型。 研究内容: 1)视觉表征研究:不同规模和训练范式的视觉基座预训练,模型结构探索和选型,开发更适合于多模态大模型的视觉基座。 2)理解生成统一:面向不同的多模态架构和训练范式,从视觉基座的角度深入探索视觉连续表征和离散表征的联系和区别,探索更具通用性的多模态特征。 3)视频多模态能力提升:探索短视频、长视频、视频流等不同形态的视频多模态方案,探究图像、视频统一的多模态解决方案。 4)高效和轻量化模型构建:探索适合轻量化多模态任务的模型架构,通过参数共享、模块化设计等手段,在不显著降低性能的前提下减少模型参数量和计算复杂度。

更新于 2025-05-23
logo of meituan
实习核心本地商业-业

【课题说明】 面向C端用户的医药健康AI助手项目旨在重塑用户未来的看病范式,给用户提供AI问诊、对症找药、药品问答、医疗科普等多元化核心能力,在用户诊前、诊中、诊后的关键环节提供专业的医疗决策支持,从而促进线上看病一体化链路的打通,率先形成线上便捷+专业的看病入口。 【建议研究方向】 1.医药Agent技术架构设计:针对问病、问药、科普等场景分别建设专业的子Agent能力,并优化多Agent之间的协作逻辑,满足用户灵活的多轮对话交互需求。 2.模型自动化评测:从医学专业性和用户体验维度构建多维度benchmark,并探索Agent各能力项的Auto-Eval做法,提升模型评测效率和结果可靠性。 3.模型后训练技术:探索合成数据技术方案来快速积累高质量医疗训练数据,并通过SFT、强化学习等手段持续提升模型在医学问答、病情采集、疾病诊断、药品推荐等关键任务上的表现和泛化能力。

更新于 2025-05-27