logo of meituan

美团【北斗实习】前沿自动驾驶算法开发与落地

实习兼职自动车配送部地点:北京状态:招聘

任职要求


1.计算机科学、人工智能领域,具有扎实的深度学习计算机视觉/自然语言处理基础;
2.具有优秀的编程能力,熟悉PyTorchTensorflow深度学习框架,能熟练进行模型研发和测试; 
3.具备一定的科研能力,能够承担科研探索工作和先进技术落地推进工作。 
具备以下优先: 
1.有训练过端到端自动驾驶模型的经验; 
2.在设计、训练、评估和部署机器学习模型(尤其是多模态大模型、生成模型等)方面有深刻的理解; 
3.在NeurIPS/ICML/ICLR/CVPR等会议或期刊上发表过论文; 
4.获得过国际或国内赛事奖项者。

工作职责


工作城市可选北京、深圳
1.端到端自动驾驶建模:参与、设计及实现端到端的自动驾驶建模方法,搭建从传感器数据到行为决策的端到端模型。
2.多模态大模型在自动驾驶场景中的适配和优化:如:大模型指令微调和策略迭代、开放场景下的目标识别技术等,以适应不同的自驾场景,并提高模型的鲁棒性和泛化能力。
3.生成式仿真系统构建,研发基于扩散模型的场景生成技术和仿真技术。开发仿真-真实数据闭环系统。
包括英文材料
深度学习+
OpenCV+
NLP+
PyTorch+
TensorFlow+
自动驾驶+
机器学习+
大模型+
NeurIPS+
ICML+
CVPR+
相关职位

logo of meituan
实习自动车配送部

基于数据驱动模型端到端一体化的长期需求,我们寻找有极强的技术信仰与热情,富有好奇心和驱动力的候选人。参与探索自动驾驶面向未来的算法设计和工程优化的综合性问题。 1.探究自动驾驶领域分布式训练的效率极限,通过底层硬件和分布式集群/存储优化,结合深度学习框架特性和极致算子性能优化,达到MFU上限。 2.基于VLM、LLM等大模型技术和无人配送的业务特点,探索自动驾驶新一代的模型结构范式,推动自动驾驶技术的进一步发展。

更新于 2025-04-22
logo of meituan
实习核心本地商业-基

随着大模型与生成式 AI 技术的快速发展,在多模态和复杂场景下让 Agent 具备更强大的决策和执行能力成为未来的重要趋势。OpenAI Operator 通过结合强化学习的多步决策机制与大模型的理解、推理优势,可在多种任务场景(如 Computer Use、网页浏览等)中实现高效且灵活的自动化决策和任务执行。本课题将聚焦多样化业务场景和复杂环境下的自适应策略设计、规划与推理,进一步提升 Agent 在真实应用中的表现。 主要研究内容包括但不限于: 1) 多模态与多步决策:设计并构建包含多模态信息、计算机交互、网络搜索、函数调用等多维度的复杂环境,研究如何利用端到端强化学习来进行多步决策,从而完成更具挑战的任务。 2) 策略学习与优化:在多种强化学习算法(如 PPO、GRPO 等)的框架下,探索高效的策略优化方法,为 Operator Agent 提供强大的决策和执行能力。 3) 规划与推理:借助大模型的知识与推理能力,设计可解释的多步规划算法;研究如何与外部工具或知识库交互,以扩展 Agent 的能力边界并提升其在真实环境中的自动化决策表现。

更新于 2025-05-23
logo of meituan
实习核心本地商业-基

Post-training是联结大模型通用知识和人类偏好的桥梁,在规范知识输出、提升推理能力、对齐人类偏好等方面起到了关键作用。本课题专注于大模型Post-training相关前沿算法研究,包括但不限于: 1)训练机制设计和优化:包括数据建设、指令微调,人类偏好和安全对齐,奖励模型、强化学习及效果评估等方向,优化模型文本创作、逻辑推理、指令遵循、代码生成、工具调用等能力,提升模型可控性和安全性。 2)Post-training前沿研究:面向下一代推理基座的架构设计,test-time compute训练范式,思维链学习,多智能体和自博弈强化学习,提升模型的复杂任务处理能力和智能水平。

更新于 2025-05-23
logo of meituan
实习核心本地商业-业

【课题说明】 以大模型对话技术为核心,探索前沿技术问题。研究方向包括角色扮演、个性化对话、记忆管理,拟人化,数字人等,主要业务场景包括运营,招聘,销售,审核等。目标是构建覆盖多个场景的Agent系统,实现“技术驱动业务范式”的升级转变。 【建议研究方向】 1. 大模型个性化(Personalized LLM):通过角色扮演、用户行为数据挖掘与建模、上下文理解等方法,分析用户情感状态,提升模型的个性化回复能力。 2. 面向语音交互的拟人化技术(Voice Agent):优化大模型在语音对话场景的效果,提升大模型的拟人化水平,探索下一代端到端语音对话大模型的技术实现。 3. 记忆管理与增强(Memory):通过优化模型长上下文能力、设计记忆抽取与管理模块,提升系统的记忆能力。 4. 基于LLM的RL(LLM-based RL):通过强化学习,提升模型规划、决策、推理等能力。 我们将提供充足的计算资源和良好的工作自由度,目标是产出有影响力的工作,解决业务实践中的问题。

更新于 2025-05-27