美团【北斗实习】自动驾驶算法与系统研究实习生
任职要求
1.2026届本科及以上学历,人工智能、计算机、自动化、数学相关专业优先; 2.扎实的机器学习、CV、LLM基础和出色的探索能力。具备自动驾驶或大模型领域相关算法知识; 3.优秀的代码能力、数据结构和基础算法功底,熟练掌握C/C++或Python。有竞赛经历优先; 4.极强的技术信仰与热情,对自动驾驶充满乐趣; 5.富有好奇心和驱动力,了解大模型社区相关技术发展。 岗位亮点: 1.可以参与自动车团队部门级别的核心工程优化项目,学习到包括大模型领域前沿的算力效率优化技巧,锻炼ai infra相关技能。 2.基于VLM、LLM等大模型技术,结合工程和算法,探索业务可落地的自动驾驶端到端方案。
工作职责
基于数据驱动模型端到端一体化的长期需求,我们寻找有极强的技术信仰与热情,富有好奇心和驱动力的候选人。参与探索自动驾驶面向未来的算法设计和工程优化的综合性问题。 1.探究自动驾驶领域分布式训练的效率极限,通过底层硬件和分布式集群/存储优化,结合深度学习框架特性和极致算子性能优化,达到MFU上限。 2.基于VLM、LLM等大模型技术和无人配送的业务特点,探索自动驾驶新一代的模型结构范式,推动自动驾驶技术的进一步发展。
工作城市可选北京、深圳 1.端到端自动驾驶建模:参与、设计及实现端到端的自动驾驶建模方法,搭建从传感器数据到行为决策的端到端模型。 2.多模态大模型在自动驾驶场景中的适配和优化:如:大模型指令微调和策略迭代、开放场景下的目标识别技术等,以适应不同的自驾场景,并提高模型的鲁棒性和泛化能力。 3.生成式仿真系统构建,研发基于扩散模型的场景生成技术和仿真技术。开发仿真-真实数据闭环系统。
【课题说明】 大模型研发正从“人类数据时代”跨入“经验时代”,评估已然是大模型研发的重点和难点。具体而言,评估驱动的行业大模型研发下半场范式主要包括两方面内容:①行业核心问题定义和评估归因;②Post-Training多阶段协同的效果提升。本课题基于美团的本地生活业务,精选销售、履约、医药和客服四个代表性行业,旨在探索评估驱动的行业大模型研发的下半场范式。 【建议研究方向】 1.行业大模型通用评估方案探索。 2.行业模型reward设计与探索。 3.面向行业推理能力建设的通用自动化样本构建方法和评估归因方法。 4.面向行业推理能力增强的通用强化训练方案。 5.销售、履约、医药和客服行业大模型训练。
【课题说明】 聚焦多模态数字人核心技术,以直播为应用场景,旨在突破其在真实感、智能交互、情感表达及多模态信息处理上的瓶颈。研发能自主执行复杂运营任务、展现丰富情感与高表现力,并与用户进行深度多模态内容互动的下一代数字人,革新直播行业运营模式与用户体验。 【建议研究方向】 1.智能运营Agent:研究数字人作为智能Agent,在直播前(策划、脚本、货盘)、中(场控、问答、促单)、后(复盘、再创)全流程承担运营职能。重点攻克基于多模态数据的智能决策、任务自动化及人机协同,提升直播运营效能。 2.高表现力数字人生成驱动:探索高真实感、个性化数字人形象(外观、声音、风格)的快速生成与定制。重点研究大模型驱动的、与语音同步且富含细腻情感的表情、口型、动作的实时驱动,增强直播感染力。 3.多模态内容生成和交互:研究理解用户多模态输入(文、语、图、视频)并进行深度互动。探索数字人自主生成动态多模态内容,丰富直播呈现,提升用户参与感。
【课题说明】 面向C端用户的医药健康AI助手项目旨在重塑用户未来的看病范式,给用户提供AI问诊、对症找药、药品问答、医疗科普等多元化核心能力,在用户诊前、诊中、诊后的关键环节提供专业的医疗决策支持,从而促进线上看病一体化链路的打通,率先形成线上便捷+专业的看病入口。 【建议研究方向】 1.医药Agent技术架构设计:针对问病、问药、科普等场景分别建设专业的子Agent能力,并优化多Agent之间的协作逻辑,满足用户灵活的多轮对话交互需求。 2.模型自动化评测:从医学专业性和用户体验维度构建多维度benchmark,并探索Agent各能力项的Auto-Eval做法,提升模型评测效率和结果可靠性。 3.模型后训练技术:探索合成数据技术方案来快速积累高质量医疗训练数据,并通过SFT、强化学习等手段持续提升模型在医学问答、病情采集、疾病诊断、药品推荐等关键任务上的表现和泛化能力。