
Momenta端到端自动驾驶大模型实习生
任职要求
1. 计算机、机器学习、人工智能、机器人等相关专业,有良好的数据结构和算法基础; 2. 熟练使用 C/C++或 Python,有深度学习/强化学习等算法背景,具备扎实的数学基础; 3. 有端到端/VLA/WorldModel/3DGS,强化学习…
工作职责
1. 负责端到端智驾大模型在L2、L4下的算法预研,算法突破与验证工作; 2. 负责城区自动驾驶纯模型方案的落地部署,产品性能提升与交付; 3. 负责端到端智驾大模型方案的研发迭代体系的建设与完善。

研发基于视觉文本多模态大模型VLM,深度学习与强化学习的端到端自动驾驶方案,包括但不限于数据集构建,模型设计, 实现, 训练和验证。 - 开发并维护基于端到端自动驾驶大模型训练评测系统的工具链,包括数据处理,自动标注,数据闭环,测试与验证等。 - 探索基于开环模仿学习SFT和闭环强化学习的训练方案。
加入我们,驱动自动驾驶的未来! 现正积极招募对大模型技术充满热情的实习生。如果你对VLM(视觉语言模型)、VLA(视觉语言动作模型)、世界模型、视频生成或强化学习有浓厚兴趣或研究经验,欢迎加入我们,共同探索自动驾驶技术的边界! 职位亮点 • 前沿技术探索:深入参与多模态大模型、生成式世界模型、强化学习等尖端技术在自动驾驶领域的应用研究 • 全流程实践:从数据构建、模型设计、训练优化到评测部署,全面参与自动驾驶大模型的研发全流程 • 丰富资源支持:提供大规模真实驾驶场景数据集与充足计算资源,支持技术创新与突破 • 成果转化与发表:开放的技术氛围,支持顶会论文发表与专利申请,优秀成果有望落地应用 • 参与VLA/VLM算法研发,探索视觉-语言-动作模型在自动驾驶决策规划中的应用 • 开展生成式世界模型研究,包括状态建模、轨迹预测与端到端规划 • 运用强化学习/模仿学习技术,提升模型在复杂驾驶场景的应对能力 • 构建多模态预训练与SFT数据集,优化模型泛化性与鲁棒性 • 跟踪顶级会议最新研究成果,复现开源项目并进行技术验证

1. 协助研发基于强化学习(RL)或模仿学习(IL)的自动驾驶决策规划算法,解决复杂交通场景下的车辆行为决策与运动规划问题; 2. 参与构建和优化用于训练决策模型的数据处理流程,包括特征工程、场景提取、奖励函数设计及大规模数据集处理; 3. 负责或参与相关算法的仿真测试、实车调试、性能评估与迭代优化,推动算法在真实环境中的性能提升和落地; 4. 跟踪并调研强化学习、模仿学习、行为预测等领域的国际前沿动态与最新研究成果(如顶会论文CVPR, ICRA, NeurIPS, ICML等),并尝试将其应用于实际项目; 5. 协助端到端自动驾驶大模型或相关子模块的研发与优化工作。
