小米机器人 VLN 大模型导航-实习生
任职要求
满足部分条目即可: 1. 优秀的编程与工程能力,熟悉 C/(Modern)C++ 或 Python 或 CUDA 或 Rust 2. 参与过开源项目,或在维护自己的 github…
工作职责
机器人 VLN 大模型导航方向,参与团队相关研发工作: * VLN/LocoManipulation 模型研发 * 算法云端/实机部署,性能优化 * 数据管线搭建/优化 * 算法评测等
1. 参与机器人导航系统中大模型和感知模型的算法研究、开发与优化,包括但不限于VLA模型、VLN模型等。 2. 参与自动驾驶系统中大模型和感知模型的算法研究、开发与优化,包括但不限于VLA模型、VLM模型、Occupancy模型等。 3. 参与AI Infra的研发,包括但不限于大模型训练加速、云侧推理加速、端侧推理加速。 4. 将实习成果提炼总结,撰写学术论文,投稿AI顶会顶刊。
我们是谁? 具身智能AI算法团队,致力于打造自主研发的机器人产品。我们正组建一支以AI技术为基石、汇聚多领域顶尖人才的全栈自研算法团队,目标是构建能够与物理世界交互、具备自主理解决策、自主行动的智能机器人 1、主导或深度参与VLA/LBM模型的架构设计、训练策略优化与多模态对齐机制研究,提升智能体在开放环境中的泛化与推理能力; 2、构建面向具身智能的空间计算系统,包括但不限于:3D场景理解、动态环境建模、跨模态空间表征学习、物理交互预测等; 3、探索基础感知技术(如多传感器融合、SLAM、NeRF、3D生成等)与大模型的深度融合,实现端到端的具身智能决策; 4、与机器人平台、仿真系统、产品团队紧密协作,推动算法在真实硬件或虚拟环境中的部署与验证; 5、跟踪并引领国际前沿进展,在顶级会议(如 NeurIPS, ICML, CVPR, ICLR, RSS, CoRL 等)发表高水平成果,构建技术壁垒。
岗位职责 1.研发具身智能认知架构(VLM/VLA/VLN),实现多模态指令理解与长周期任务规划、自主导航系统 2.设计强化学习(RL)/模仿学习(IL)决策框架,解决开放场景稀疏奖励问题 3.优化模型结构、提升计算效率(模型剪枝/量化),解决端侧部署挑战 4.主导仿真(Isaac Gym/MuJoCo)到真机(人形机器人/机械臂)的Sim2Real迁移