logo of mi

小米顶尖应届-具身基座VLA大模型研究员-汽车

校招全职地点:北京状态:招聘

任职要求


1. 计算机科学、人工智能、自动化或相关专业在读硕士或博士研究生,发布过CVPR/ECCV/ICCV/NeurIPS/ICRA/CoRL等会议的优先;
2. 熟悉深度学习基本原理,掌握至少一种主流深度学习框架(如PyTorch, TensorFlow);
3. 对自然语言处理NLP)、计算机视觉(CV)有深入理解,有视觉语言模型(VLM/VLA)相关项目经验者优先;
4. 具备扎实的编程能力(Python优先)和算法基础;
5. 对自动驾驶或机器人技术有浓厚兴趣,具备良好的中英文文献阅读和撰写能力;
6. 具备较强的分析问题和解决问题的能力,良好的沟通和团队协作精神。

工作职责


1. 参与研究与开发融合视觉与语言理解的端到端机器人新范式;
2. 负责视觉语言大模型(VLA)相关算法的设计、实现与优化,提升模型的环境感知、决策规划能力;
3. 探索如何利用VLA增强机器人的泛化能力及人机交互的自然性;
4. 参与相关数据集的构建、处理以及模型在真实场景中的部署与测试;
5. 跟踪VLA及相关领域(多模态学习、大模型等)的前沿技术动态;
6. 发表高水平论文至国际顶会顶刊,参加相关领域的国内外顶级学术会议。

【课题名称】
具身基座VLA大模型预研
【课题内容】
探索如何利用VLA与Foundation Model技术提升机器人的环境理解、任务规划与泛化执行能力,构建面向未来的通用智能体。
包括英文材料
CVPR+
ECCV+
ICCV+
NeurIPS+
深度学习+
PyTorch+
TensorFlow+
NLP+
OpenCV+
Python+
算法+
自动驾驶+
相关职位

logo of mi
校招

1. 参与研究与开发融合视觉与语言理解的端到端机器人新范式; 2. 负责视觉语言大模型(VLA)相关算法的设计、实现与优化,提升模型的环境感知、决策规划能力; 3. 探索如何利用VLA增强机器人的泛化能力及人机交互的自然性; 4. 参与相关数据集的构建、处理以及模型在真实场景中的部署与测试。 5.跟踪VLA及相关领域(多模态学习、大模型等)的前沿技术动态。 6. 发表高水平论文至国际顶会顶刊,参加相关领域的国内外顶级学术会议。 【课题名称】 具身基座VLA大模型预研 【课题内容】 探索如何利用VLA与Foundation Model技术提升机器人的环境理解、任务规划与泛化执行能力,构建面向未来的通用智能体。

更新于 2025-06-26
logo of mi
校招

1.参与具身智能算法模型在技能学习、动作规划、抓取操作等应用上的研发,实现多场景多任务的泛化; 2.设计、训练、部署模仿学习、强化学习、迁移学习、多模态学习等算法,构建机器人各类应用的通用技能; 3.与大模型、运控等团队合作,推动具身智能数据集、机器人平台等各项目落地实施; 4.紧跟最新技术进展,将学术界前沿创新内容进行快速复现并创新,参与相关方向的论文与专利积累。 【课题名称】 机器人具身智能算法研究 【课题内容】 追踪当下前沿机器人具身智能算法,复现并创新。

更新于 2025-06-26
logo of mi
校招

1、参与具身智能算法模型在技能学习、动作规划、抓取操作等应用上的研发,实现多场景多任务的泛化; 2、设计、训练、部署模仿学习、强化学习、迁移学习、多模态学习等算法,构建机器人各类应用的通用技能; 3、与大模型、运控等团队合作,推动具身智能数据集、机器人平台等各项目落地实施; 4、紧跟最新技术进展,将学术界前沿创新内容进行快速复现并创新,参与相关方向的论文与专利积累。

更新于 2025-06-23
logo of mi
校招

1. 研究和实现基于多种技术路线的高真实性传感器仿真模型开发; 2. 研究和实现基于多种技术路线的高真实性交通流仿真模型开发; 3. 研究和实现端到端的闭环仿真系统开发。 【课题名称】 高真实性端到端仿真系统开发 【课题内容】 基于多种技术路线,实现高真实性,端到端的模拟仿真系统,支持自动驾驶、具身智能的算法开发和验证。

更新于 2025-06-26