logo of mi

小米顶尖应届--机器人强化学习算法研究员-机器人事业部

校招全职地点:北京状态:招聘

任职要求


1. 硕士及以上学历,机器人、计算机、人工智能、机器学习、应用数学等专业,理论功底深厚,有相关足式机器人传统控制经验更优; 
2. 具有强化学习相关项目研究经验,熟悉Mujoco、Pybullet、Isaac Sim/Gym等机器人仿真平台,熟悉LinuxROS等操作系统;
3. 掌握主流强化学习算法如DQN、PPO、DDPG、SAC等主流算法,熟悉PytorchTensorFlow机器学习框架;
4. 扎实的C++Python编程能力;
5. 数学基础扎实,具有较强的学习与研究能力,熟悉大模型理论者优先。

工作职责


1. 开发基于机器学习的机器人控制策略,完成机器人端对端的算法训练与部署; 
2. 负责算法策略的训练与移植部署,实现算法sim2real在机器人实机上落地应用; 
3. 持续跟踪国内外前沿研究成果,并进行相关算法复现,参与相关方向的论文与专利积累。

【课题名称】
机器人强化学习算法研究
【课题内容】
追踪当下前沿机器人强化学习算法,复现并创新。
包括英文材料
学历+
机器学习+
强化学习+
Linux+
ROS+
算法+
PyTorch+
TensorFlow+
C+++
Python+
大模型+
相关职位

logo of mi
校招

1.参与具身智能算法模型在技能学习、动作规划、抓取操作等应用上的研发,实现多场景多任务的泛化; 2.设计、训练、部署模仿学习、强化学习、迁移学习、多模态学习等算法,构建机器人各类应用的通用技能; 3.与大模型、运控等团队合作,推动具身智能数据集、机器人平台等各项目落地实施; 4.紧跟最新技术进展,将学术界前沿创新内容进行快速复现并创新,参与相关方向的论文与专利积累。 【课题名称】 机器人具身智能算法研究 【课题内容】 追踪当下前沿机器人具身智能算法,复现并创新。

更新于 2025-06-26
logo of mi
校招

1.负责多自由度灵巧手的控制算法开发,具体应用包括功能性抓取和手内操作; 2.基于人类数据的VLA/VLM多模态大模型训练及微调; 3.开展结合视觉,触觉和关节力的多模态灵巧手控制方法研究,能对硬件设计提出相关指标性要求; 4.灵巧手相关的仿真平台和数据采集训练平台的搭建。 【课题名称】 多自由度灵巧手控制算法开发 【课题内容】 跟踪技术前沿,进行多自由度灵巧手的控制算法开发预研。

更新于 2025-06-26
logo of mi
校招

1. 研究并实现适用于自动驾驶场景的强化学习/模仿学习/混合学习策略; 2. 推动策略优化算法在实车数据和仿真数据间的迁移落地; 3. 联合量产团队完成RL策略在真实驾驶系统中的部署与评估。 【课题名称】 基于强化学习的E2E Planning 【课题内容】 致力于通过强化学习范式建立从视觉输入到控制输出的直接路径,强调在长期决策、稀疏奖励、环境反馈闭环中建模agent的真实驾驶行为。探索强化学习在自动驾驶E2E系统中的策略稳定性、泛化性与数据效率。

更新于 2025-06-26
logo of mi
校招

1. 研究并实现适用于自动驾驶场景的强化学习/模仿学习/混合学习策略; 2. 推动策略优化算法在实车数据和仿真数据间的迁移落地; 3. 联合量产团队完成RL策略在真实驾驶系统中的部署与评估。 【课题名称】 基于强化学习的E2E Planning 【课题内容】 致力于通过强化学习范式建立从视觉输入到控制输出的直接路径,强调在长期决策、稀疏奖励、环境反馈闭环中建模agent的真实驾驶行为。探索强化学习在自动驾驶E2E系统中的策略稳定性、泛化性与数据效率。

更新于 2025-06-26