小米具身智能算法工程师-模型

社招全职A1052412026-04-09地点：北京状态：招聘

扫码手机上打开

任职要求

1. 计算机、人工智能、自动化、机器人等相关专业，硕士及以上学历（博士优先）；
2. 具备扎实的深度学习理论基础，熟练掌握 PyTorch 等主流框架，有大模型训练与调优经验者优先；
3. 熟悉Gr00t和PI等系列经典VLA操作模型相关工作，对 VLM 与机器人控制的结合有深入理解；
4. 了解强化学习基…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1. 负责面向机器人操作任务的端到端模型研发，探索 Vision-Language-Action（VLA）模型在灵巧操作、长序列任务规划中的应用，推动通用操作策略的落地；
2. 开展 World Model 相关研究，构建面向机器人操作的环境预测与动态建模能力，提升策略的泛化性和样本效率；
3. 研究基于强化学习的高自由度灵巧手控制方法，包括 PPO、SAC、IQL等主流 RL 方法，探索仿真到真实的 Sim-to-Real 迁移技术；
4. 负责大规模模型的训练基础设施搭建与优化，包括分布式训练、混合精度、推理加速及部署上线；
5. 持续跟踪具身智能、操作学习、基础模型等领域的前沿进展，推动技术复现、改进与工程化落地。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

深度学习+

PyTorch+

大模型+

强化学习+

还有更多 •••

登录查看完整学习资料

相关职位

蚂蚁集团-算法工程师-具身智能方向

社招3年以上技术类-算法

1. 路径规划 ‒ 开发适用于多种场景（如机器人导航、自动驾驶、无人机等）的路径规划算法； ‒ 实现经典和前沿的全局及局部路径规划方法（如 A*、Dijkstra、RRT、DWA 等），优化路径规划的效率和鲁棒性； ‒ 处理动态环境中的路径生成和调整，解决复杂场景下的避障问题。 2. 行动决策 ‒ 研究并实现具身智能体的行动决策算法，设计任务分解和行为选择的逻辑； ‒ 基于行为树（Behavior Tree）、有限状态机（FSM）等方法，构建模块化的决策框架； ‒ 开发多智能体协作与竞争的行动决策模型，支持复杂交互任务的执行。 3. 强化学习（Reinforcement Learning，RL） ‒ 针对具身智能场景（如机械臂控制、机器人动态避障、导航等），设计强化学习的 reward 函数和训练策略； ‒ 实现主流深度强化学习算法（如 DQN、DDPG、PPO、SAC 等），解决高维连续控制与探索问题； ‒ 优化强化学习模型的收敛速度和鲁棒性，提升算法在实际场景中的表现。 4. 模仿学习（Imitation Learning，IL） ‒ 通过专家示范数据（如轨迹、动作序列）训练智能体，实现模仿人类/智能体行为； ‒ 应用行为克隆（Behavior Cloning, BC）、逆强化学习（Inverse Reinforcement Learning, IRL）等技术解决稀疏奖励问题； ‒ 结合模仿学习与强化学习，提升智能体在复杂任务中的学习和泛化能力。 5. 算法优化与工程实现 ‒ 优化算法的计算效率和资源占用，适配实时性要求；‒ 在仿真环境（如 Gazebo、PyBullet、Mujoco 等）和真实设备中验证算法性能； ‒ 配合嵌入式团队完成算法在终端设备上的部署与优化。 6. 技术研究与创新 ‒ 跟踪具身智能领域的前沿算法进展，探索新技术的实际应用； ‒ 研究多模态感知与决策（如视觉、语音、触觉）的融合方法，提升智能体的环境理解与行动能力； ‒ 参与长期自主学习、在线学习和自适应学习系统的设计与开发。

更新于 2026-01-14上海

具身智能算法工程师（工程机械智能化）

社招3-5年网易伏羲

1、负责机器人多模态大模型（VLA模型）的工程化落地，包括预训练开发、模型微调、训练优化以及实际效果调优； 2、参与基于大模型的机器决策控制工程化工作，包括训练框架搭建、数据集处理、算力部署，以及在真机上的部署与测试； 3、优化大模型的训练效率以及资源利用率，熟练运用诸如模型并行、Flash Attention、LoRA等技术； 4、负责云端数据处理以及分布式训练落地，优化大模型的多模态任务处理能力； 5、跟进多模态大模型与具身智能的前沿应用进展，负责模型在机器人场景的部署与技术转化。

更新于 2025-11-13杭州

具身智能算法工程师

社招5年以上算法开发岗

1. 开发并优化货架容器 2D/3D 识别、定位与姿态估计算法，输出高鲁棒抓取位姿。 2. 机械臂运动学/动力学建模及逆解求解；轨迹规划与实时优化算法，抓取策略及柔顺控制算法开发。 3. 研发手眼标定、闭环视觉伺服与多传感器融合算法。 4. 引入并部署基于Autoregressive/Diffusion Models/VLA的端到端具身智能模型（如 RT series、π0、octo）。 5. 探索 Diffusion Policy、Imitation Learning、Reinforcement Learning等前沿方法，实现从视觉到动作的自监督或弱监督学习。 6. 搭建大规模数据采集、自动标注和自回放管线（Data Flywheel），持续迭代模型并进行线上 A/B 性能监控。 7. 与运动控制、系统集成团队密切协作，完成算法量化部署、边缘推理加速及实时监控告警。

更新于 2025-06-09北京

机器人算法工程师（精英实习）

实习人工智能

该岗位分3个方向，请同学们仔细阅读岗位JD，选择适合自己的方向进行投递。【机器人算法工程师】（规划&控制方向）职位描述： 1、负责机器人运动学、动力学建模，并实现机器人运动或者路径规划，运动控制等算法； 2、有机器人导航，机械手臂抓取，液压控制等相关机器人项目经验； 3、对接硬件、产品等职能同事，实现机器人整体功能的实现和调试； 4、负责算法的优化、移植和产品化。【机器人算法工程师】（感知&建模方向）职位描述： 1、负责工程机械智能化场景中基于深度学习激光雷达点云的3D目标检测、分割、跟踪等算法的研发及迭代优化； 2、参与工程机械智能化项目中的感知研发，开发并优化适用于复杂工况（如施工场景、恶劣天气条件）的点云处理和感知算法。 3、推动感知算法在工程机械智能化产品中的落地与优化提升，确保算法的高效运行和实时性； 4、结合工程机械的实际需求，对激光雷达点云数据进行预处理、特征提取和分析，为后续的感知任务提供高质量的数据支持； 5、参与多传感器融合算法的研发，探索激光雷达与其他传感器（如摄像头、IMU等）的协同工作模式，提高工程机械的环境感知能力； 6、跟踪和研究点云感知领域的最新技术动态，将其应用到实际项目中，保持公司技术的领先性。【机器人算法工程师】（具身智能方向）职位描述： 1、深入研究机器人多模态大模型（VLA模型）的理论及应用，包括预训练、微调策略、以及效果优化； 2、负责基于大模型的决策控制算法设计，探索前沿模仿学习（如 ACT、DP）及 Model-Based RL 算法在机器人上的研究与创新； 3、基于大模型开发创新算法框架，探索具身智能机器人实际场景中的应用方向，如 RT 系列等； 4、负责最新文献调研，跟踪多模态模型与机器人领域结合的技术前沿，提出具有创新性的研究思路； 5、参与并主导自定义数据集构建、特定任务的模型训练与评估； 6、推动具身智能系统算法在复杂场景下的理论研究，探索工程机械场景智能化解决方案。

杭州