京东运动控制算法工程师（RL & Simulation）

社招全职3年以上算法开发岗2025-08-18地点：北京状态：招聘

扫码手机上打开

任职要求

1. 计算机、自动化、机器人等相关专业本科及以上学历，3 年以上运动控制 / 强化学习项目经验。
2. 扎实掌握机器人运动学、动力学与控制理论，熟悉 MPC / LQR / 优化控制。
3. 精通至少一种深度强化…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1. 建立并优化机械臂 / 移动底盘运动学-动力学模型，设计模型预测控制（MPC）与轨迹跟踪算法。
2. 基于深度强化学习（SAC、PPO 等）开发高鲁棒、自适应运动控制策略，支持力/位混合控制。
3. 构建 Gazebo / Isaac / MuJoCo 等高保真仿真环境，实施随机化与 Curriculum Learning，提升 Sim2Real 迁移效率。
4. 研发离线 RL、模仿学习与安全约束 RL 流程，缩短策略收敛时间并保障操作安全。
5. 搭建示教 & 回放数据飞轮，持续监控线上控制性能并执行 A/B 测试。
6. 与系统集成、边缘计算团队协作，完成控制算法量化部署、实时推理加速及低时延通讯优化。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

强化学习+

算法+

还有更多 •••

登录查看完整学习资料

相关职位

机器人算法工程师（精英实习）

实习人工智能

该岗位分3个方向，请同学们仔细阅读岗位JD，选择适合自己的方向进行投递。【机器人算法工程师】（规划&控制方向）职位描述： 1、负责机器人运动学、动力学建模，并实现机器人运动或者路径规划，运动控制等算法； 2、有机器人导航，机械手臂抓取，液压控制等相关机器人项目经验； 3、对接硬件、产品等职能同事，实现机器人整体功能的实现和调试； 4、负责算法的优化、移植和产品化。【机器人算法工程师】（感知&建模方向）职位描述： 1、负责工程机械智能化场景中基于深度学习激光雷达点云的3D目标检测、分割、跟踪等算法的研发及迭代优化； 2、参与工程机械智能化项目中的感知研发，开发并优化适用于复杂工况（如施工场景、恶劣天气条件）的点云处理和感知算法。 3、推动感知算法在工程机械智能化产品中的落地与优化提升，确保算法的高效运行和实时性； 4、结合工程机械的实际需求，对激光雷达点云数据进行预处理、特征提取和分析，为后续的感知任务提供高质量的数据支持； 5、参与多传感器融合算法的研发，探索激光雷达与其他传感器（如摄像头、IMU等）的协同工作模式，提高工程机械的环境感知能力； 6、跟踪和研究点云感知领域的最新技术动态，将其应用到实际项目中，保持公司技术的领先性。【机器人算法工程师】（具身智能方向）职位描述： 1、深入研究机器人多模态大模型（VLA模型）的理论及应用，包括预训练、微调策略、以及效果优化； 2、负责基于大模型的决策控制算法设计，探索前沿模仿学习（如 ACT、DP）及 Model-Based RL 算法在机器人上的研究与创新； 3、基于大模型开发创新算法框架，探索具身智能机器人实际场景中的应用方向，如 RT 系列等； 4、负责最新文献调研，跟踪多模态模型与机器人领域结合的技术前沿，提出具有创新性的研究思路； 5、参与并主导自定义数据集构建、特定任务的模型训练与评估； 6、推动具身智能系统算法在复杂场景下的理论研究，探索工程机械场景智能化解决方案。

杭州

RLHF强化学习算法工程师

社招3年以上

我们致力于推动强化学习（Reinforcement Learning, RL）在人形机器人运动控制、大语言模型推理优化、和具身智能体（Embodied AI）领域的突破性应用。现招募具备深厚RL技术背景的算法工程师，参与从算法设计、仿真训练到真实场景部署的全链路研发，探索AI与物理世界的深度融合。 1. 研究大语言模型RLHF阶段的广义强化算法，提升大模型的能力，探索大模型的自我进化之路； 2. 研究大模型驱动的智能体算法，包括但是不局限于ReACT、Voyager、WebGPT、AutoGPT； 3. 撰写技术报告和论文，分享研究成果，参与内外部的技术交流和合作，推动团队技术水平的提升，提高团队在行业内的影响力。

更新于 2025-03-04上海|深圳

大语言模型RLHF算法工程师

实习

更新于 2025-04-28深圳|北京|上海

【25届校招】RLHF强化学习算法工程师

校招

更新于 2025-04-28深圳