logo of jd

京东运动控制算法工程师(RL & Simulation)

社招全职3年以上算法开发岗地点:北京状态:招聘

任职要求


1. 计算机、自动化、机器人等相关专业本科及以上学历,3 年以上运动控制 / 强化学习项目经验。
2. 扎实掌握机器人运动学、动力学与控制理论,熟悉 MPC / LQR / 优化控制。
3. 精通至少一种深度强化…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 建立并优化机械臂 / 移动底盘运动学-动力学模型,设计模型预测控制(MPC)与轨迹跟踪算法。
2. 基于深度强化学习(SAC、PPO 等)开发高鲁棒、自适应运动控制策略,支持力/位混合控制。
3. 构建 Gazebo / Isaac / MuJoCo 等高保真仿真环境,实施随机化与 Curriculum Learning,提升 Sim2Real 迁移效率。
4. 研发离线 RL、模仿学习与安全约束 RL 流程,缩短策略收敛时间并保障操作安全。
5. 搭建示教 & 回放数据飞轮,持续监控线上控制性能并执行 A/B 测试。
6. 与系统集成、边缘计算团队协作,完成控制算法量化部署、实时推理加速及低时延通讯优化。
包括英文材料
学历+
强化学习+
算法+
还有更多 •••
相关职位

logo of netease
实习人工智能

该岗位分3个方向,请同学们仔细阅读岗位JD,选择适合自己的方向进行投递。 【机器人算法工程师】(规划&控制方向) 职位描述: 1、负责机器人运动学、动力学建模,并实现机器人运动或者路径规划,运动控制等算法; 2、有机器人导航, 机械手臂抓取, 液压控制等相关机器人项目经验; 3、对接硬件、产品等职能同事,实现机器人整体功能的实现和调试; 4、负责算法的优化、移植和产品化。 【机器人算法工程师】(感知&建模方向) 职位描述: 1、负责工程机械智能化场景中基于深度学习激光雷达点云的3D目标检测、分割、跟踪等算法的研发及迭代优化; 2、参与工程机械智能化项目中的感知研发,开发并优化适用于复杂工况(如施工场景、恶劣天气条件)的点云处理和感知算法。 3、推动感知算法在工程机械智能化产品中的落地与优化提升,确保算法的高效运行和实时性; 4、结合工程机械的实际需求,对激光雷达点云数据进行预处理、特征提取和分析,为后续的感知任务提供高质量的数据支持; 5、参与多传感器融合算法的研发,探索激光雷达与其他传感器(如摄像头、IMU等)的协同工作模式,提高工程机械的环境感知能力; 6、跟踪和研究点云感知领域的最新技术动态,将其应用到实际项目中,保持公司技术的领先性。 【机器人算法工程师】(具身智能方向) 职位描述: 1、深入研究机器人多模态大模型(VLA模型)的理论及应用,包括预训练、微调策略、以及效果优化; 2、负责基于大模型的决策控制算法设计,探索前沿模仿学习(如 ACT、DP)及 Model-Based RL 算法在机器人上的研究与创新; 3、基于大模型开发创新算法框架,探索具身智能机器人实际场景中的应用方向,如 RT 系列等; 4、负责最新文献调研,跟踪多模态模型与机器人领域结合的技术前沿,提出具有创新性的研究思路; 5、参与并主导自定义数据集构建、特定任务的模型训练与评估; 6、推动具身智能系统算法在复杂场景下的理论研究,探索工程机械场景智能化解决方案。

杭州
logo of antgroup
校招蚂蚁星计划 -

1.负责具身智能的核心算法研发,聚焦强化学习(RL)与模仿学习(IL)技术,推动智能体在复杂物理环境中的感知、决策与行动能力; 2.设计并实现基于强化学习的端到端训练框架,解决稀疏奖励、多任务学习、长周期规划等挑战性问题; 3.开发高效的模仿学习算法,结合人类示范数据与自主探索策略,提升智能体在真实场景中的泛化性与安全性; 4.针对机器人控制、多模态感知-动作闭环等场景,优化算法在计算效率、实时性与鲁棒性方面的表现; 5.与硬件、仿真团队紧密协作,推动算法在实体机器人或虚拟环境中的部署与验证。

上海
logo of xpeng
社招

1. 基于Isaac Gym/MuJoCo搭建高保真仿真环境,优化人形机器人运动控制RL训练的并行效率与物理精度; 2. 开发3DGS/NeRF等动态场景渲染管线,支持视觉-动力学联合仿真(sim2real迁移); 3. 构建生成式世界模型驱动的仿真系统,实现动态场景自动生成与自适应难度调控; 4. 设计分布式仿真架构,支持万级机器人实例的实时交互与数据采集。

更新于 2025-04-28上海|深圳
logo of xpeng
社招

1,算法开发与优化: 负责自动驾驶模型算法的研发设计,包括但不限于行为决策、轨迹生成、运动规划等模块的深度学习/强化学习模型设计 探索基于Transformer、模仿学习(Imitation Learning)、强化学习(RL)等前沿技术的模型算法设计、应用方案 优化自动驾驶算法的实时性、安全性和舒适性,解决复杂场景(如拥堵、交互博弈、长尾问题)下的规划挑战 2,数据驱动迭代: 构建和利用大规模驾驶数据集(仿真+真实数据),设计数据闭环 pipeline 提升规划性能 参与数据标注、场景挖掘、仿真测试等环节,推动算法迭代 3,系统集成与部署: 与感知、控制等模块团队协作,实现模型算法在车载计算平台的部署 支持实车测试,分析问题并提出改进方案。 4,前沿技术跟踪: 跟进学术界(如CVPR、ICRA、CoRL)和工业界最新进展,将创新技术落地到量产或研发项目中

更新于 2025-06-30上海|广州|深圳