高德地图高德-具身通用运控算法工程师(强化学习方向)-具身业务部
社招全职3年以上技术类-算法地点:北京状态:招聘
任职要求
● 计算机、控制理论、机器人学、机械电子或相关专业硕士及以上学历,5年以上运动控制领域研发经验; ● 系统掌握 Sim2Real 技术栈,包括域随机化、Sim2Sim 迁移、运动跟踪等关键技术; ● 精通主流深度强化学习算法(如 PPO、SAC、DDPG、MAPPO),具备在 Isaac Gym / Isaac Sim 等平台进行大规模并行训练的实战经验,熟悉策略蒸馏、课程学习等进阶方法; ● 熟练设计…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
负责下一代机器人通用运动控制器的研发与工程落地,具体包括: ● 研发支持多模态指令的通用运动控制算法,实现对任意自然动作指令的高保真执行; ● 设计并实现面向复杂地形与动态环境的自适应运动策略,显著提升机器人的稳定性、鲁棒性与环境适应能力; ● 搭建高保真仿真环境,开展强化学习算法的大规模训练与验证,通过实验分析持续迭代优化控制策略; ● 与上游动作预测与意图理解算法紧密协作,构建支持自主交互的运动控制能力。
包括英文材料
学历+
强化学习+
https://cloud.google.com/discover/what-is-reinforcement-learning?hl=en
Reinforcement learning (RL) is a type of machine learning where an "agent" learns optimal behavior through interaction with its environment.
https://huggingface.co/learn/deep-rl-course/unit0/introduction
This course will teach you about Deep Reinforcement Learning from beginner to expert. It’s completely free and open-source!
https://www.kaggle.com/learn/intro-to-game-ai-and-reinforcement-learning
Build your own video game bots, using classic and cutting-edge algorithms.
算法+
https://roadmap.sh/datastructures-and-algorithms
Step by step guide to learn Data Structures and Algorithms in 2025
https://www.hellointerview.com/learn/code
A visual guide to the most important patterns and approaches for the coding interview.
https://www.w3schools.com/dsa/
Gymnasium+
https://gymnasium.farama.org/index.html
An API standard for reinforcement learning with a diverse collection of reference environments
https://www.youtube.com/watch?v=FvuyrpzvwdI
Learn to use Gymnasium for Python, which allows you to create environments to run reinforcement learning programs against in Python.
还有更多 •••
相关职位
社招3年以上技术类-算法
研发下一代机器人通用运动控制器的研发与落地:基于强化学习突破复杂地形自适应运动、多运动模态平滑切换、sim2real策略部署等关键技术,构建面向真实物理系统的运动策略训练框架,提升运动保真度与鲁棒性。
更新于 2025-12-11北京
校招
1、参与具身智能算法模型在技能学习、动作规划、抓取操作等应用上的研发,实现多场景多任务的泛化; 2、设计、训练、部署模仿学习、强化学习、迁移学习、多模态学习等算法,构建机器人各类应用的通用技能; 3、与大模型、运控等团队合作,推动具身智能数据集、机器人平台等各项目落地实施; 4、紧跟最新技术进展,将学术界前沿创新内容进行快速复现并创新,参与相关方向的论文与专利积累。
更新于 2025-06-23北京
实习
1、参与具身智能算法模型在技能学习、动作规划、抓取操作等应用上的研发,实现多场景多任务的泛化; 2、设计、训练、部署模仿学习、强化学习、迁移学习、多模态学习等算法,构建机器人各类应用的通用技能; 3、与大模型、运控等团队合作,推动具身智能数据集、机器人平台等各项目落地实施; 4、紧跟最新技术进展,将学术界前沿创新内容进行快速复现并创新,参与相关方向的论文与专利积累。
更新于 2025-04-23北京