
智能互联高德-具身通用运控算法工程师(强化学习方向)-具身业务部
社招全职3年以上技术类-算法地点:北京状态:招聘
任职要求
● 计算机、控制理论、机器人学、机械电子或相关专业硕士及以上学历,5年以上运动控制领域研发经验; ● 系统掌握 Sim2Real 技术栈,包括域随机化、Sim2Sim 迁移、运动跟踪等关键技术; ● 精通主流深度强化学习算法(如 PPO、SAC、DDPG、MAPPO),具备在 Isaac Gym / Isaac Sim 等平台进行大规模并行训练的实战经验,熟悉策略蒸馏、课程学习等进阶方法; ● 熟练设计…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
负责下一代机器人通用运动控制器的研发与工程落地,具体包括: ● 研发支持多模态指令的通用运动控制算法,实现对任意自然动作指令的高保真执行; ● 设计并实现面向复杂地形与动态环境的自适应运动策略,显著提升机器人的稳定性、鲁棒性与环境适应能力; ● 搭建高保真仿真环境,开展强化学习算法的大规模训练与验证,通过实验分析持续迭代优化控制策略; ● 与上游动作预测与意图理解算法紧密协作,构建支持自主交互的运动控制能力。
包括英文材料
学历+
强化学习+
https://cloud.google.com/discover/what-is-reinforcement-learning?hl=en
Reinforcement learning (RL) is a type of machine learning where an "agent" learns optimal behavior through interaction with its environment.
https://huggingface.co/learn/deep-rl-course/unit0/introduction
This course will teach you about Deep Reinforcement Learning from beginner to expert. It’s completely free and open-source!
https://www.kaggle.com/learn/intro-to-game-ai-and-reinforcement-learning
Build your own video game bots, using classic and cutting-edge algorithms.
算法+
https://roadmap.sh/datastructures-and-algorithms
Step by step guide to learn Data Structures and Algorithms in 2025
https://www.hellointerview.com/learn/code
A visual guide to the most important patterns and approaches for the coding interview.
https://www.w3schools.com/dsa/
Gymnasium+
https://gymnasium.farama.org/index.html
An API standard for reinforcement learning with a diverse collection of reference environments
https://www.youtube.com/watch?v=FvuyrpzvwdI
Learn to use Gymnasium for Python, which allows you to create environments to run reinforcement learning programs against in Python.
还有更多 •••
相关职位
社招3年以上技术类-算法
研发下一代机器人通用运动控制器的研发与落地:基于强化学习突破复杂地形自适应运动、多运动模态平滑切换、sim2real策略部署等关键技术,构建面向真实物理系统的运动策略训练框架,提升运动保真度与鲁棒性。
更新于 2026-03-25北京
社招3年以上技术类-算法
负责下一代机器人通用运动控制器的研发与工程落地,具体包括: ● 研发支持多模态指令的通用运动控制算法,实现对任意自然动作指令的高保真执行; ● 设计并实现面向复杂地形与动态环境的自适应运动策略,显著提升机器人的稳定性、鲁棒性与环境适应能力; ● 搭建高保真仿真环境,开展强化学习算法的大规模训练与验证,通过实验分析持续迭代优化控制策略; ● 与上游动作预测与意图理解算法紧密协作,构建支持自主交互的运动控制能力。
更新于 2025-12-15北京

社招3年以上技术类-算法
研发下一代机器人通用运动控制器的研发与落地:基于强化学习突破复杂地形自适应运动、多运动模态平滑切换、sim2real策略部署等关键技术,构建面向真实物理系统的运动策略训练框架,提升运动保真度与鲁棒性。
更新于 2026-04-08北京
社招3年以上机器学习平台
【业务介绍】 我们是小红书内稠密类模型(LLM/MLLM/SD/CV/NLP)统一的AI平台QuickSilver,负责调度公司内所有稠密类模型训练与推理资源,基于自建的训推引擎,为公司所有AI算法同学迭代业务模型提供端到端一站式AI服务;包括数据管理,模型管理,模型训练、压缩、推理、部署,服务管理,资源调度等一系列能力。 工作职责: 1、负责稠密类模型训练推理开发平台的架构设计和核心功能研发 2、设计和实现大模型训练部署流程,包括模型fine-tuning、推理服务化等 3、构建云原生架构,设计高可用、高性能的微服务体系 4、优化平台性能,提升系统稳定性和可扩展性
北京|上海|深圳