logo of aligenie

智能互联高德-具身通用运控算法工程师(强化学习方向)-具身业务部

社招全职3年以上技术类-算法地点:北京状态:招聘

任职要求


● 计算机、控制理论、机器人学、机械电子或相关专业硕士及以上学历,5年以上运动控制领域研发经验;
● 系统掌握 Sim2Real 技术栈,包括域随机化、Sim2Sim 迁移、运动跟踪等关键技术;
● 精通主流深度强化学习算法(如 PPO、SAC、DDPG、MAPPO),具备在 Isaac Gym / Isaac Sim 等平台进行大规模并行训练的实战经验,熟悉策略蒸馏、课程学习等进阶方法;
● 熟练设计…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


负责下一代机器人通用运动控制器的研发与工程落地,具体包括:
● 研发支持多模态指令的通用运动控制算法,实现对任意自然动作指令的高保真执行;
● 设计并实现面向复杂地形与动态环境的自适应运动策略,显著提升机器人的稳定性、鲁棒性与环境适应能力;
● 搭建高保真仿真环境,开展强化学习算法的大规模训练与验证,通过实验分析持续迭代优化控制策略;
● 与上游动作预测与意图理解算法紧密协作,构建支持自主交互的运动控制能力。
包括英文材料
学历+
强化学习+
算法+
Gymnasium+
还有更多 •••
相关职位

logo of amap
社招3年以上技术类-算法

研发下一代机器人通用运动控制器的研发与落地:基于强化学习突破复杂地形自适应运动、多运动模态平滑切换、sim2real策略部署等关键技术,构建面向真实物理系统的运动策略训练框架,提升运动保真度与鲁棒性。

更新于 2026-03-25北京
logo of amap
社招3年以上技术类-算法

负责下一代机器人通用运动控制器的研发与工程落地,具体包括: ● 研发支持多模态指令的通用运动控制算法,实现对任意自然动作指令的高保真执行; ● 设计并实现面向复杂地形与动态环境的自适应运动策略,显著提升机器人的稳定性、鲁棒性与环境适应能力; ● 搭建高保真仿真环境,开展强化学习算法的大规模训练与验证,通过实验分析持续迭代优化控制策略; ● 与上游动作预测与意图理解算法紧密协作,构建支持自主交互的运动控制能力。

更新于 2025-12-15北京
logo of aligenie
社招3年以上技术类-算法

研发下一代机器人通用运动控制器的研发与落地:基于强化学习突破复杂地形自适应运动、多运动模态平滑切换、sim2real策略部署等关键技术,构建面向真实物理系统的运动策略训练框架,提升运动保真度与鲁棒性。

更新于 2026-04-08北京
logo of xiaohongshu
社招3年以上机器学习平台

【业务介绍】 我们是小红书内稠密类模型(LLM/MLLM/SD/CV/NLP)统一的AI平台QuickSilver,负责调度公司内所有稠密类模型训练与推理资源,基于自建的训推引擎,为公司所有AI算法同学迭代业务模型提供端到端一站式AI服务;包括数据管理,模型管理,模型训练、压缩、推理、部署,服务管理,资源调度等一系列能力。 工作职责: 1、负责稠密类模型训练推理开发平台的架构设计和核心功能研发 2、设计和实现大模型训练部署流程,包括模型fine-tuning、推理服务化等 3、构建云原生架构,设计高可用、高性能的微服务体系 4、优化平台性能,提升系统稳定性和可扩展性

北京|上海|深圳