美团运控工程师-实习
实习兼职无人机业务部地点:深圳状态:招聘
任职要求
1. 机器人学、自动化、计算机、力学或相关专业硕士及以上学历; 2. 对机电系统有浓厚兴趣,能看懂电机选型参数表、驱动器手册与机械装配图,愿意动手参与联调,不满足于只在仿真层面工作; 3. 理解深度强化学习核心算法(PPO、SAC、TD3 等),能独立实现训练框架并针对 locomotion 任务进行系统性调优,对训练不稳定、策略退化、sim-to-real gap 等工程问题有丰富的排查经验; 4. 有 Isaac Gym / Isaac Lab、MuJoCo 或类似并行仿真平台的深度使用经验,能独立完成 URDF/MJCF 建模、仿真环境搭建与大规模并行…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1. 参与具身机器人下肢模块的运动控制系统研发,以强化学习为核心技术路线,从仿真训练到真机落地全链路负责,同时深度参与机电系统联调与硬件迭代; 2.基于深度强化学习(PPO、SAC 等)在 Isaac Gym / Isaac Lab / MuJoCo 等并行仿真环境中训练双足机器人行走策略,覆盖平地行走、启停、转向、抗扰动等基础运动能力,并持续提升运动自然度与鲁棒性; 3.参与 sim-to-real 迁移工作,通过 Domain Randomization、系统辨识、Teacher-Student(Privileged Learning)等方法缩小仿真与真机动力学差距,确保策略在真实硬件上稳定部署; 4. 设计奖励函数、课程学习方案与训练框架,具备从零搭建完整 RL 训练流水线的能力,对策略的样本效率、泛化性与运动质量负责; 5. 参与机电联调,能独立分析关节执行器的力矩-速度特性、驱动器 FOC 参数对控制效果的影响,从控制视角提出硬件改进建议,推动结构与电气方案迭代; 6. 参与构建高保真仿真模型,完成关节摩擦、电机动力学、接触刚度等参数的标定,缩短仿真与实机的差距;将训练好的策略部署至机载计算平台,完成推理加速与实时控制接口对接,保障策略稳定运行;
包括英文材料
学历+
强化学习+
https://cloud.google.com/discover/what-is-reinforcement-learning?hl=en
Reinforcement learning (RL) is a type of machine learning where an "agent" learns optimal behavior through interaction with its environment.
https://huggingface.co/learn/deep-rl-course/unit0/introduction
This course will teach you about Deep Reinforcement Learning from beginner to expert. It’s completely free and open-source!
https://www.kaggle.com/learn/intro-to-game-ai-and-reinforcement-learning
Build your own video game bots, using classic and cutting-edge algorithms.
算法+
https://roadmap.sh/datastructures-and-algorithms
Step by step guide to learn Data Structures and Algorithms in 2025
https://www.hellointerview.com/learn/code
A visual guide to the most important patterns and approaches for the coding interview.
https://www.w3schools.com/dsa/
还有更多 •••
相关职位
实习
1、调研机器人运动控制、具身智能等领域的前沿技术动态,整理并分析相关研究论文、技术报告及行业应用案例; 2、协助团队进行相关技术分析,包括但不限于机器人控制与规划中的机器学习方法,多模态大模型在机器人任务中的应用; 3、跟踪机器人在服务、消费等场景下的运动控制需求和能力,包括灵巧操作与抓取技术,全身运动与平衡控制,人机交互与任务规划等; 4、通过基础资料收集整理,支持前沿科技产品相关趋势和人群场景洞察;协助进行相关用户研究前期准备、研究执行、及相关材料撰写工作。
更新于 2025-07-14上海
实习
岗位描述: 参与开展机器人传动机构设计、结构设计工作; 参与传动机构的进行动力学仿真与尺度参数优化; 参与开展产品特定场景下相关试验; 协助进行研究报告、专利与成果文档撰写
更新于 2026-03-24北京
实习
1、参与具身智能算法模型在技能学习、动作规划、抓取操作等应用上的研发,实现多场景多任务的泛化; 2、设计、训练、部署模仿学习、强化学习、迁移学习、多模态学习等算法,构建机器人各类应用的通用技能; 3、与大模型、运控等团队合作,推动具身智能数据集、机器人平台等各项目落地实施; 4、紧跟最新技术进展,将学术界前沿创新内容进行快速复现并创新,参与相关方向的论文与专利积累。
更新于 2025-04-23北京