
商汤机器人强化学习控制算法工程师
社招全职算法工程地点:北京 | 杭州 | 上海 | 深圳状态:招聘
任职要求
1. 计算机科学、人工智能、机械工程、软件工程等相关专业背景 2. 熟练掌握python/C++等编程语言 3. 熟悉主流强化学习算法:PPO/SAC/DQN等 4. 熟练掌握python/C++等主流编程语言 5. 熟练掌握PyTorch/…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1. 研发基于强化学习算法的机器人灵巧操作能力 2. 负责强化学习相关的软件基础平台建设 3. 与控制工程师紧密合作,参与强化学习算法的部署和调试工作 4. 持续跟踪业界最新进展,编写相关技术文档
包括英文材料
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
C+++
https://www.learncpp.com/
LearnCpp.com is a free website devoted to teaching you how to program in modern C++.
https://www.youtube.com/watch?v=ZzaPdXTrSb8
强化学习+
https://cloud.google.com/discover/what-is-reinforcement-learning?hl=en
Reinforcement learning (RL) is a type of machine learning where an "agent" learns optimal behavior through interaction with its environment.
https://huggingface.co/learn/deep-rl-course/unit0/introduction
This course will teach you about Deep Reinforcement Learning from beginner to expert. It’s completely free and open-source!
https://www.kaggle.com/learn/intro-to-game-ai-and-reinforcement-learning
Build your own video game bots, using classic and cutting-edge algorithms.
还有更多 •••
相关职位
实习
1. 开发基于强化/模仿学习的机器人行走及全身控制策略; 2. 开发复杂地形下基于视觉的强化学习行走策略; 3. 负责算法策略的训练与移植部署,实现算法sim-to-real在机器人实机上落地应用; 4. 持续跟踪国内外前沿研究成果,并进行相关算法复现; 5. 编写相关技术文档,推动团队技术沉淀与知识共享。
更新于 2025-08-20北京
校招
1. 研发适用于足式机器人决策规划的深度强化学习算法; 2. 负责强化学习规划控制算法的sim2real开发; 3. 负责深度强化学习算法的模型开发、调试与实际机器人验证。
更新于 2025-08-14上海

社招算法工程
1. 负责搭建和部署人形机器人控制框架 2. 负责柔性控制、全身控制等相关功能研发 3. 参与机器人轨迹优化方面的相关工作 4. 根据业务要求定义并维护机器人控制框架 5. 开发数据可视化、控制器评测等相关工具链 6. 编写相关技术文档
更新于 2025-12-04北京|杭州|上海

社招算法研究
1. 运动控制框架搭建:负责机器人机械臂运动控制算法的研发与实现,构建完整的轨迹规划、运动学与动力学控制框架。 2. 路径规划与避障:设计机械臂在家庭环境中的运动路径规划与避障策略,确保其在复杂场景中安全、平稳运行。 3. 经典控制实现:运用传统控制方法(如PID、力/阻抗控制)实现关节控制与力反馈调节,提升机械臂操作稳定性。 4. 智能学习控制:引入模仿学习与强化学习技术,开发机械臂的复杂操作技能,并通过人类示教或模拟自学习,逐步掌握高难度的动作,并训练持续优化。 5. 仿真训练与实物验证:搭建仿真测试环境(如Gazebo、PyBullet),进行算法验证与迭代,并完成实物部署与调试。 6. 系统集成协作:与视觉、软件等团队协作,集成视觉引导、ROS2系统等功能,确保控制模块与整体系统高效协同。
更新于 2025-11-03北京