logo of sensetime

商汤机器人强化学习控制算法工程师

社招全职算法工程地点:北京 | 杭州 | 上海 | 深圳状态:招聘

任职要求


1. 计算机科学、人工智能、机械工程、软件工程等相关专业背景
2. 熟练掌握python/C++等编程语言
3. 熟悉主流强化学习算法:PPO/SAC/DQN等
4. 熟练掌握python/C++等主流编程语言
5. 熟练掌握PyTorch/…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 研发基于强化学习算法的机器人灵巧操作能力
2. 负责强化学习相关的软件基础平台建设
3. 与控制工程师紧密合作,参与强化学习算法的部署和调试工作
4. 持续跟踪业界最新进展,编写相关技术文档
包括英文材料
Python+
C+++
强化学习+
还有更多 •••
相关职位

logo of jd
社招算法开发岗

【工作职责】
 1)研发高鲁棒性的多模态导航算法架构,融合激光雷达/视觉/惯导等多传感器信息,构建动态环境认知与语义理解模型,开发自适应不同场景的导航策略框架。 2)优化实时运动控制系统:设计低延迟的路径规划与轨迹优化算法,研发动态避障与紧急制动机制,实现厘米级精度的运动控制。 3)构建智能决策系统:开发适应场景理解与行为预测的决策模块,实现复杂场景下的长期自主导航。 4)算法工程化落地:完成嵌入式平台移植与性能优化,设计系统级仿真验证方案,搭建全场景自动化测试体系。

更新于 2025-04-16北京
logo of antgroup
社招3年以上技术类-算法

1. 负责具身智能系统的伺服控制算法设计与开发,包括位置、速度、力矩控制等; 2. 结合动力学建模与传感器反馈,优化高精度、低延迟的实时控制算法; 3. 研究并实现自适应控制、鲁棒控制、模型预测控制(MPC)等先进算法,提升系统动态响应与抗干扰能力; 4. 与硬件团队协作,完成控制算法在嵌入式平台(如DSP、FPGA、ROS等)的部署与性能调优; 5. 设计仿真与实验验证方案,分析系统性能并持续优化算法; 6. 跟踪前沿技术(如强化学习、仿生控制、多模态感知融合等),探索其在伺服控制中的应用。

更新于 2025-09-10上海
logo of antgroup
社招3年以上技术类-算法

1. 路径规划 ‒ 开发适用于多种场景(如机器人导航、自动驾驶、无人机等)的路径规划算法; ‒ 实现经典和前沿的全局及局部路径规划方法(如 A*、Dijkstra、RRT、DWA 等),优化路径规划的效率和鲁棒性; ‒ 处理动态环境中的路径生成和调整,解决复杂场景下的避障问题。 2. 行动决策 ‒ 研究并实现具身智能体的行动决策算法,设计任务分解和行为选择的逻辑; ‒ 基于行为树(Behavior Tree)、有限状态机(FSM)等方法,构建模块化的决策框架; ‒ 开发多智能体协作与竞争的行动决策模型,支持复杂交互任务的执行。 3. 强化学习(Reinforcement Learning,RL) ‒ 针对具身智能场景(如机械臂控制、机器人动态避障、导航等),设计强化学习的 reward 函数和训练策略; ‒ 实现主流深度强化学习算法(如 DQN、DDPG、PPO、SAC 等),解决高维连续控制与探索问题; ‒ 优化强化学习模型的收敛速度和鲁棒性,提升算法在实际场景中的表现。 4. 模仿学习(Imitation Learning,IL) ‒ 通过专家示范数据(如轨迹、动作序列)训练智能体,实现模仿人类/智能体行为; ‒ 应用行为克隆(Behavior Cloning, BC)、逆强化学习(Inverse Reinforcement Learning, IRL)等技术解决稀疏奖励问题; ‒ 结合模仿学习与强化学习,提升智能体在复杂任务中的学习和泛化能力。 5. 算法优化与工程实现 ‒ 优化算法的计算效率和资源占用,适配实时性要求 ;‒ 在仿真环境(如 Gazebo、PyBullet、Mujoco 等)和真实设备中验证算法性能; ‒ 配合嵌入式团队完成算法在终端设备上的部署与优化。 6. 技术研究与创新 ‒ 跟踪具身智能领域的前沿算法进展,探索新技术的实际应用; ‒ 研究多模态感知与决策(如视觉、语音、触觉)的融合方法,提升智能体的环境理解与行动能力; ‒ 参与长期自主学习、在线学习和自适应学习系统的设计与开发。

更新于 2026-01-14上海
logo of netease
社招3-5年网易伏羲

1、负责机器人多模态大模型(VLA模型)的工程化落地,包括预训练开发、模型微调、训练优化以及实际效果调优; 2、参与基于大模型的机器决策控制工程化工作,包括训练框架搭建、数据集处理、算力部署,以及在真机上的部署与测试; 3、优化大模型的训练效率以及资源利用率,熟练运用诸如模型并行、Flash Attention、LoRA等技术; 4、负责云端数据处理以及分布式训练落地,优化大模型的多模态任务处理能力; 5、跟进多模态大模型与具身智能的前沿应用进展,负责模型在机器人场景的部署与技术转化。

更新于 2025-11-13杭州