logo of antgroup

蚂蚁金服蚂蚁集团-机器人强化学习算法工程师-具身智能方向

社招全职3年以上技术类-算法地点:上海状态:招聘

任职要求


1. 硕士及以上学位,专业为机器人学、计算机科学、自动化或相关领域。
2. 有机器学习算法开发经验,熟悉常见的强化学习方法如DQN、PPO、DPO等。
3. 有机械臂+灵巧手的模仿学习/强化学习项目经验,对主流的仿真器,isaac gym/sim,mujuco,bullet等熟悉
4. 具备良好的编程能力,熟悉PythonC++编程语言,有ROS经验者优先。
5. 具备出色的团队合作和沟通能力,对机器人强化学习方向有浓厚的兴趣和激情。

工作职责


1. 负责开发和优化灵巧手grasp相关的强化学习方法。
2. 设计和实施强化学习策略,分析实验数据,评估算法表现,解决机器人操作的sim2real问题
3. 跟进最新的灵巧操作研究趋势,为团队带来新的思路和解决方案。
包括英文材料
学历+
机器学习+
算法+
强化学习+
Python+
C+++
ROS+
Gymnasium+
相关职位

logo of anker
社招2年以上

1.负责机器人端到端操作方向的强化学习算法研发,解决机器人复杂任务操作问题; 2.对学界及业界前研技术的持续跟进; 3.围绕机器人场景落地先进算法技术。

更新于 2024-09-10
logo of xpeng
社招

我们正在寻找一位富有创造力和技术能力的机器人强化学习操作算法工程师,专注于机器人的manipulation任务。您将负责将先进的多模态传感器融合,设计研发基于强化学习的算法,使机器人能够高效准确的自主完成各种有挑战的manipulation任务。 开发和改进先进的强化学习算法,实现机器人的manipulation任务; 多模态传感器的感知融合与算法研发; 深⼊探索未知科研技术领域,影响并参与决策。

更新于 2025-04-01
logo of antgroup
社招3年以上技术类-算法

1. 路径规划 ‒ 开发适用于多种场景(如机器人导航、自动驾驶、无人机等)的路径规划算法; ‒ 实现经典和前沿的全局及局部路径规划方法(如 A*、Dijkstra、RRT、DWA 等),优化路径规划的效率和鲁棒性; ‒ 处理动态环境中的路径生成和调整,解决复杂场景下的避障问题。 2. 行动决策 ‒ 研究并实现具身智能体的行动决策算法,设计任务分解和行为选择的逻辑; ‒ 基于行为树(Behavior Tree)、有限状态机(FSM)等方法,构建模块化的决策框架; ‒ 开发多智能体协作与竞争的行动决策模型,支持复杂交互任务的执行。 3. 强化学习(Reinforcement Learning,RL) ‒ 针对具身智能场景(如机械臂控制、机器人动态避障、导航等),设计强化学习的 reward 函数和训练策略; ‒ 实现主流深度强化学习算法(如 DQN、DDPG、PPO、SAC 等),解决高维连续控制与探索问题; ‒ 优化强化学习模型的收敛速度和鲁棒性,提升算法在实际场景中的表现。 4. 模仿学习(Imitation Learning,IL) ‒ 通过专家示范数据(如轨迹、动作序列)训练智能体,实现模仿人类/智能体行为; ‒ 应用行为克隆(Behavior Cloning, BC)、逆强化学习(Inverse Reinforcement Learning, IRL)等技术解决稀疏奖励问题; ‒ 结合模仿学习与强化学习,提升智能体在复杂任务中的学习和泛化能力。 5. 算法优化与工程实现 ‒ 优化算法的计算效率和资源占用,适配实时性要求 ;‒ 在仿真环境(如 Gazebo、PyBullet、Mujoco 等)和真实设备中验证算法性能; ‒ 配合嵌入式团队完成算法在终端设备上的部署与优化。 6. 技术研究与创新 ‒ 跟踪具身智能领域的前沿算法进展,探索新技术的实际应用; ‒ 研究多模态感知与决策(如视觉、语音、触觉)的融合方法,提升智能体的环境理解与行动能力; ‒ 参与长期自主学习、在线学习和自适应学习系统的设计与开发。

更新于 2025-09-28
logo of anker
社招研发

安克创新正式启动了机器人发展战略,计划分三个阶段推进: 「二维基础型」:以扫地机器人、割草机器人为典型的平面作业机器人。 「三维移动型」:包含机器狗、无人机等具有三维空间移动能力的机器人。 「三维交互型」:通过机械臂来实现复杂操作的人形/类人形机器人。" 招聘方向: 【大模型与多模态算法工程师】 【强化学习算法工程师】 【灵巧手工程师】 【机器人运动规划工程师】 【机器人强化学习算法工程师】 【机器人数据平台算法工程师】 【机器人感知算法工程师】 【高级音频算法工程师】 【图像与视频AI算法工程师】 【AI算法工程师】 【嵌入式工程师】

更新于 2025-05-29