logo of antgroup

蚂蚁金服蚂蚁集团-算法工程师-具身智能方向

社招全职3年以上技术类-算法地点:上海状态:招聘

任职要求


1. 专业基础
‒ 硕士及以上学历(优秀本科生也可),机器人学、计算机科学、人工智能、控制工程等相关专业;
‒ 扎实的数学基础(线性代数、概率论、优化理论等)和算法设计能力。
2. 技术能力
‒ 熟悉路径规划算法(A*、RRT、DWA 等)以及行为决策框架,具备实际开发经验;
‒ 熟练掌握强化学习与模仿学习的理论与实践,熟悉深度学习框架(如 TensorFlowPyTorch);
‒ 具备机器人操作系统(ROS/ROS2)开发经验,能够在真实设备上进行算法调试;
‒ 熟悉仿真工具(如 Gazebo、Webots、Mujoco 等),能够搭建测试环境并调试具身智能算法。
3. 加分项
‒ 有机器人导航、自动驾驶或无人机控制相关项目经验;熟悉多智能体系统的协作与博弈算法;
‒ 有边缘计算/端侧部署经验,了解模型压缩、量化等优化技术;
‒ 在机器人学、强化学习、模仿学习等领域发表过高水平论文或有开源项目经验。
4. 软技能
‒ 热爱具身智能领域,对机器人或智能体的自主行为研究充满兴趣;
‒ 具备良好的学习能力和技术钻研精神;
‒ 具备团队协作能力,能够与硬件、嵌入式及其他算法团队配合完成复杂任务;
‒ 具备较强的问题分析与解决能力,能够独立完成技术攻关。

工作职责


1. 路径规划
‒ 开发适用于多种场景(如机器人导航、自动驾驶、无人机等)的路径规划算法;
‒ 实现经典和前沿的全局及局部路径规划方法(如 A*、Dijkstra、RRT、DWA 等),优化路径规划的效率和鲁棒性;
‒ 处理动态环境中的路径生成和调整,解决复杂场景下的避障问题。
2. 行动决策
‒ 研究并实现具身智能体的行动决策算法,设计任务分解和行为选择的逻辑;
‒ 基于行为树(Behavior Tree)、有限状态机(FSM)等方法,构建模块化的决策框架;
‒ 开发多智能体协作与竞争的行动决策模型,支持复杂交互任务的执行。
3. 强化学习(Reinforcement Learning,RL)
‒ 针对具身智能场景(如机械臂控制、机器人动态避障、导航等),设计强化学习的 reward 函数和训练策略;
‒ 实现主流深度强化学习算法(如 DQN、DDPG、PPO、SAC 等),解决高维连续控制与探索问题;
‒ 优化强化学习模型的收敛速度和鲁棒性,提升算法在实际场景中的表现。
4. 模仿学习(Imitation Learning,IL)
‒ 通过专家示范数据(如轨迹、动作序列)训练智能体,实现模仿人类/智能体行为;
‒ 应用行为克隆(Behavior Cloning, BC)、逆强化学习(Inverse Reinforcement Learning, IRL)等技术解决稀疏奖励问题;
‒ 结合模仿学习与强化学习,提升智能体在复杂任务中的学习和泛化能力。
5. 算法优化与工程实现
‒ 优化算法的计算效率和资源占用,适配实时性要求
;‒ 在仿真环境(如 Gazebo、PyBullet、Mujoco 等)和真实设备中验证算法性能;
‒ 配合嵌入式团队完成算法在终端设备上的部署与优化。
6. 技术研究与创新
‒ 跟踪具身智能领域的前沿算法进展,探索新技术的实际应用;
‒ 研究多模态感知与决策(如视觉、语音、触觉)的融合方法,提升智能体的环境理解与行动能力;
‒ 参与长期自主学习、在线学习和自适应学习系统的设计与开发。
包括英文材料
学历+
算法+
强化学习+
深度学习+
TensorFlow+
PyTorch+
ROS+
Gazebo+
自动驾驶+
智能体+
相关职位

logo of antgroup
社招3年以上技术类-算法

1、负责机器臂/人运动控制系统的设计和架构讨论; 2、研发优化运动控制算法,实现算法模型、软件和硬件集成; 3、分析处理机器人运动控制系统中的技术问题。

更新于 2025-04-17
logo of anker
校招

1. 探索研究具身智能领域的多模态大模型、世界模型、生成式模型、AIGC等人工智能前沿技术; 2. 探索大规模多模态理解与生成交织的基础模型,并进行极致系统优化;数据建设、指令微调、偏好对齐、RLHF、模型优化;提升数据合成、模型推理、规划能力,构建全面客观准确的评测体系,探索提升大模型能力; 3. 探索突破包括而不限于多模态大模型、端到端VLA模型、视觉COT与Agent在内的多模态模型、世界模型; 4. 通过预训练或SFT,使用生成式模型技术能力对现实世界的各类环境进行建模,提供多模态交互探索的基本能力,推动应用落地,研发以人工智能技术为核心的新技术、新产品。

更新于 2025-08-14
logo of anker
校招

1. 探索研究具身智能领域的多模态大模型、世界模型、生成式模型、AIGC等人工智能前沿技术; 2. 探索大规模多模态理解与生成交织的基础模型,并进行极致系统优化;数据建设、指令微调、偏好对齐、RLHF、模型优化;提升数据合成、模型推理、规划能力,构建全面客观准确的评测体系,探索提升大模型能力; 3. 探索突破包括而不限于多模态大模型、端到端VLA模型、视觉COT与Agent在内的多模态模型、世界模型; 4. 通过预训练或SFT,使用生成式模型技术能力对现实世界的各类环境进行建模,提供多模态交互探索的基本能力,推动应用落地,研发以人工智能技术为核心的新技术、新产品。

更新于 2025-08-14
logo of antgroup
社招3年以上技术类-算法

1. 负责开发和优化灵巧手grasp相关的强化学习方法。 2. 设计和实施强化学习策略,分析实验数据,评估算法表现,解决机器人操作的sim2real问题 3. 跟进最新的灵巧操作研究趋势,为团队带来新的思路和解决方案。

更新于 2025-09-28