蚂蚁金服【蚂蚁星-Plan A】具身智能算法工程师
任职要求
1. 教育背景:计算机科学、人工智能、机器人学、自动化等相关专业硕士及以上学历。 2. 核心技术能力: -精通强化学习经典及前沿算法(如PPO、SAC、DQN、MBRL等),具备多智能体强化学习(MARL)或分层强化学习(HRL)经验者优先。 -熟悉模仿学习技术框架(如GAIL、BC、逆强化学习),具备跨模态示范数据(视觉、动作、语言)融合经验。 -掌握机器人运动控制、动力学建模或物理仿真工具(如MuJoCo、PyBullet、Isaac Gym)。 3. 工程能力: -熟练使用PyTorch/TensorFlow等框架,具备大规模分布式训练或边缘计算部署经验。 -熟悉ROS/ROS2机器人开发框架,有实际机器人系统开发经历者优先。 4. 加分项: -熟悉具身认知理论、认知科学交叉领域知识。 -有机器人抓取、导航、人机协作等实际场景落地经验。 -在顶级会议(NeurIPS/ICML/ICLR/CoRL等)发表过RL/IL相关论文,或主导过具身智能领域开源项目 软性要求: 对具身智能的长期技术突破有强烈热情
工作职责
1.负责具身智能的核心算法研发,聚焦强化学习(RL)与模仿学习(IL)技术,推动智能体在复杂物理环境中的感知、决策与行动能力; 2.设计并实现基于强化学习的端到端训练框架,解决稀疏奖励、多任务学习、长周期规划等挑战性问题; 3.开发高效的模仿学习算法,结合人类示范数据与自主探索策略,提升智能体在真实场景中的泛化性与安全性; 4.针对机器人控制、多模态感知-动作闭环等场景,优化算法在计算效率、实时性与鲁棒性方面的表现; 5.与硬件、仿真团队紧密协作,推动算法在实体机器人或虚拟环境中的部署与验证。
1.负责具身智能的核心算法研发,聚焦强化学习(RL)与模仿学习(IL)技术,推动智能体在复杂物理环境中的感知、决策与行动能力; 2.设计并实现基于强化学习的端到端训练框架,解决稀疏奖励、多任务学习、长周期规划等挑战性问题; 3.开发高效的模仿学习算法,结合人类示范数据与自主探索策略,提升智能体在真实场景中的泛化性与安全性; 4.针对机器人控制、多模态感知-动作闭环等场景,优化算法在计算效率、实时性与鲁棒性方面的表现; 5.与硬件、仿真团队紧密协作,推动算法在实体机器人或虚拟环境中的部署与验证。
1.负责具身智能的核心算法研发,聚焦强化学习(RL)与模仿学习(IL)技术,推动智能体在复杂物理环境中的感知、决策与行动能力; 2.设计并实现基于强化学习的端到端训练框架,解决稀疏奖励、多任务学习、长周期规划等挑战性问题; 3.开发高效的模仿学习算法,结合人类示范数据与自主探索策略,提升智能体在真实场景中的泛化性与安全性; 4.针对机器人控制、多模态感知-动作闭环等场景,优化算法在计算效率、实时性与鲁棒性方面的表现; 5.与硬件、仿真团队紧密协作,推动算法在实体机器人或虚拟环境中的部署与验证。
蚂蚁ASystem会探索和构建高性能的 AI 自学习基础系统,让语言交互、智能体、具身智能等各类 AI 场景都能基于这个基础系统走向高效的自我演进,迈向更高的智能水平。 1. 探索和研究新一代训推混合计算系统,寻求从算子到训推并行原理下的系统创新,实现大规模T级参数模型训练和100X性能提升; 2. 以“X+RL”范式构建新一代强化学习框架,实现多轮交互、过程奖励、大规模模拟环境等,支持各类智能体和搜索场景学习能力提升; 3. 通过先进软硬件设计和优化,研究并持续优化分布式并行计算和调度系统,提升大模型在训推一体、长推理效率和弹性训练能力,大幅降低智能计算成本。