logo of antgroup

蚂蚁金服【蚂蚁星-Plan A】具身智能算法工程师-灵波(实习)

实习兼职蚂蚁星- Plan A人才计划实习地点:上海 | 北京 | 杭州状态:招聘

任职要求


1. 必备条件专业背景:计算机、自动化、机器人或相关专业硕士及以上学历;
2. 核心技能:(1)深入理解机器人模仿学习(Imitation Learning)和强化学习(RL/RLHF)理论
                    (2)具备大规模机器人预训练模型或真机RL后训练的实际落地经验
                    (3)熟悉主流VLA架构(π系列, Gr00T, ACT, Diffusion Policy等)或者世界模型(Sora, Genie等)的技术原理
                    (4)熟悉主流机器…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 核心模型研发:负责具身模型的全链路研发,包括数据处理、模型预训练、后训练优化及真机部署,确保模型在实际场景中的高效性和准确性;
2. 数据工程建设:主导大规模机器人数据集的采集、清洗、标注和管理工作,构建高质量的多模态数据pipeline,为模型预训练提供坚实基础;
3. 端到端模型训练:参与具身模型的预训练架构设计,并负责真机环境下的强化学习后训练,实现在线学习能力提升;
4. 前沿技术跟踪:持续跟踪具身智能领域的前沿进展(包括最新论文、开源项目等),快速验证并将先进技术落地到产品中,推动模型性能持续迭代。
包括英文材料
学历+
强化学习+
算法+
智能体+
Gymnasium+
PyTorch+
TensorFlow+
ROS+
还有更多 •••
相关职位

logo of antgroup
校招蚂蚁星计划 -

1.负责具身智能的核心算法研发,聚焦强化学习(RL)与模仿学习(IL)技术,推动智能体在复杂物理环境中的感知、决策与行动能力; 2.设计并实现基于强化学习的端到端训练框架,解决稀疏奖励、多任务学习、长周期规划等挑战性问题; 3.开发高效的模仿学习算法,结合人类示范数据与自主探索策略,提升智能体在真实场景中的泛化性与安全性; 4.针对机器人控制、多模态感知-动作闭环等场景,优化算法在计算效率、实时性与鲁棒性方面的表现; 5.与硬件、仿真团队紧密协作,推动算法在实体机器人或虚拟环境中的部署与验证。

上海
logo of antgroup
校招2026届蚂蚁星

1.负责具身智能的核心算法研发,聚焦强化学习(RL)与模仿学习(IL)技术,推动智能体在复杂物理环境中的感知、决策与行动能力; 2.设计并实现基于强化学习的端到端训练框架,解决稀疏奖励、多任务学习、长周期规划等挑战性问题; 3.开发高效的模仿学习算法,结合人类示范数据与自主探索策略,提升智能体在真实场景中的泛化性与安全性; 4.针对机器人控制、多模态感知-动作闭环等场景,优化算法在计算效率、实时性与鲁棒性方面的表现; 5.与硬件、仿真团队紧密协作,推动算法在实体机器人或虚拟环境中的部署与验证。

上海
logo of antgroup
校招蚂蚁星计划 -

蚂蚁ASystem会探索和构建高性能的 AI 自学习基础系统,让语言交互、智能体、具身智能等各类 AI 场景都能基于这个基础系统走向高效的自我演进,迈向更高的智能水平。 1. 探索和研究新一代训推混合计算系统,寻求从算子到训推并行原理下的系统创新,实现大规模T级参数模型训练和100X性能提升; 2. 以“X+RL”范式构建新一代强化学习框架,实现多轮交互、过程奖励、大规模模拟环境等,支持各类智能体和搜索场景学习能力提升; 3. 通过先进软硬件设计和优化,研究并持续优化分布式并行计算和调度系统,提升大模型在训推一体、长推理效率和弹性训练能力,大幅降低智能计算成本。

北京|上海|杭州
logo of antgroup
校招2026届蚂蚁星

蚂蚁ASystem会探索和构建高性能的 AI 自学习基础系统,让语言交互、智能体、具身智能等各类 AI 场景都能基于这个基础系统走向高效的自我演进,迈向更高的智能水平。 1. 探索和研究新一代训推混合计算系统,寻求从算子到训推并行原理下的系统创新,实现大规模T级参数模型训练和100X性能提升; 2. 以“X+RL”范式构建新一代强化学习框架,实现多轮交互、过程奖励、大规模模拟环境等,支持各类智能体和搜索场景学习能力提升; 3. 通过先进软硬件设计和优化,研究并持续优化分布式并行计算和调度系统,提升大模型在训推一体、长推理效率和弹性训练能力,大幅降低智能计算成本。

北京|上海|杭州