蚂蚁金服【Plan A】具身智能算法工程师-灵波（实习）

实习兼职蚂蚁星- Plan A人才计划实习2025-07-25地点：上海 | 北京 | 杭州状态：招聘

扫码手机上打开

任职要求

1. 必备条件专业背景：计算机、自动化、机器人或相关专业硕士及以上学历；
2. 核心技能：（1）深入理解机器人模仿学习（Imitation Learning）和强化学习（RL/RLHF）理论
                    （2）具备大规模机器人预训练模型或真机RL后训练的实际落地经验
                    （3）熟悉主流VLA架构（π系列, Gr00T, ACT, Diffusion Policy等）或者世界模型（Sora, Genie等）的技术原理
                    （4）熟悉主流机器…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1. 核心模型研发：负责具身模型的全链路研发，包括数据处理、模型预训练、后训练优化及真机部署，确保模型在实际场景中的高效性和准确性；
2. 数据工程建设：主导大规模机器人数据集的采集、清洗、标注和管理工作，构建高质量的多模态数据pipeline，为模型预训练提供坚实基础；
3. 端到端模型训练：参与具身模型的预训练架构设计，并负责真机环境下的强化学习后训练，实现在线学习能力提升；
4. 前沿技术跟踪：持续跟踪具身智能领域的前沿进展（包括最新论文、开源项目等），快速验证并将先进技术落地到产品中，推动模型性能持续迭代。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

强化学习+

算法+

智能体+

Gymnasium+

PyTorch+

TensorFlow+

ROS+

还有更多 •••

登录查看完整学习资料

相关职位

【蚂蚁星-Plan A】具身智能算法工程师-26届

校招2026届蚂蚁星

1.负责具身智能的核心算法研发，聚焦强化学习（RL）与模仿学习（IL）技术，推动智能体在复杂物理环境中的感知、决策与行动能力； 2.设计并实现基于强化学习的端到端训练框架，解决稀疏奖励、多任务学习、长周期规划等挑战性问题； 3.开发高效的模仿学习算法，结合人类示范数据与自主探索策略，提升智能体在真实场景中的泛化性与安全性； 4.针对机器人控制、多模态感知-动作闭环等场景，优化算法在计算效率、实时性与鲁棒性方面的表现； 5.与硬件、仿真团队紧密协作，推动算法在实体机器人或虚拟环境中的部署与验证。

更新于 2025-07-25上海

【Plan A】向量检索工程师-平台技术（实习）

实习蚂蚁星- Pla

1. 负责 ANN(Approximate Nearest Neighbor) 算法的设计和验证，结合软硬件实现大容量、高吞吐、高召回、低成本的向量检索算法，持续构建业界领先的产品竞争力； 2. 跟进 RAG/AIGC 的前沿技术研究，探索向量检索在 LLM 大模型场景中的应用； 3. 持续跟踪学术界与工业界主流的向量检索算法最新进展。你将负责什么？智能融合：设计图谱与向量的融合重排算法，让语义与事实互补，实现1+1>2的召回效果。极致效率：优化亿级混合检索性能，攻克系统瓶颈，将端到端延迟压缩至毫秒级以支撑实时场景。召回边界：设计创新召回策略，结合向量泛化与图谱推理，解决复杂、模糊查询下的知识发现难题。

更新于 2026-04-14上海

【Plan A】向量检索工程师-平台技术-27届

校招2027届蚂蚁星

更新于 2026-05-14上海

【Plan A】AI工程师-Agent Infra-灵光（实习）

实习蚂蚁星- Pla

部门介绍：蚂蚁AReaL会探索和构建高性能的 AI 自学习基础系统，让语言交互、智能体、具身智能等各类 AI场景都能基于这个基础系统走向高效的自我演进，迈向更高的智能水平。职位描述： 1. 探索和研究新一代Agent Infra计算系统，寻求从训推并行到Agent Self-Evolution的系统创新，实现大规模多智能体交互场景下的极致Token Effiencicy； 2. 以“Agent+RL”范式构建新一代面向Agent Infra的强化学习框架，实现多轮交互、过程奖励、大规模模拟环境等，支持各类智能体和搜索场景学习能力提升； 3. 探索结合AI硬件下的Agent Runtime技术创新。

更新于 2026-05-12杭州