蚂蚁金服蚂蚁集团-RL Agent研发专家-北京&上海&杭州
任职要求
1. 熟悉 Python 研发,熟悉并行计算、AI Agent 系统等任一领域的专业知识; 2. 能够熟练部署和使用主流 AI 模型和工具,了解 Prompt 和 Context Engineering 等调优手段; 3. 熟悉 agent workf…
工作职责
1. 研发 Agentic 强化学习工程,包括 Agentic RL 算法、长上下文训练加速、多轮轨迹交互等能力; 2. 研发工具和 Agent 合成工程,包括 toolUse、SWE、computerUse、browserUse、Mutil-Agents 等场景。
ASystem 会探索和构建高性能的 AI 强化学习基础系统,让语言交互、智能体、具身智能等各类 AI 场景都能基于这个基础系统走向高效的自我演进,迈向更高的智能水平。 1. 研发 Agentic 强化学习工程,包括 Agentic RL 算法、长上下文训练加速、多轮轨迹交互等能力; 2. 研发工具和 Agent 合成工程,包括 toolUse、SWE、computerUse、browserUse、Mutil-Agents 等场景; 3. 研发环境工程和高性能 sandbox 引擎技术,包括多语言执行环境、桌面虚拟化渲染、大型程序虚拟环境等场景,满足大规模并发调用、极速启动、安全隔离等能力;
蚂蚁ASystem会探索和构建高性能的 AI 自学习基础系统,让语言交互、智能体、具身智能等各类 AI 场景都能基于这个基础系统走向高效的自我演进,迈向更高的智能水平。 1. 研发新一代训推混合计算系统,优化训推分布式并行技术,实现大规模T级参数模型训练和 100X 性能提升; 2. 以“X+RL”范式建设新一代强化学习框架,实现多轮交互、过程奖励、大规模模拟环境等能力,支持各类智能体和搜索场景学习能力提升; 3. 结合软硬件优化分布式并行计算和调度系统,提升大模型在训推一体、长推理效率和弹性训练的能力,大幅降低智能计算成本;
1、围绕行业AI应用快速落地,研发端到端智能体核心技术,方向包括但不限于:Agent RL强化学习方法、全模态数据解析与私域知识加工、自规划和自主进化的多智能体等技术,提升智能体在复杂业务流中的效果与适应性。 2、攻坚突破大模型产品在行业应用落地和交付过程中的技术难题,与业界先进技术进行持续对比,并保持优势。 3、具备良好的产品化思维,驱动产品迭代,与产品和工程团队紧密合作,将算法技术应用于实际产品,带来产品商业化增量和竞争力。 4、深入研究大模型和智能体技术,持续关注和探索大模型和智能体方向的前沿动向和技术趋势,打造产品业界影响力。