logo of antgroup

蚂蚁金服蚂蚁集团-RL Agent研发专家-北京&上海&杭州

社招全职5年以上技术类-算法地点:北京 | 上海 | 杭州状态:招聘

任职要求


1. 熟悉 Python 研发,熟悉并行计算、AI Agent 系统等任一领域的专业知识;
2. 能够熟练部署和使用主流 AI 模型和工具,了解 Prompt 和 Context Engineering 等调优手段;
3. 熟悉 agent workf…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 研发 Agentic 强化学习工程,包括 Agentic RL 算法、长上下文训练加速、多轮轨迹交互等能力;
2. 研发工具和 Agent 合成工程,包括 toolUse、SWE、computerUse、browserUse、Mutil-Agents 等场景。
包括英文材料
Python+
AI agent+
还有更多 •••
相关职位

logo of antgroup
社招1年以上技术-开发

ASystem 会探索和构建高性能的 AI 强化学习基础系统,让语言交互、智能体、具身智能等各类 AI 场景都能基于这个基础系统走向高效的自我演进,迈向更高的智能水平。 1. 研发 Agentic 强化学习工程,包括 Agentic RL 算法、长上下文训练加速、多轮轨迹交互等能力; 2. 研发工具和 Agent 合成工程,包括 toolUse、SWE、computerUse、browserUse、Mutil-Agents 等场景; 3. 研发环境工程和高性能 sandbox 引擎技术,包括多语言执行环境、桌面虚拟化渲染、大型程序虚拟环境等场景,满足大规模并发调用、极速启动、安全隔离等能力;

更新于 2025-12-30北京|杭州
logo of antgroup
社招2年以上技术-开发

蚂蚁ASystem会探索和构建高性能的 AI 自学习基础系统,让语言交互、智能体、具身智能等各类 AI 场景都能基于这个基础系统走向高效的自我演进,迈向更高的智能水平。 1. 研发新一代训推混合计算系统,优化训推分布式并行技术,实现大规模T级参数模型训练和 100X 性能提升; 2. 以“X+RL”范式建设新一代强化学习框架,实现多轮交互、过程奖励、大规模模拟环境等能力,支持各类智能体和搜索场景学习能力提升; 3. 结合软硬件优化分布式并行计算和调度系统,提升大模型在训推一体、长推理效率和弹性训练的能力,大幅降低智能计算成本;

更新于 2025-12-01北京|上海|杭州
logo of bytedance
社招A153553

1、工程基建,设计并落地高可扩展的AI Agent框架,引入MCP标准实现Agent与内部微服务、外部工具链的安全、低延迟集成; 2、AI Agent应用创新,基于大模型能力探索并落地ToC/内部研效提升等多场景Agent产品形态(对话、流程自动化、Copilot等)。

更新于 2025-08-15北京
logo of antgroup
社招3年以上技术类-算法

1、核心算法研发:主导Agentic RL及多智能体(Multi-Agent)算法的研发,融合大模型和多模态(LLM/VLM)的推理能力。 2、训练框架优化:负责RL训练框架的性能调优与迭代,提升大规模训练效率。 3、智能体构建与落地:构建面向真实场景的智能体,包括但不限于GUI Agent、代码Agent、根因分析(RCA)Agent等,驱动业务创新。

更新于 2025-07-28北京|杭州