logo of antgroup

蚂蚁金服蚂蚁集团-大模型Agent算法应用工程师(就业)-支付宝技术

社招全职3年以上技术类-算法地点:上海 | 杭州状态:招聘

任职要求


必备
1、计算机/人工智能/相关专业,本科及以上,能独立完成训练到上线的工程闭环。
2、熟悉大模型Agent技术栈:ReActAutoGPT/Adept式框架、LangChain/LangGraph、LlamaIndex 或同类;有 MCP 或函数调用/工具协议经验优先。
3、精通至少两项: 
  a. 深度强化学习或偏好对齐:PPO/GRPO、DPO、RM训练、离线RL/IL;
  b. 多轮多步数据合成:自博弈、合成器编排、对抗与去噪、质量评审;
  c. 复杂决策建模:MDP/POMDP、分层/选址规划、树搜索;
  d. Planni…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、设计与落地多轮多步数据合成流程(对话、计划、工具调用轨迹、偏好反馈等),构建高质量指令与偏好数据集。
2、组织 SFT + RL(如 DPO、RM+PPO/GRPO、RLHF/RLAIF)训练与离线评估,形成可复用训练/评测基座。
3、构建/优化 Agent 的 planning(planner、task decomposition、反思/复盘)与工具使用策略(tool selection、参数填充、错误恢复等)。
4、设计 memory 体系(短期/长期/检索记忆、用户画像)与个性化能力(偏好建模、上下文压缩、隐私保护)。
5、与产品/业务协同,将Agent能力在实际场景中落地并持续优化性能、成本与延迟。
包括英文材料
大模型+
AI agent+
React+
AutoGPT+
LangChain+
还有更多 •••
相关职位

logo of antgroup
社招3年以上技术类-综合

1. 客户侧需求分析和机会洞察:能够和客户进行深入的交流,识别出客户在AI转型中的核心需求和问题痛点,并且洞察AI转型对客户经营增长带来的机会,并且结合支付宝的AI技术赋能客户,带来支付宝业务和客户双赢的增长。 2. AI解决方案编写和方案原型构建:能够根据给客户产出的AI解决方案,构建对应AI应用系统原型,通过原型帮助客户理解方案并且达成客户和支付宝在AI应用创新的全面合作。 3. 行业洞察和生态共建:深入把握AI应用技术发展较快的行业(职业教育、就业、物流无人车、两轮车、校园服务、低碳领域)等领域的AI发展方向,熟悉上下游生态产品和技术发展,联合生态一起进行产品共建,构建有支付宝业务技术特色的AI生态技术产品。 4. 支付宝智能业务增长:通过客户方案交付落地,生态产品共建落地,以及行业洞察分析带来机会的机会全面助力支付宝智能业务增长。

更新于 2025-12-10北京|上海|杭州
logo of alibaba
社招2年以上

关于我们 我们致力于把大模型 Agent 打造成“能解决业务问题的生产力系统”:不仅会对话,更能规划、推理、调用工具、洞察数据,在多个业务场景形成端到端闭环。团队长期坚持“学术先进性 + 工程可落地 + 指标可验证”三位一体,推动多项技术在真实业务中规模化应用,并持续输出可复用的训练与评测体系。 你将获得什么 ● 覆盖多模型、多尺寸的系统化训练能力:团队训练资源充足,能在不同架构/不同规模模型上完成微调、对齐与能力专项提升,并形成可复用的训练范式。 ● 论文级问题 + 业务级验证:我们鼓励你做可发表的创新,同时确保每个方向都能进入线上评测与业务闭环,真正做到 有创新、有落地、有收益。 ● 完整的 Agent RL 研发舞台:从环境构建、Reward 设计、策略优化到自动评估工具链,你将能主导一条完整的 RL-Driven Agent 能力演进路径。 ● 个人影响力与成长:支持对外分享、论文/专利沉淀与跨团队共建 岗位职责 1、主导基于大模型的 AI Agent 全生命周期研发,包括通用型及垂直领域 AI Agent 的应用架构设计、数据构建、模型训练与评测; 2、运用 SFT、RL 等 Post-training 训练方法,提升大模型在自主规划(Planning)、多步推理、RAG 增强生成、工具调用、数据问答等方面的能力; 3、构建 Agent RL 所需的环境与训练方法,设计合理的 Reward Function 和优化函数,激发模型在垂直领域内的泛化性,探索无/少人类专家样本依赖的 Agent 优化方案; 4、跟踪 LLM 与 Agent 领域的国际前沿技术动态,推动技术创新在业务场景中的落地应用,重点突破工具集成复杂推理、数据洞察、AI 搜索等方向的应用创新; 5、持续优化 Agent 算法与系统架构,构建端到端智能体评测体系,开发自动化评估工具与多维评价指标,提升系统性能与效率。

更新于 2026-01-28杭州
logo of alibaba
社招1年以上

我们致力于在电商交易生态中,定义下一代AI驱动的服务范式。你将作为核心成员,负责打造具备高情商、强逻辑、高可靠性的 Service Agent。我们不仅是在做小蜜智能对话机器人,更是通过大模型技术重塑数亿用户的智能服务办理流程,构建电商服务领域的“数字大脑” 1. Agent应用架构设计与落地:负责电商服务领域复杂服务场景(如小蜜、纠纷&赔付、服务风控),设计并搭建具备多步推理、工具调用能力的 Agent 架构,负责核心产品的workflow设计,解决智能服务长链路以及多链路协作难点; 2. 构建高可用智能服务系统:主导Agent算法工程的应用落地,涵盖向量库选型、多路召回策略实现、Context Engineering以及工具调用的精准控制。负责大模型推理加速、响应延迟及成本路由控制。提升复杂商业场景下的问题解决率及落地稳定性; 3. Agent系统效果评测与迭代:针对电商服务中的高置信度场景,构建 Service Agent 专属评估体系(Benchmark)及全链路自动化评测体系,通过数据工程手段优化Prompt工程与知识库质量,确保Agent 输出符合服务严谨性要求; 4. 前沿技术探索与转化:探索多智能体协作(Multi-Agent)、多模态融合和Self-Evolving等前沿方向,鼓励将学术界的最新成果快速转化为可落地的产品能力。

更新于 2026-03-26杭州
logo of aligenie
社招1年以上

我们致力于在电商交易生态中,定义下一代AI驱动的服务范式。你将作为核心成员,负责打造具备高情商、强逻辑、高可靠性的 Service Agent。我们不仅是在做小蜜智能对话机器人,更是通过大模型技术重塑数亿用户的智能服务办理流程,构建电商服务领域的“数字大脑” 1. Agent应用架构设计与落地:负责电商服务领域复杂服务场景(如小蜜、纠纷&赔付、服务风控),设计并搭建具备多步推理、工具调用能力的 Agent 架构,负责核心产品的workflow设计,解决智能服务长链路以及多链路协作难点; 2. 构建高可用智能服务系统:主导Agent算法工程的应用落地,涵盖向量库选型、多路召回策略实现、Context Engineering以及工具调用的精准控制。负责大模型推理加速、响应延迟及成本路由控制。提升复杂商业场景下的问题解决率及落地稳定性; 3. Agent系统效果评测与迭代:针对电商服务中的高置信度场景,构建 Service Agent 专属评估体系(Benchmark)及全链路自动化评测体系,通过数据工程手段优化Prompt工程与知识库质量,确保Agent 输出符合服务严谨性要求; 4. 前沿技术探索与转化:探索多智能体协作(Multi-Agent)、多模态融合和Self-Evolving等前沿方向,鼓励将学术界的最新成果快速转化为可落地的产品能力。

更新于 2026-03-26杭州