logo of antgroup

蚂蚁金服蚂蚁集团-大模型Agent算法应用工程师(就业)-支付宝技术

社招全职3年以上技术类-算法地点:上海 | 杭州状态:招聘

任职要求


必备
1、计算机/人工智能/相关专业,本科及以上,能独立完成训练到上线的工程闭环。
2、熟悉大模型Agent技术栈:ReActAutoGPT/Adept式框架、LangChain/LangGraph、LlamaIndex 或同类;有 MCP 或函数调用/工具协议经验优先。
3、精通至少两项: 
  a. 深度强化学习或偏好对齐:PPO/GRPO、DPO、RM训练、离线RL/IL;
  b. 多轮多步数据合成:自博弈、合成器编排、对抗与去噪、质量评审;
  c. 复杂决策建模:MDP/POMDP、分层/选址规划、树搜索;
  d. Planni…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、设计与落地多轮多步数据合成流程(对话、计划、工具调用轨迹、偏好反馈等),构建高质量指令与偏好数据集。
2、组织 SFT + RL(如 DPO、RM+PPO/GRPO、RLHF/RLAIF)训练与离线评估,形成可复用训练/评测基座。
3、构建/优化 Agent 的 planning(planner、task decomposition、反思/复盘)与工具使用策略(tool selection、参数填充、错误恢复等)。
4、设计 memory 体系(短期/长期/检索记忆、用户画像)与个性化能力(偏好建模、上下文压缩、隐私保护)。
5、与产品/业务协同,将Agent能力在实际场景中落地并持续优化性能、成本与延迟。
包括英文材料
大模型+
AI agent+
React+
AutoGPT+
LangChain+
还有更多 •••
相关职位

logo of antgroup
社招3年以上技术类-综合

1. 客户侧需求分析和机会洞察:能够和客户进行深入的交流,识别出客户在AI转型中的核心需求和问题痛点,并且洞察AI转型对客户经营增长带来的机会,并且结合支付宝的AI技术赋能客户,带来支付宝业务和客户双赢的增长。 2. AI解决方案编写和方案原型构建:能够根据给客户产出的AI解决方案,构建对应AI应用系统原型,通过原型帮助客户理解方案并且达成客户和支付宝在AI应用创新的全面合作。 3. 行业洞察和生态共建:深入把握AI应用技术发展较快的行业(职业教育、就业、物流无人车、两轮车、校园服务、低碳领域)等领域的AI发展方向,熟悉上下游生态产品和技术发展,联合生态一起进行产品共建,构建有支付宝业务技术特色的AI生态技术产品。 4. 支付宝智能业务增长:通过客户方案交付落地,生态产品共建落地,以及行业洞察分析带来机会的机会全面助力支付宝智能业务增长。

更新于 2025-12-10北京|上海|杭州
logo of alibaba
社招1年以上

团队介绍: 天猫国际是阿里巴巴集团旗下跨境进口零售平台,聚合全球品牌、商家及供应链资源,将海外优质商品带给中国消费者,天猫国际自营业务由平台自行采购、运营、履约,实现从商品引入、价格策略、商品运营、库存管理到配送的全链路可控。 算法场景涵盖供应商入驻、商品运营助手、搜推体验、智能客服等B/C两端整个链路,同时包含大模型的推荐应用、多模态理解、时序预测、运筹优化等,是复合型算法工程师的最佳训练场。 在这里,你将得到大模型在电商场景下丰富的应用挑战,同时自营模式保障算法应用的可控性和数据完整性,方便进行端到端建模与全链路分析,可以快速实验与迭代; 自营业务对托管商品的定价、素材优化、运营策略有直接决策权,算法可以快速验证并调整,无需长周期的商家协调; 业务价值可量化,算法效果可以直接体现在商品销量、毛利率、库存周转率、用户体验留存等核心指标上; 既有丰富的落地场景又有跨境特有的业务挑战,以及进口电商领域有丰富经验积累的师兄帮助,拓展算法工程师的深度和广度。 岗位描述: 1、大模型后训练:参与大语言模型的后训练工作,包括微调、指令对齐、多轮对话,落地并优化通用大模型在自营场景的应用。 2、Agent能力研发:基于大模型构建智能Agent体系,包括工具调用(Tool Use)、任务规划、多Agent协作等核心策略的设计与优化。 3、增强方法研发:实现并优化检索增强(RAG)流程,包括索引构建、召回优化、知识融合、上下文管理等。 4、性能评测与优化:设计评测指标,分析模型在不同任务下的表现,持续迭代模型与Agent的效果。 5、深入跟踪前沿技术,并在业务场景中验证和落地。 6、与产品、工程团队协作,将算法成果部署到线上服务,确保性能和稳定性。

更新于 2025-11-30杭州
logo of alibaba
社招

1、主导基于大模型的AI Agent全生命周期研发,包括通用型及垂直领域AI Agent的应用架构设计、数据构建、模型训练与评测; 2、运用SFT、RL等Post-training训练方法,提升大模型在自主规划(Planning)、多步推理、RAG增强生成、工具调用、数据问答、文案生成等方面的能力; 3、构建Agent RL所需的环境、训练方法,设计合理的Reward Function和优化函数,激发模型在垂直领域内的泛化性,探索无/少人类专家样本依赖的Agent优化方案; 4、跟踪LLM与Agent领域的国际前沿技术动态,推动技术创新在业务场景中的落地应用,重点突破工具集成复杂推理、数据洞察、AI搜索、图像连续编辑、GUI Agent等方向的应用创新; 4、持续优化Agent算法与系统架构,构建端到端的智能体评测体系,开发自动化评估工具与多维评价指标,提升Agent系统性能与效率

更新于 2025-07-22杭州
logo of alibaba
社招2年以上

1、主导基于大模型的AI Agent全生命周期研发,包括通用型及垂直领域AI Agent的应用架构设计、数据构建、模型训练与评测; 2、运用SFT、RL等Post-training训练方法,提升大模型在自主规划(Planning)、多步推理、RAG增强生成、工具调用、数据问答等方面的能力; 3、构建Agent RL所需的环境、训练方法,设计合理的Reward Function和优化函数,激发模型在垂直领域内的泛化性,探索无/少人类专家样本依赖的Agent优化方案; 4、跟踪LLM与Agent领域的国际前沿技术动态,推动技术创新在业务场景中的落地应用,重点突破工具集成复杂推理、数据洞察、AI搜索等方向的应用创新; 5、持续优化Agent算法与系统架构,构建端到端的智能体评测体系,开发自动化评估工具与多维评价指标,提升Agent系统性能与效率。

更新于 2026-01-16杭州