阿里巴巴阿里国际站/Alibaba.com-Agentic Post-Training算法工程师/专家-Accio Work-杭州

社招全职1年以上技术类-算法2026-06-10地点：杭州状态：招聘

扫码手机上打开

任职要求

1、硕士及以上学历，计算机、电子、人工智能、自动化、数学、物理、等相关专业优先；
2、具有大规模数据合成、Coding Agent、Search Agent、大规模RL训练、商业场景Agent架构与环境构建项目经验者优先；
3、具有良好的工程能力，熟悉Verl/Slime/RL2等模型训练infra并有训练经验者优先；
4、熟悉LLM-based Chatbot技术原理者优先；熟悉LLM Post-Training训练数据构建方法，以及Multi-Agent系统框架者优先；
5、有较强的自驱力、学习力、创新力和抗压能力，能够跟上正在快速变化的AI时代。

加分项
1、具有扎实的机器学习基础，熟悉CV、NLP、RL、ML、多模态理解、搜推广等领…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

Accio是阿里巴巴国际数字商业集团阿里国际站内部孵化的一款战略级AI原生应用产品，也是全球首个B2B AI Search Agent，通过持续探索Agent、LLM、VLM、RL、Memory、Reasoning、AI Search等前沿技术，自研基座、Agent系统以及AI Search系统，实现全球B2B跨境贸易跨越式发展。

1、构建Agent专用合成数据管线：设计并实现自动化的合成数据方案，重点生产高质量的思维链、工具调用和自我修正轨迹；
2、Agent交互环境搭建：构建高性能、可扩展的Agent框架和运行环境（如代码执行器、浏览器模拟器、数据库交互等），为模型提供实时反馈的环境；
3、Agentic RL：应用并改进RL算法，提升模型在长程任务（Long-horizon tasks）中的成功率和鲁棒性；
4、评估体系建设：开发超越传统基准测试的动态评估方案，针对规划能力、工具选择准确率、幻觉控制及错误恢复能力建立量化指标；
5、探索落地前沿Agent技术，包含而不限于：Agentic Model、Agentic Benchmark、Agentic RL、Pro-active Agent、Function Calling、Tool-Use、Multi-Step Reasoning、Agent Harness、Agentic Post-Training。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

AI agent+

大模型+

机器学习+

NLP+

ICML+

ACL+

EMNLP+

CVPR+

ECCV+

ICCV+

NeurIPS+

还有更多 •••

登录查看完整学习资料

相关职位

阿里国际站/Alibaba.com-Agent后训练算法工程师/专家-Accio Work-杭州

社招3年以上技术类-算法

Accio Work是阿里巴巴国际数字商业集团阿里国际站内部孵化的一款战略级AI原生应用产品，也是阿里在海外落地的首个企业级AI Agent，通过持续探索Agent、Agent HarnessRL、Memory、Reasoning等前沿技术，自研Agent模型、Agent系统，实现B2B AI Agent跨越式发展。 1、参与Accio Work模型训练与研发，包含而不限于Agent设计、Post-Training、RL等全链路建设； 2、负责AI Native专项能力建设，包括而不限于RAG System、Agent System、Agent Training-Function Call/Reasoning/Agentic RL/Proactive Agent/Tool-Use； 3、探索大模型前沿技术，持续迭代模型能力，落地Agent，推动Accio Work，持续迭代。

更新于 2026-06-10杭州

阿里国际站/Alibaba.com-Agent算法工程师/专家-Accio Work-杭州

社招3年以上技术类-算法

Accio Work是阿里巴巴国际数字商业集团阿里国际站内部孵化的一款战略级AI原生应用产品，也是阿里在海外落地的首个企业级AI Agent，通过持续探索Agent、Agent Harness、RL、Memory、Reasoning等前沿技术，自研Agent模型、Agent系统，实现B2B AI Agent跨越式发展。 1、研发并优化 Agent 的核心能力模块，包括但不限于自主规划（Planning）、多步推理（Reasoning）、工具/skill调用（Tool Use）、长短期记忆（Memory）及 RAG 增强； 2、复杂任务动态编排：设计并实现高扩展性的Multi-Agent协作框架（如Agent Swarm/Agent Team），支持将模糊的宏观目标递归拆解为原子任务； 3、Long-horizon运行设计：构建结合"工作记忆+全局知识库"的多级存储系统，解决Agent长期运行中的信息遗忘问题，建立跨Agent的共享上下文能力，设计Agent持续进化框架； 4、构建端到端的Agent评测体系，构建生产力场景benchmark，推动Agent在business场景落地； 5、探索落地前沿Agent技术，包含而不限于：Agentic Model、Agentic Benchmark、Agentic RL、Pro-active Agent、Function Calling、Tool-Use、Multi-Step Reasoning、Agent Harness、Agentic Post-Training。

更新于 2026-06-10杭州

AI搜索开发工程师

社招3年以上核心本地商业-业

AI搜索和智能体产品后端系统研发： 1. 设计并实现AI搜索Agent应用，包括Query理解、记忆存储、环境感知等模块的集成与优化。 2. 负责Agentic Search（搜索智能体）技术探索和架构研发，支持多模态（文本、图像、视频）检索与应用创新。 3. 抽象并开发企业级别的AI应用平台，支持Agent相关应用的接入与扩展，确保平台的高可用性和可扩展性。 4. 实现平台的模块化设计，支持快速迭代与功能扩展，满足AI时代本地生活服务领域智能体应用快速发展需求。 5. 与业务部门（如产品、运营团队）协作，将AI搜索能力嵌入现有工作流（如智能问答、个性化推荐）。 6. 负责AI系统的日常运维，包括异常监控、接口优化及用户培训，确保生产环境高效运行。

更新于 2025-04-03北京

AI研发效能专家（AI4SE方向）(J66611)

社招2年以上效能架构部

1、参与AI大模型和主流AI类框架的调研与评测，主导Agentic框架设计、智能体设计、内部知识库设计与应用。 2、探索和应用最新的人工智能技术，参与构建完整的AI研发工具体系，聚焦提升组织内产研效率。 3、参与组织内AI4SE相关课题的前沿研究，参与相关项目的落地，并协助组织构建内外部技术影响力。

更新于 2025-03-10北京