logo of alibaba

阿里巴巴阿里国际站/Alibaba.com-Agentic Post-Training算法工程师/专家-Accio Work-杭州

社招全职1年以上技术类-算法地点:杭州状态:招聘

任职要求


1、硕士及以上学历,计算机、电子、人工智能、自动化、数学、物理、等相关专业优先;
2、具有大规模数据合成、Coding Agent、Search Agent、大规模RL训练、商业场景Agent架构与环境构建项目经验者优先;
3、具有良好的工程能力,熟悉Verl/Slime/RL2等模型训练infra并有训练经验者优先;
4、熟悉LLM-based Chatbot技术原理者优先;熟悉LLM Post-Training训练数据构建方法,以及Multi-Agent系统框架者优先;
5、有较强的自驱力、学习力、创新力和抗压能力,能够跟上正在快速变化的AI时代。

加分项
1、具有扎实的机器学习基础,熟悉CV、NLP、RL、ML、多模态理解、搜推广等领…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


Accio是阿里巴巴国际数字商业集团阿里国际站内部孵化的一款战略级AI原生应用产品,也是全球首个B2B AI Search Agent,通过持续探索Agent、LLM、VLM、RL、Memory、Reasoning、AI Search等前沿技术,自研基座、Agent系统以及AI Search系统,实现全球B2B跨境贸易跨越式发展。

1、构建Agent专用合成数据管线:设计并实现自动化的合成数据方案,重点生产高质量的思维链、工具调用和自我修正轨迹;
2、Agent交互环境搭建:构建高性能、可扩展的Agent框架和运行环境(如代码执行器、浏览器模拟器、数据库交互等),为模型提供实时反馈的环境;
3、Agentic RL:应用并改进RL算法,提升模型在长程任务(Long-horizon tasks)中的成功率和鲁棒性;
4、评估体系建设:开发超越传统基准测试的动态评估方案,针对规划能力、工具选择准确率、幻觉控制及错误恢复能力建立量化指标;
5、探索落地前沿Agent技术,包含而不限于:Agentic Model、Agentic Benchmark、Agentic RL、Pro-active Agent、Function Calling、Tool-Use、Multi-Step Reasoning、Agent Harness、Agentic Post-Training。
包括英文材料
学历+
AI agent+
大模型+
机器学习+
NLP+
ICML+
ACL+
EMNLP+
CVPR+
ECCV+
ICCV+
NeurIPS+
还有更多 •••
相关职位

logo of alibaba
社招3年以上技术类-算法

Accio Work是阿里巴巴国际数字商业集团阿里国际站内部孵化的一款战略级AI原生应用产品,也是阿里在海外落地的首个企业级AI Agent,通过持续探索Agent、Agent HarnessRL、Memory、Reasoning等前沿技术,自研Agent模型、Agent系统,实现B2B AI Agent跨越式发展。 1、参与Accio Work模型训练与研发,包含而不限于Agent设计、Post-Training、RL等全链路建设; 2、负责AI Native专项能力建设,包括而不限于RAG System、Agent System、Agent Training-Function Call/Reasoning/Agentic RL/Proactive Agent/Tool-Use; 3、探索大模型前沿技术,持续迭代模型能力,落地Agent,推动Accio Work,持续迭代。

更新于 2026-06-10杭州
logo of alibaba
社招3年以上技术类-算法

Accio Work是阿里巴巴国际数字商业集团阿里国际站内部孵化的一款战略级AI原生应用产品,也是阿里在海外落地的首个企业级AI Agent,通过持续探索Agent、Agent Harness、RL、Memory、Reasoning等前沿技术,自研Agent模型、Agent系统,实现B2B AI Agent跨越式发展。 1、研发并优化 Agent 的核心能力模块,包括但不限于自主规划(Planning)、多步推理(Reasoning)、工具/skill调用(Tool Use)、长短期记忆(Memory)及 RAG 增强; 2、复杂任务动态编排:设计并实现高扩展性的Multi-Agent协作框架(如Agent Swarm/Agent Team),支持将模糊的宏观目标递归拆解为原子任务; 3、Long-horizon运行设计:构建结合"工作记忆+全局知识库"的多级存储系统,解决Agent长期运行中的信息遗忘问题,建立跨Agent的共享上下文能力,设计Agent持续进化框架; 4、构建端到端的Agent评测体系,构建生产力场景benchmark,推动Agent在business场景落地; 5、探索落地前沿Agent技术,包含而不限于:Agentic Model、Agentic Benchmark、Agentic RL、Pro-active Agent、Function Calling、Tool-Use、Multi-Step Reasoning、Agent Harness、Agentic Post-Training。

更新于 2026-06-10杭州
logo of meituan
社招3年以上核心本地商业-业

​AI搜索和智能体产品后端系统研发: 1. 设计并实现AI搜索Agent应用,包括Query理解、记忆存储、环境感知等模块的集成与优化。 2. 负责Agentic Search(搜索智能体)技术探索和架构研发,支持多模态(文本、图像、视频)检索与应用创新。 3. 抽象并开发企业级别的AI应用平台,支持Agent相关应用的接入与扩展,确保平台的高可用性和可扩展性。 4. 实现平台的模块化设计,支持快速迭代与功能扩展,满足AI时代本地生活服务领域智能体应用快速发展需求。 5. 与业务部门(如产品、运营团队)协作,将AI搜索能力嵌入现有工作流(如智能问答、个性化推荐)。 6. 负责AI系统的日常运维,包括异常监控、接口优化及用户培训,确保生产环境高效运行。

更新于 2025-04-03北京
logo of ke
社招2年以上效能架构部

1、参与AI大模型和主流AI类框架的调研与评测,主导Agentic框架设计、智能体设计、内部知识库设计与应用。 2、探索和应用最新的人工智能技术,参与构建完整的AI研发工具体系,聚焦提升组织内产研效率。 3、参与组织内AI4SE相关课题的前沿研究,参与相关项目的落地,并协助组织构建内外部技术影响力。

更新于 2025-03-10北京