阿里巴巴阿里国际站/Alibaba.com-Agent 算法工程师-Accio-杭州
任职要求
1. 计算机、人工智能或数学相关专业硕士及以上,有扎实的计算机知识和NLP功底 2. 精通PyTorch/TensorFlow等框架,具备大规模语言模型(如LLaMA/Qwen/DeepSeek-R1等)训练与优化经验 3. 熟悉强…
工作职责
我们是阿里巴巴国际数字商业集团-阿里巴巴国际站-Accio算法团队。阿里巴巴国际站是全球最大的跨境B2B数字化贸易平台。 1. 深入探索 LLM 在电商搜索场景中的推理能力与深度研究(Deep Research)模式,优化信息整合与总结效果,打造高效、精准的智能搜索产品,推动 AI 技术在实际应用中的突破; 2. 负责 Accio Agent研发,打造下一代B端采购全新交互体验: a. 设计并实现基于 Reasoning LLM 的 Research Agent,提升搜索结果的理解、推理与结构化总结能力; b. 探索LLM Reasoning技术(如思维链、多步推理),优化复杂查询的Deep Research模式,实现长文本理解与跨文档信息融合; c. 优化网页搜索和自有品商搜索的RAG系统 3. 模型优化: a. 基于蒸馏和RL技术进行Post-training,训练融合CoT和CoA的Agent原生模型,使得模型具备多步推理能力和多步工具调用的能力 b. 探索多模态信息(文本、图像、结构化数据)融合的搜索与生成技术 c. 探索电商场景下Reward模型的定义和构建
Accio是阿里巴巴国际数字商业集团阿里国际站内部孵化的一款战略级AI原生应用产品,也是全球首个B2B AI Agent,通过持续探索Agent、LLM、VLM、RL、Memory、Reasoning、AI Search等前沿技术,自研基座、Agent系统以及AI Search系统,实现B2B AI Agent跨越式发展。 1、负责Agent算法架构设计与效果优化,包括但不限于模型优化(Agentic Post-training/Agentic Infra等)自主规划(Planning)、多步推理(Reasoning)、工具/skill调用(Tool Use)、长短期记忆(Memory)及 RAG 增强; 2、复杂任务动态编排:设计并实现高扩展性的Multi-Agent协作框架(如Agent Swarm/Agent Team),支持将模糊的宏观目标递归拆解为原子任务; 3、Long-horizon运行设计:构建结合"工作记忆+全局知识库"的多级存储系统,解决Agent长期运行中的信息遗忘问题,建立跨Agent的共享上下文能力,设计Agent持续进化框架; 4、构建端到端的Agent评测体系,构建生产力场景benchmark,推动Agent在business场景落地; 5、探索落地前沿Agent技术,包含而不限于:Agentic Model、Agentic Benchmark、Agentic RL、Pro-active Agent、Function Calling、Tool-Use、Multi-Step Reasoning、Agent Harness、Agentic Post-Training; 6、探索Agent Architectures/Structures的上限,在Agent应用研究中最大程度释放模型的能力,研究Self-Evolving AI System,实现Self-Improving Agents。

Accio是阿里巴巴国际数字商业集团阿里国际站内部孵化的一款战略级AI原生应用产品,也是全球首个B2B AI Agent,通过持续探索Agent、LLM、VLM、RL、Memory、Reasoning、AI Search等前沿技术,自研基座、Agent系统以及AI Search系统,实现B2B AI Agent跨越式发展。 1、负责Agent算法架构设计与效果优化,包括但不限于模型优化(Agentic Post-training/Agentic Infra等)自主规划(Planning)、多步推理(Reasoning)、工具/skill调用(Tool Use)、长短期记忆(Memory)及 RAG 增强; 2、复杂任务动态编排:设计并实现高扩展性的Multi-Agent协作框架(如Agent Swarm/Agent Team),支持将模糊的宏观目标递归拆解为原子任务; 3、Long-horizon运行设计:构建结合"工作记忆+全局知识库"的多级存储系统,解决Agent长期运行中的信息遗忘问题,建立跨Agent的共享上下文能力,设计Agent持续进化框架; 4、构建端到端的Agent评测体系,构建生产力场景benchmark,推动Agent在business场景落地; 5、探索落地前沿Agent技术,包含而不限于:Agentic Model、Agentic Benchmark、Agentic RL、Pro-active Agent、Function Calling、Tool-Use、Multi-Step Reasoning、Agent Harness、Agentic Post-Training; 6、探索Agent Architectures/Structures的上限,在Agent应用研究中最大程度释放模型的能力,研究Self-Evolving AI System,实现Self-Improving Agents。
Accio是阿里巴巴国际数字商业集团阿里国际站内部孵化的一款战略级AI原生应用产品,也是全球首个B2B AI Search Agent,通过持续探索Agent、LLM、VLM、RL、Memory、Reasoning、AI Search等前沿技术,自研基座、Agent系统以及AI Search系统,实现全球B2B跨境贸易跨越式发展。 1、研发并优化 Agent 的核心能力模块,包括但不限于自主规划(Planning)、多步推理(Reasoning)、工具/skill调用(Tool Use)、长短期记忆(Memory)及 RAG 增强; 2、复杂任务动态编排:设计并实现高扩展性的Multi-Agent协作框架(如Agent Swarm/Agent Team),支持将模糊的宏观目标递归拆解为原子任务; 3、Long-horizon运行设计:构建结合"工作记忆+全局知识库"的多级存储系统,解决Agent长期运行中的信息遗忘问题,建立跨Agent的共享上下文能力,设计Agent持续进化框架; 4、构建端到端的Agent评测体系,构建生产力场景benchmark,推动Agent在business场景落地; 5、探索落地前沿Agent技术,包含而不限于:Agentic Model、Agentic Benchmark、Agentic RL、Pro-active Agent、Function Calling、Tool-Use、Multi-Step Reasoning、Agent Harness、Agentic Post-Training。
Accio是阿里巴巴国际数字商业集团阿里国际站内部孵化的一款战略级AI原生应用产品,也是全球首个B2B AI Search Agent,通过持续探索Agent、LLM、VLM、RL、Memory、Reasoning、AI Search等前沿技术,自研基座、Agent系统以及AI Search系统,实现全球B2B跨境贸易跨越式发展。 1、参与跨境电商多语言多模态大模型研发,包括而不限于Post-Training、SFT、RLHF、RL、Memory等全链路建设; 2、负责AI Native专项能力建设,包括而不限于RAG System、Agent System、Function Call、Reasoning、Agentic RL、Proactive Agent、LangChain; 3、探索LLM前沿技术,持续迭代自研模型能力,推动Native AI Agent落地,重构B2B跨境贸易交互体验。