阿里巴巴业务技术-Agent算法工程师-记忆召回
任职要求
1、计算机/人工智能/数学等相关专业硕士及以上学历(博士及顶会论文发表者优先); 2、有 2 年以上传统搜索引擎召回优化相关经验,具备精细化提升搜索召回效果的技术能力,熟悉图引擎和图召回者优先; 3、精通 Python 及 PyTorch/TensorFlow 等框架,具备 Qwen、Llama…
工作职责
关于我们 我们在淘天复杂业务场景中打造“可持续进化”的 AI Agent:不仅能回答问题,更能会学、记住、自我纠错。团队聚焦 Agent 记忆系统 + AI 搜索/知识召回 两大方向,在客服、商家经营助理等高复杂场景应用落地,形成了从数据闭环、训练体系到线上评测与迭代的完整链路。 我们相信记忆是下一代 Agent 的分水岭:我们已搭建自研记忆架构,并在多个内部/公开基准上取得领先效果;期待你一起把“记忆”从技术能力升级为业务护城河。 你将获得什么 ● 前沿研究与真实业务同频:围绕记忆结构设计、记忆更新机制、Memory RL/记忆 Agent 等方向做系统化探索,并能快速进入线上验证闭环。 ● 可发挥的技术纵深:从表征/倒排/图索引到多跳检索与路径级训练,从 RAG 到 Agent 记忆规划,既能做算法突破,也能做系统化落地。 ● 高影响力的场景与数据闭环:直接面向真实用户与高并发线上系统,问题复杂但反馈链路清晰,能快速沉淀可复用的技术资产与方法论。 ● 开放的成长路径:支持多元化方向发展,鼓励对外分享与论文/专利沉淀。 岗位职责 1、主导基于大模型的 AI Agent 全生命周期研发,包括通用型及垂直领域 AI Agent 的应用架构设计、数据构建、模型训练与评测; 2、运用 SFT、RL 等 Post-training 训练方法,提升大模型在自主规划(Planning)、多步推理、RAG 增强生成、工具调用、数据问答等方面的能力; 3、重点探索 AI 搜索技术在电商经营知识问答场景的应用落地,优化表征/倒排/图索引的知识召回效果,通过路径级数据的 SFT 训练 + 强化学习微调,提升Agent自主搜索与精准问答能力; 4、围绕记忆结构与记忆更新机制开展核心研发:探索前沿 Memory RL 方案,设计高效记忆 Agent 优化更新策略,并推动团队原创记忆图结构在业务中的规模化落地; 5、持续优化 Agent 算法与系统架构,构建面向问答和 AI 搜索场景的端到端智能体评测体系,开发自动化评估工具与多维评价指标,提升系统性能与效率。
职位描述 1、负责构建Agent核心逻辑,包括但不限于任务规划和编排,工具调用,mcp,skill,多轮对话管理,记忆,RAG,上下文工程,多智能体协同。 2、负责业务场景和商用场景的agent搭建,提供可用于生产的智能助手。 3、负责构建长短期记忆架构,解决长上下文的遗忘与注意力发散问题,提升用户在长期交互中的沉浸感,一致性。 4、负责构建文本的RAG系统,包括检索,召回,文本处理,等主要模块开发和优化。 5、负责Agent工具开发,接入搜索,浏览器,虚拟机等外部API、MCP和skills。 6、负责设计和调优Prompt,针对不同产品需求进行定制化优化。 7、负责针对产品需求设计科学,严谨的可量化指标和测试方案。
我们是阿里巴巴国际数字商业集团的智能技术团队,负责阿里巴巴旗下多个国际化电商平台(如 AliExpress、Lazada、Trendyol 等)的搜索、推荐、广告、用户增长等核心技术。团队致力于将最前沿的 AI 技术——包括大模型、多模态理解、智能体(Agent)系统等——与国际化电商业务深度结合,为全球用户打造更智能、更个性化的购物体验,同时赋能百万商家实现高效、自动化的经营决策。 选择加入我们,意味着你将投身于高速发展的全球化电商业务,参与构建下一代以 AI 为核心的智能商业基础设施。在这里,你不仅会推动传统算法系统的演进,还将主导面向未来的 智能体(Agent)体系 建设,打造具备感知、推理、决策与执行能力的自动化智能系统。你将有机会负责以下核心工作: 支持业务快速迭代:高效推进来自搜索、推荐、广告、用户增长等领域的多样化产品需求落地,支撑多语言、多市场、多场景的业务敏捷创新。 系统架构设计与优化:主导搜索、推荐、广告引擎的高可用、高并发架构设计,支持全球用户低延迟访问,并为智能体(Agent)系统的实时感知与响应能力提供底层支撑。 性能调优与资源效率提升:针对召回排序、模型训练与推理、特征计算等关键链路,进行深度工程优化(如分布式计算加速、内存管理、GPU/TPU 资源调度等),提升算法迭代效率与系统吞吐能力,为大规模 Agent 部署提供高性能基础设施。 工程平台体系建设:构建算法与工程协同的标准化平台,包括实时特征平台、在线推理服务框架、AB 实验平台、策略仿真环境等,支持从传统模型到智能体(Agent)的全生命周期开发与效果验证。 大模型与智能体(Agent)工程落地: 负责生成式 AI 技术的工程化落地,包括大模型训练、推理加速、多模态内容生成等; 主导 电商智能体(E-commerce Agent)系统 的设计与实现,构建具备任务规划、工具调用、多轮交互、自主决策能力的智能体架构; 探索基于大模型的自动化运营、智能客服、个性化导购、商家助手等 Agent 应用场景,推动 AI 从“辅助”走向“自主执行”。 加入我们,你将站在 AI 与全球电商融合的最前沿,用技术重新定义人、货、场的连接方式,共同打造一个由智能体驱动的下一代国际化电商平台。
负责AI应用探索类项目,工作包括/不限于:在线系统架构设计、在/离线数据生产链路设计、业务转化效果优化方案设计、系统性能优化、算法工程技术攻坚等 负责大模型应用基础组件的建设,工作包括/不限于:记忆组件、对话分析组件、知识库等的建设 承担大模型的落地开发工作,包括但不限于RAG、大模型微调、指令数据构建、模型Fine-tuning、Prompt Engineering、模型评测等研发,提升大模型的产品化能力,促进AI基础设施的构建; 跟进公司内外AI agent方向的技术演进,开展前瞻性技术研究,探索将新技术、新理念融于入现有系统的可能性,推动公司agent技术的持续创新和竞争力提升。

1.大模型应用开发:负麦基于主流开源/闭源大模型进行应用落地,包括问答系统、智能助手、知识检索、文档处理等;并与产品、前端、后端、数据团队紧密协作,推动算法模型在真实业务中的部署与落地。 2.RAG 系统优化:主导通用型 RAG(Retrieval-Augmented Generation)系统的构建与效果优化,包括召回、排序、长文本处理、多文档合成等关键环节。 3.Agent 框架开发:研究和实现多 Agent 协作框架,提高 Agent 在复杂任务中的稳定性与执行效果,探索如任务分解、工具使用、状态记忆等机制。 4.模型效果调优:结合业务场景,设计 Prompt、微调、评测等策略,提升大模型在特定任务中的表现。 5.技术积累与分享:沉淀可复用的模型应用框架、调优经验和评估指标,推动团队整体技术能力提升。