logo of alibaba

阿里巴巴智能算法产品事业部-AI Agent 算法工程师-广告算法

社招全职2年以上地点:北京状态:招聘

任职要求


1. 工作经验: 计算机、人工智能或相关专业本科及以上学历,2 年以上 AI 算法相关工作经验,具备扎实的深度学习理论基础。
2. AgentLLM 实战经验:
    ● 精通 AI Agent 开发范式,有复杂多智能体系统设计与落地经验;
    ● 深入理解 LLM 底层原理,具备 SFT、DPO 等大模型微调与对齐的完整项目经历;
    ● 熟悉 RAG 技术栈,有处理大规模私有数据检索与融合的实际案例。
3. 强化学习与决策优化: 熟悉强化学习(RL)基本理论,有将 RL 应用于序列决策、推荐系统或广告竞价场景经验者优先。
4. 工程与架构能力: 精通 Pyth…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


作为阿里妈妈 AI Agent 和客户成长团队的核心技术成员,你将主导下一代广告智能体系统的架构演进与策略创新。我们致力于将前沿的 LLM 与多智能体技术深度融入大规模商业决策场景,通过构建具备高度自主性与复杂推理能力的 Agent 体系,为广告主提供从精准投放到客户全生命周期运营的智能化闭环解决方案。在这里,你将探索 AI Agent 在动态博弈、长期记忆及个性化交互中的技术边界,驱动业务实现从自动化向智能化的跨越式增长。

岗位职责
1. Agent 核心架构设计与演进: 负责高并发、低延迟的 Agent 系统底层架构设计。基于状态机(StateGraph)构建复杂的多智能体协作工作流,优化任务拆解、路由分发及自我反思(Reflexion)机制,确保系统在复杂商业场景下的鲁棒性与可解释性。
2. 策略模型迭代: 结合 RLHF/DPO 等对齐技术与强化学习(RL)算法,持续迭代 Agent 的决策策略模型。针对广告投放与客户运营场景,设计基于长期回报(Long-term Reward)的优化目标,提升 Agent 在动态环境下的自适应能力与转化效果。
3. Memory 体系建设与知识增强: 主导 Agent 长期记忆(Long-term Memory)与短期上下文管理系统的研发。构建基于向量检索与图谱融合的双轨记忆架构,实现用户画像、历史交互及行业知识的精准召回与实时更新,解决长周期对话中的遗忘与幻觉问题。
4. 业务闭环落地与工程化实践: 推动 Agent 技术在广告全链路的规模化落地,负责从原型验证到生产环境的工程化迁移。通过 MCP 协议标准化外部工具集成,建立全链路可观测性体系,利用 A/B 测试与因果推断方法量化 Agent 对业务增长的贡献。
5. 前沿技术探索与预研: 跟踪 AI Agent 领域的最新学术进展,并将其转化为可落地的技术方案,持续提升团队在智能决策领域的技术壁垒。
包括英文材料
学历+
算法+
深度学习+
AI agent+
大模型+
智能体+
系统设计+
SFT+
RAG+
还有更多 •••