阿里巴巴业务技术-Agent infra工程师-杭州

社招全职2年以上2026-04-02地点：杭州状态：招聘

扫码手机上打开

任职要求

1. 具备3年以上SRE/后端经验，能独立完成线上故障定位、值班体系建设与复盘改进闭环。具有高并发大流量的复杂分布式系统治理、保障经验者优先。
2. 熟悉云原生与可观测技术栈（K8s、Prometheus、日志与Tracing），能建立统一监控与告警体系。
3. 熟悉发布、灰…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1. 建立并落地核心Agent的稳定性保障体系，覆盖SLO/告警/应急/复盘与演练。
2. 建设Agent端到端可观测性与治理面能力，统一指标口径、链路追踪、日志与审计。
3. 推动变更治理与发布门禁，结合Evals回归、灰度对照与一键回滚降低上线风险。
4. 治理质量、成本与安全风险，建设漂移监测、预算/配额、限流熔断降级与越权检测。
5. 参与一站式Agent平台可靠性设计与能力产品化，并与AI Infra协同完成推理侧定位与容量治理。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

高并发+

分布式系统+

Kubernetes+

Prometheus+

还有更多 •••

登录查看完整学习资料

相关职位

业务技术-Agent infra工程师-杭州

社招2年以上

1. 建立并落地核心Agent的稳定性保障体系，覆盖SLO/告警/应急/复盘与演练。 2. 建设Agent端到端可观测性与治理面能力，统一指标口径、链路追踪、日志与审计。 3. 推动变更治理与发布门禁，结合Evals回归、灰度对照与一键回滚降低上线风险。 4. 治理质量、成本与安全风险，建设漂移监测、预算/配额、限流熔断降级与越权检测。 5. 参与一站式Agent平台可靠性设计与能力产品化，并与AI Infra协同完成推理侧定位与容量治理。

更新于 2026-04-02杭州

业务技术-Agent Infra平台研发工程师-杭州

社招5年以上

1. 负责 AI Agent 基础平台（Agent Infra）的设计与实现，确保系统稳定、可扩展，支持多种架构的Agent运行。 2. 参与 AI Agent 核心组件与相关产品的研发，支持业务团队进行快速迭代。 3. 与产品、业务团队密切协作，识别Agent场景需求与痛点，并给出技术方案及架构优化建议。 4. 负责 Agent 优化链路与模型评估体系，利用 Context Engineering、SFT、RL 等算法提升 Agent 性能。 5. 跟踪 AI Agent 生态技术发展，评估并引入前沿技术（如 LLM、MCP、A2A 协议），推动平台发展。

更新于 2026-01-16杭州

业务技术-Agent应用算法工程师-供给智能

社招2年以上

关于我们我们致力于把大模型 Agent 打造成“能解决业务问题的生产力系统”：不仅会对话，更能规划、推理、调用工具、洞察数据，在多个业务场景形成端到端闭环。团队长期坚持“学术先进性 + 工程可落地 + 指标可验证”三位一体，推动多项技术在真实业务中规模化应用，并持续输出可复用的训练与评测体系。你将获得什么 ● 覆盖多模型、多尺寸的系统化训练能力：团队训练资源充足，能在不同架构/不同规模模型上完成微调、对齐与能力专项提升，并形成可复用的训练范式。 ● 论文级问题 + 业务级验证：我们鼓励你做可发表的创新，同时确保每个方向都能进入线上评测与业务闭环，真正做到有创新、有落地、有收益。 ● 完整的 Agent RL 研发舞台：从环境构建、Reward 设计、策略优化到自动评估工具链，你将能主导一条完整的 RL-Driven Agent 能力演进路径。 ● 个人影响力与成长：支持对外分享、论文/专利沉淀与跨团队共建岗位职责 1、主导基于大模型的 AI Agent 全生命周期研发，包括通用型及垂直领域 AI Agent 的应用架构设计、数据构建、模型训练与评测； 2、运用 SFT、RL 等 Post-training 训练方法，提升大模型在自主规划（Planning）、多步推理、RAG 增强生成、工具调用、数据问答等方面的能力； 3、构建 Agent RL 所需的环境与训练方法，设计合理的 Reward Function 和优化函数，激发模型在垂直领域内的泛化性，探索无/少人类专家样本依赖的 Agent 优化方案； 4、跟踪 LLM 与 Agent 领域的国际前沿技术动态，推动技术创新在业务场景中的落地应用，重点突破工具集成复杂推理、数据洞察、AI 搜索等方向的应用创新； 5、持续优化 Agent 算法与系统架构，构建端到端智能体评测体系，开发自动化评估工具与多维评价指标，提升系统性能与效率。

更新于 2026-07-06杭州

业务技术-Agent开发工程师-会员技术

社招3年以上

我们是淘宝会员技术-平台&省钱卡技术团队，长期深耕淘天账号和用户信息管理中台，并同时负责淘天集团省钱卡、大会员等业务。团队目前正致力于通过AI Agent技术解决业务和技术的痛点和难点问题，包括但不限于： 1. 省钱卡业务 Agent：目标驱动的自主业务分析 Agent，能够发现和洞察业务问题、探索优化策略、自主进行线上试验并形成持续迭代的循环，提升业务增长。 2. 省钱卡端到端 AI 研发 Agent：面向省钱卡业务代码的 Agentic Coding 系统，覆盖“需求理解 → 规划 → 编码 → 测试 → 提交”全链路，让 AI 成为真正的研发参与者。 3. 平台级 CR Agent：面向代码评审 / 变更风险的 Agent，通过知识工程（变量生命周期树、中间件知识、定向 Skill）+ Multi-Agent 编排 + 定制 MCP 工具，提升代码评审中BUG的发现率。你加入后，将根据兴趣和团队需要，参与到以下一个或多个 Agent 系统的建设中。 1 业务/分析型 Agent 建设，负责省钱卡探索 Agent的架构设计与工程实现，实现 ReAct / Plan-and-Execute / Multi-Agent 协作、Tool/Function Calling、记忆系统（短期/长期）、RAG 检索增强等Agent 核心模块，打通数据链路，构建业务洞察和分析SKILL，并建设 Agent 可观测性、评测与实验基建，实现“自主假设生成 → 数据验证 → 问题树演化 → 可执行洞察输出”的完整分析飞轮。 2 端到端 AI 研发 Agent 建设，设计并落地面向省钱卡业务的 Agentic Coding Harness工程体系（工具调用、验证闭环（测试/构建/类型检查）、沙箱安全、Human-in-the-loop等），实践Spec-Driven 流程，构建AI Friendly的业务&技术知识库建设等。 3 CR Agent 设计与实现，包括构建面向代码评审的知识工程（变量生命周期树、中间件知识等），开发领域SKILL和MCP 工具（AST/Tree-sitter/xmlParse/jq 等），实践SFT与Agentic RL等后训练，并建立 CR Agent 的评测体系，持续优化Agent效果与成本。 4 前沿跟踪与研究，持续跟踪和研究 Agent 架构、Loop Engineering、Agent自进化、Agentic RL（GRPO/DPO/PPO）、后训练数据构建、后训练技术、RAG 优化等方向，并转化为工程实践。

更新于 2026-07-16杭州