蚂蚁金服蚂蚁集团-AIops智能体算法工程师-杭州

社招全职3年以上技术类-算法2026-07-24地点：杭州状态：招聘

扫码手机上打开

任职要求

1、计算机、人工智能或相关专业，本科及以上学历，能够独立完成复杂工程问题的拆解与交付。
2、熟悉主流AI Agent框架（Langchain等），有框架深度使用或二次开发经验。
3、熟悉使用AI Coding工具（Codex、Claude Code等），能高效提升开发效率。
4、在代码分析、代码检索，以及知识图谱构建、关系抽取、知识检索等方向有相关经验。
5、产出需在论文、开源、比赛成绩、项目上满足1条或者多条。
● 5a、顶级学术会议发表过相关论文，或开源过 Agent 框架与评测集者；
● 5b、有开源项目影响力…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1. 面向变更防控、应急定位等核心风险业务场景，构建并持续演进风险智能 Agent 框架，主导 Agent 的设计、开发与迭代优化，推动其在真实运维与研发流程中稳定落地，解决变更风险识别、故障应急定位等实际问题。
2. 深入开展 Agent 工程能力建设，围绕长任务的上下文管理与压缩、多 Agent 协作与编排、Skill 抽象与复用、跨会话记忆系统设计、自我反思与自动纠错等方向持续演进，结合 Claude Code、Hermes Agent 等先进架构实践，不断提升智能体在复杂业务场景下的可靠性与泛化能力。
3. 围绕代码和配置，建设通用智能分析能力，包括代码分析、代码检索等，为智能体提供稳定的环境理解与决策支撑；推动代码知识图谱与 Agent 框架及风险业务场景深度融合，以任务成功率、分析质量和业务效果为目标持续优化能力。
4. 优化在线服务性能，提升系统并发能力与可用性；结合风险业务的高实时、低容错、一致性、可审计等要求，探索 不同agent执行模式，兼顾执行速度与深度推理能力。
5. 基于真实业务任务沉淀高质量数据，建设智能体持续进化闭环，包括数据蒸馏、仿真环境、评测与优化体系，探索 Agentic RL 等方法在故障定位、变更分析和复杂决策任务中的应用，持续提升智能体效果。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

AI agent+

LangChain+

SIGKDD+

还有更多 •••

登录查看完整学习资料

相关职位

千问事业部-AI Ops研发专家-运维智能体方向

社招3年以上技术类-开发

1.负责基于 LLM 和 Agent 框架（如 LangGraph, CrewAI, AutoGPT 等）设计并实现 SRE 智能体，构建具备感知、推理、规划、执行与反思能力的闭环运维系统； 2.深度拆解故障排查、容量规划、性能调优等运维场景，利用大模型重构工作流，实现从异常检测、根因分析到故障自愈的端到端自动化； 3.负责构建运维领域专业知识库，优化 RAG链路，提升 Agent 在处理复杂领域问题时的准确性和专业度； 4.探索多 Agent 协同机制，设计并实现针对复杂运维任务的任务分发、角色协作与共识协议； 5.持续优化智能运维平台的性能与扩展性，确保在高并发、超大算力规模环境下 AI 决策的实时性与稳定性。

更新于 2026-07-24杭州|广州

千问事业部-AI Ops研发专家-运维智能体方向

社招3年以上技术类-开发

更新于 2026-04-06杭州|广州

阿里云智能-AIOps 前端技术专家-杭州

社招5年以上云智能集团

1、AI 应用可观测建设，从应用监控到应用评估，深入 AI 原生应用效果； 2、AI 应用数据平台建设，含行为数据 x AI 创新探索，为用户体验监控破局，提升产品价值和客户黏性； 3、深度参与 AI 能力的工程化落地，包括模型调用、Prompt 工程、AI 应用验证/评估、AI Agent 等技术方案； 4、解决复杂技术问题，进行体验优化、性能优化和稳定性改进。

更新于 2026-02-10杭州

阿里云智能-AIOps Agent 研发专家-ABM 平台研发

社招5年以上云智能集团

我们正在招聘 AIOps Agent 研发专家，作为核心研发参与阿里云计算平台下的运维平台 Agent 体系的架构设计与系统实现，服务阿里云计算平台产品，把传统工具化、流程化的运维能力研发升级为 AI Native 的平台化、自动化、自主化产品。工作职责： 1. 负责运维平台 Agent 工程链路研发，让 Agent 在真实运维场景下做到稳定可控、可观测、可治理。 2. 基于大模型、RAG 与自动化编排，端到端研发异常处置、机器自愈、变更风险拦截、Context 底座等，把目前碎片化、流程化的运维能力重构为完整的 Agent 协同产品。 3. GitOps × IaC 变更能力建设：负责 GitOps x Iac 的变更能力建设，覆盖应用与基础设施资源，保障不同产品形态下的统一管控模型与大规模变更场景下的稳定性，并具备 Agent 协同执行的能力。 4. 中台 AI 自主开发能力研发：研发可供 AI 自主行动的中台与 SRE 服务环境，推动中台需求开发与交付向 AI Native 模式演进，让 AI 在真实工程语境下安全完成闭环并保证可审计、可回滚。 5. 平台关键能力研发与稳定性保障：承接运维平台的关键模块的设计、开发、演进与稳定性治理，保障关键服务可用性、监控覆盖与交付质量，并按横向项目节奏推进代码合一、独立部署等研发要求。 6. 与 SRE、算法团队一起，协同识别效率瓶颈与稳定性风险，主导 AI Native 工程方法与研发范式在团队内沉淀。

更新于 2026-06-11杭州