logo of aligenie

智能互联阿里云智能-云原生Agentic AI架构师 / Cloud-Native Agentic AI Architect-杭州

社招全职10年以上地点:杭州状态:招聘

任职要求


基础条件
● 计算机科学或相关专业本科及以上学历
● 8年以上云计算或基础设施架构经验,精通云原生技术栈
● 有主导复杂云原生架构方案设计并在生产环境成功落地的完整经历

核心技术能力
● 云原生架构功底:深入理解KubernetesDockerService Mesh等核心技术原理,有大规模集群环境下的架构设计与治理经验
● IaC与工程自动化:精通Infrastructure as Code理念与实践(TerraformPulumi、Crossplane等),有将云操作全面代码化、API化的实战经验
● SRE与可观测性:有大规模云服务的SRE实践经验,精通可观测性技术栈(Prometheus、Grafana、OpenTelemetry等),能设计面向AI工作负载的高可用方案
● 成本治理能力:有FinOps实践经验,理解云资源成本结构,有通…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


岗位定位
当AI Agent开始7x24小时自主运行研发任务,云原生基础设施的使用方式正在被彻底重新定义。我们需要一位能为Agent原生时代设计全新用云范式的架构师。
您不是从零构建云原生底座,而是站在已有的云原生基础设施之上,将云服务、商业化链路、资源调度、稳定性运维等复杂能力,以Agent友好的方式重新封装为高效、可编排、成本最优的标准化接口与工具链。您的核心使命是:让AI Agent能像最优秀的工程师一样,通过IaC、CLI、API自主操控云基础设施,并为7x24小时托管式Agent原生研发模式提供强大的Harness架构与配套的研发流水线。
这是一个定义"Agent如何用云"的前沿架构角色——您将在AgentSRE、FinOps、IaC-as-Agent-Interface等方向上探索行业最佳实践,让基础设施从"人用的工具"进化为"Agent的原生操作系统"。

核心职责
Harness架构升级与治理
● 设计并持续演进面向Agent原生研发模式的Harness架构——定义Agent任务的编排框架、执行沙箱、权限边界与生命周期管理,支撑7x24小时托管式Agent自主运行
● 构建Agent原生的研发流水线与工具链:从代码生成、构建测试、部署发布到线上运维,全链路具备Agent可调用、可观测、可回滚的能力
● 建立Harness架构的治理机制——Agent行为审计、策略门控(Policy-as-Code)、异常熔断与人工接管逻辑,确保自主运行的安全性与可控性
云原生基座封装与高效用云
● 将已有云原生基础服务(计算、存储、网络、中间件等)封装为Agent友好的标准化接口——IaC模块、CLI工具集、声明式API,让Agent能通过自然的工具调用方式完成基础设施操控
● 设计"CLI Anything"能力层:将云平台的运维操作、配置变更、环境管理等全面CLI化和API化,消除Agent操作云资源的认知壁垒与操作门槛
● 主导云服务商业化链路的封装与优化——资源开通、计量计费、多租户隔离、SLA管理等能力的标准化接入,让Agent能自主完成从资源申请到交付的全流程
资源预测与成本治理(FinOps)
● 构建AI驱动的云资源预测与规划体系——基于业务负载模式、Agent任务调度特征,实现资源需求的智能预测与提前调度
● 主导FinOps体系建设:建立多维度成本归因、实时用量监控与预算预警机制,将成本可见性深入到每个Agent任务和每条业务线
● 设计并落地成本优化策略——弹性伸缩策略优化、预留实例与按需实例的智能组合、闲置资源自动回收、跨可用区调度,在保障SLA的前提下持续降低用云成本
稳定性与可观测性体系
● 建立面向Agent原生运行环境的AgentSRE体系——定义Agent服务的SLO/SLI,构建Agent任务执行的全链路可观测性(执行日志、资源消耗、异常检测、性能剖析)
● 设计Agent驱动的智能运维能力:异常自动诊断、故障自愈、容量自动调整,让Agent不仅是"被运维的对象",更是"参与运维的主体"
● 建立云上应用的容灾与高可用方案,覆盖多可用区部署、故障切换、数据一致性保障,确保核心业务的持续稳定运行
组织建设与技术文化
● 搭建兼具云原生工程深度与Agent系统理解力的架构团队,主导核心人才引进与梯队建设
● 推动Agent原生研发范式在团队和公司的落地——建立AGENTS.md等标准化协作规范,让Agent成为研发流程中的一等公民
● 营造追求工程卓越、拥抱自动化与创新的技术文化,积极参与云原生与Agent原生工程领域的行业交流
包括英文材料
学历+
Kubernetes+
Docker+
Service Mesh+
系统设计+
Terraform+
Pulumi+
还有更多 •••
相关职位

logo of aliyun
社招10年以上云智能集团

岗位定位 当AI Agent开始7x24小时自主运行研发任务,云原生基础设施的使用方式正在被彻底重新定义。我们需要一位能为Agent原生时代设计全新用云范式的架构师。 您不是从零构建云原生底座,而是站在已有的云原生基础设施之上,将云服务、商业化链路、资源调度、稳定性运维等复杂能力,以Agent友好的方式重新封装为高效、可编排、成本最优的标准化接口与工具链。您的核心使命是:让AI Agent能像最优秀的工程师一样,通过IaC、CLI、API自主操控云基础设施,并为7x24小时托管式Agent原生研发模式提供强大的Harness架构与配套的研发流水线。 这是一个定义"Agent如何用云"的前沿架构角色——您将在AgentSRE、FinOps、IaC-as-Agent-Interface等方向上探索行业最佳实践,让基础设施从"人用的工具"进化为"Agent的原生操作系统"。 核心职责 Harness架构升级与治理 ● 设计并持续演进面向Agent原生研发模式的Harness架构——定义Agent任务的编排框架、执行沙箱、权限边界与生命周期管理,支撑7x24小时托管式Agent自主运行 ● 构建Agent原生的研发流水线与工具链:从代码生成、构建测试、部署发布到线上运维,全链路具备Agent可调用、可观测、可回滚的能力 ● 建立Harness架构的治理机制——Agent行为审计、策略门控(Policy-as-Code)、异常熔断与人工接管逻辑,确保自主运行的安全性与可控性 云原生基座封装与高效用云 ● 将已有云原生基础服务(计算、存储、网络、中间件等)封装为Agent友好的标准化接口——IaC模块、CLI工具集、声明式API,让Agent能通过自然的工具调用方式完成基础设施操控 ● 设计"CLI Anything"能力层:将云平台的运维操作、配置变更、环境管理等全面CLI化和API化,消除Agent操作云资源的认知壁垒与操作门槛 ● 主导云服务商业化链路的封装与优化——资源开通、计量计费、多租户隔离、SLA管理等能力的标准化接入,让Agent能自主完成从资源申请到交付的全流程 资源预测与成本治理(FinOps) ● 构建AI驱动的云资源预测与规划体系——基于业务负载模式、Agent任务调度特征,实现资源需求的智能预测与提前调度 ● 主导FinOps体系建设:建立多维度成本归因、实时用量监控与预算预警机制,将成本可见性深入到每个Agent任务和每条业务线 ● 设计并落地成本优化策略——弹性伸缩策略优化、预留实例与按需实例的智能组合、闲置资源自动回收、跨可用区调度,在保障SLA的前提下持续降低用云成本 稳定性与可观测性体系 ● 建立面向Agent原生运行环境的AgentSRE体系——定义Agent服务的SLO/SLI,构建Agent任务执行的全链路可观测性(执行日志、资源消耗、异常检测、性能剖析) ● 设计Agent驱动的智能运维能力:异常自动诊断、故障自愈、容量自动调整,让Agent不仅是"被运维的对象",更是"参与运维的主体" ● 建立云上应用的容灾与高可用方案,覆盖多可用区部署、故障切换、数据一致性保障,确保核心业务的持续稳定运行 组织建设与技术文化 ● 搭建兼具云原生工程深度与Agent系统理解力的架构团队,主导核心人才引进与梯队建设 ● 推动Agent原生研发范式在团队和公司的落地——建立AGENTS.md等标准化协作规范,让Agent成为研发流程中的一等公民 ● 营造追求工程卓越、拥抱自动化与创新的技术文化,积极参与云原生与Agent原生工程领域的行业交流

更新于 2026-04-07杭州
logo of didi
社招2-12年技术

Location: 杭州市西湖区西溪谷国际商务中心G座 上海在静安区氪空间 北京在昌平龙泽地铁站滴滴天空之城A座 我们这里是滴滴国际金融最重要的业务和技术底盘,用技术的手段将底盘能力做扎实(即保障资金安全、业务系统高可用), 国际化业务才能在更专注的去追寻业务的高速发展,不用因为技术底盘不扎实而影响业务的发展。如果你对这一块有兴趣,会得到比较快的技术成长 * 国际化业务目前发展势头良好。
 * 资金安全&高可用,预防线上的资损问题和高可用问题,是国际金融业务的核心技术和底盘。
 * 团队氛围开放积极,有机会与国内外各部门业务与技术进行日常交流学习。 职责要求: 1、滴滴国际化金融(IBG FinTech) 技术风险能力建设,包含应急能力、变更防御、红蓝攻防、性能容量、资金安全,构建Fintech技术风险体系; 2、参与重大项目的技术风险保障工作,对技术风险领域进行评审和分析; 3、贴身业务,挖掘业务风险,沉淀技术风险领域标杆,释放研发技术风险投入,更聚焦在业务研发上; 4、明星业务,多底盘充满了挑战和机遇,欢迎来战。

更新于 2025-02-21上海
logo of aliyun
社招5年以上技术类-开发

1. 负责云网络的虚拟化网元底座NFV平台的数据面技术方案,包括基于需求进行技术可行性分析,技术方案选型、功能设计以及技术架构设计等工作 ; 2. 负责云网络的虚拟化网元底座NFV平台的数据面开发,包括需求代码开发、代码Review、测试及上线发布; 3. 负责云网络的虚拟化网元底座NFV平台的稳定性能力建设以及性能优化,包括线上问题处理、问题诊断等,确保系统的安全可靠,提升产品稳定性和性能; 4. 参与云网络虚拟化网元产品的技术预研以及技术规划,跟踪和了解最新的产品技术趋势。

更新于 2025-04-03杭州|南京
logo of aliyun
社招8年以上技术类-综合

制定和实施海外各国家地区的生态用工策略,管理海外供应商,制定和运营国际化的外包商务体系、跟进日常需求管理、管控海外用工风险,满足阿里云的全球化生态用工需求。 1、海外生态用工策略: • 基于海外各国家/地区的法律法规和用工政策,研究全球生态用工领域的全球趋势,结合对云计算业务发展方向的理解,制定海外生态用工策略,为业务提供用工方式的解决方案。 2、海外生态用工供应商管理: • 基于对海外各国家/地区的全球性/本土化供应商的了解,布局、遴选和发展合适的供应商,对供应商进行成本、风险、资源等的日常管理,制定对海外供应商的商务体系(结算、激励等)。 3、海外生态用工需求管理: • 负责各业务在海外各国家/地区的生态用工需求的满足,关注时效性、稳定性、用工质量和用工成本。 4、海外生态用工风险管理: • 协同海外供应商,对海外生态用工的劳动纠纷、海外生态用工的EHS风险事件进行妥善处置。

更新于 2025-04-03杭州