logo of aliyun

阿里云阿里云智能-专有云平台智能升级研发专家-专有云(北京/杭州)

社招全职5年以上云智能集团地点:北京 | 杭州状态:招聘

任职要求


1,计算机、人工智能或相关专业本科及以上学历,具备扎实的编程基础,精通 Python,Jave 或 Go,熟悉异步编程与高并发服务开发。
2,具备智算/云产品架构经验:熟悉智算中心(AIDC)基础设施、异构算力(GPU/NPU)调度及云原生技术(Docker/K8s)。对云产品的全生命周期管理、版本演进及大规模集群的平滑升级有深刻的理解和实战经验。
3,AI Agent与智能化工程能力:熟练掌握LangChain、AutoGen或阿里云百炼等主流AI编排框架;深入理解Agent(智能体)的核心架构(如ReAct、Plan-and-Execute),具备将AI能力深度融入云产品控制面(Control Plane…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1,平台升级智能化:专有云平台“热升级数字人(智能体)”的研发与落地。结合可观测数据,建立AI智能体的SLI/SLO/SLA健康管理体系,通过巡检、诊断、预案与自愈等自动化手段,持续提升升级质量与自动化自主化水平,切实降低升级成本。
2,智算云产品升级体系设计:负责专有云及智算基础设施(GPU/NPU集群、超节点服务器等)的整体升级模式与架构体系设计。推动云产品从传统的“资源交付”向“任务式交付”与“AI Native智能化”转型,构建适应Agentic时代的高可用、高弹性升级底座。
3,AI Native全链路升级可观测体系建设:构建面向大模型与AI Agent的统一升级可观测平台(Metrics、Log、Event、Trace)。突破传统监控瓶颈,实现从底层算力资源、云平台组件到上层AI智能体(Agent)决策链路的端到端可观测,性能分析,精准定位升级过程中的性能瓶颈与异常根因。
4,前沿技术探索与架构演进:保持对AI领域(如多智能体协作、Deep Research、Agentic Cloud等)及云原生技术前沿的高度敏感。负责将业界新的技术理念、论文成果或开源项目转化为可落地的技术方案,持续推动团队技术栈的迭代与架构的长期演进。
包括英文材料
学历+
Python+
Go+
高并发+
Docker+
Kubernetes+
AI agent+
还有更多 •••