阿里云阿里云智能-容器SRE平台技术专家-杭州/北京/深圳
社招全职5年以上云智能集团地点:北京 | 深圳 | 杭州状态:招聘
任职要求
1、5年以上工作经验;有大规模容器集群研发、运营、稳定性体系建设,研发体系建设经验者优先; 2、熟练使用AI工具和平台,有提升开发效率、优化代码质量、加速问题排查与产品迭代经验者优先; 3、熟练掌握Golang语言,熟悉k8s生态和其中关键组件(如apiser…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1、负责阿里云容器服务SRE平台建设工作,负责 K8S 生命周期管理,自愈/弹性/限流/驱逐等稳定性能力相关 operator 研发工作,确保集群稳定性SLA达标; 2、负责建立 K8S 配套运维平台,SRE AI Agent 研发,提升运维效率,确保集群运维能力的可持续发展; 3、负责 K8S 集群日常 oncall 体系和能力建设,端到端定位 K8S 集群的功能和性能问题,解决线上问题; 4、牵头跨部门复杂项目(如业务容器化项目),推进业务和技术目标落地。
包括英文材料
Go+
https://www.youtube.com/watch?v=8uiZC0l4Ajw
学习Golang的完整教程!从开始到结束不到一个小时,包括如何在Go中构建API的完整演示。没有多余的内容,只有你需要知道的知识。
Kubernetes+
https://kubernetes.io/docs/tutorials/kubernetes-basics/
This tutorial provides a walkthrough of the basics of the Kubernetes cluster orchestration system.
https://kubernetes.io/zh-cn/docs/tutorials/kubernetes-basics/
本教程介绍 Kubernetes 集群编排系统的基础知识。每个模块包含关于 Kubernetes 主要特性和概念的一些背景信息,还包括一个在线教程供你学习。
https://www.youtube.com/watch?v=s_o8dwzRlu4
Hands-On Kubernetes Tutorial | Learn Kubernetes in 1 Hour - Kubernetes Course for Beginners
https://www.youtube.com/watch?v=X48VuDVv0do
Full Kubernetes Tutorial | Kubernetes Course | Hands-on course with a lot of demos
还有更多 •••
相关职位
社招5年以上云智能集团
1、负责阿里云容器服务SRE平台建设工作,负责k8s集群全生命周期的日常运维工作,确保集群稳定性SLA达标; 2、负责建立k8s配套运维平台,提升运维效率,确保集群运维能力的可持续发展; 3、负责K8S集群日常oncall体系和能力建设,端到端定位k8s集群的功能和性能问题,解决线上问题; 4、牵头跨部门复杂项目(如业务容器化项目),推进业务和技术目标落地。
更新于 2025-07-22北京|深圳|杭州
社招5年以上云智能集团
1. 负责灵骏专属云各计算集群交付运维工作, 并且专属云参与基础运维平台架构设计和建设; 2. 灵骏专属云运维服务体系建设与优化,达成产品稳定性与SLA目标; 3. 制定专属云交付标准, 沉淀运维规范, 通过工具平台提效日常工作; 4. 跟进内外部合作伙伴项目, 优化专属云项目流程; 5. 需要具备一定的创新突破和个人自驱力,善于发现问题,思考并解决问题; 6. 该职位涉及值班响应的职责,在服务级别协议(SLA)时间内做出对客响应,推动客户问题的解决,改善客户体验。
更新于 2025-07-31北京|深圳|杭州
社招技术
1. 负责万亿级别QPS的分布式缓存/存储集群,支撑公司所有产品线的业务需求; 2. 设计、研发高可用、高性能的缓存/存储架构和中间件,应对弹性扩缩容,秒级故障自动切换,异地多活,分布式事务等极具挑战性的工作内容和方向; 3. 优化系统性能,深入内核,提升基础服务相关资源的使用率,增加系统稳定性,保障业务运行; 4. 设计并研发自动化运维平台,提升运维质量和效率,探索运维自动化和智能化技术和方向。
更新于 2025-04-01北京