logo of aliyun

阿里云阿里云智能-容器SRE平台技术专家-杭州/北京/深圳

社招全职5年以上云智能集团地点:北京 | 深圳 | 杭州状态:招聘

任职要求


1、5年以上工作经验;有大规模容器集群研发、运营、稳定性体系建设,研发体系建设经验者优先;
2、熟练使用AI工具和平台,有提升开发效率、优化代码质量、加速问题排查与产品迭代经验者优先;
3、熟练掌握Golang语言,熟悉k8s生态和其中关键组件(如apiser…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、负责阿里云容器服务SRE平台建设工作,负责 K8S 生命周期管理,自愈/弹性/限流/驱逐等稳定性能力相关 operator 研发工作,确保集群稳定性SLA达标;
2、负责建立 K8S 配套运维平台,SRE AI Agent 研发,提升运维效率,确保集群运维能力的可持续发展;
3、负责 K8S 集群日常 oncall 体系和能力建设,端到端定位 K8S 集群的功能和性能问题,解决线上问题;
4、牵头跨部门复杂项目(如业务容器化项目),推进业务和技术目标落地。
包括英文材料
Go+
Kubernetes+
还有更多 •••
相关职位

logo of aliyun
社招5年以上云智能集团

1、负责阿里云容器服务SRE平台建设工作,负责k8s集群全生命周期的日常运维工作,确保集群稳定性SLA达标; 2、负责建立k8s配套运维平台,提升运维效率,确保集群运维能力的可持续发展; 3、负责K8S集群日常oncall体系和能力建设,端到端定位k8s集群的功能和性能问题,解决线上问题; 4、牵头跨部门复杂项目(如业务容器化项目),推进业务和技术目标落地。

更新于 2025-07-22北京|深圳|杭州
logo of aliyun
社招5年以上云智能集团

1. 负责灵骏专属云各计算集群交付运维工作, 并且专属云参与基础运维平台架构设计和建设; 2. 灵骏专属云运维服务体系建设与优化,达成产品稳定性与SLA目标; 3. 制定专属云交付标准, 沉淀运维规范, 通过工具平台提效日常工作; 4. 跟进内外部合作伙伴项目, 优化专属云项目流程; 5. 需要具备一定的创新突破和个人自驱力,善于发现问题,思考并解决问题; 6. 该职位涉及值班响应的职责,在服务级别协议(SLA)时间内做出对客响应,推动客户问题的解决,改善客户体验。

更新于 2025-07-31北京|深圳|杭州
logo of didi
社招技术

1. 负责万亿级别QPS的分布式缓存/存储集群,支撑公司所有产品线的业务需求; 2. 设计、研发高可用、高性能的缓存/存储架构和中间件,应对弹性扩缩容,秒级故障自动切换,异地多活,分布式事务等极具挑战性的工作内容和方向; 3. 优化系统性能,深入内核,提升基础服务相关资源的使用率,增加系统稳定性,保障业务运行; 4. 设计并研发自动化运维平台,提升运维质量和效率,探索运维自动化和智能化技术和方向。

更新于 2025-04-01北京
logo of kuaishou
社招3-5年J0012

1、负责搜索C端业务需求的研发与实现; 2、负责搜索业务基础架构模块的升级与维护,提升搜索产品研发效率; 3、负责搜索容器产品及平台的的底层核心服务能力建设,借助云原生相关技术提升搜索引擎系统的平台化程度,实现搜索引擎的产品化; 4、负责搜索各类平台系统间的整体优化与整合,提升平台系统的稳定性/通用性/研发与使用效率。

更新于 2025-08-07北京