快手容器云资源运营工程师
社招全职5年以上D7197地点:北京状态:招聘
任职要求
1、本科及以上学历,5年以上工作经验; 2、有较资深的技术背景,熟悉云相关技术架构,熟悉常规业务架构和设计; 3、有云厂商定价计费、大规模资源规划、成本优化工作经验,熟悉资源运营机制和策略,对成本优化治理、资源效率提升有较深的理解和实践; 4、对数字敏感,具备较强的业务沟通能力、项目管理和推动能力、良好的客户服务意识。
工作职责
1、负责公司容器云平台资源的管理和运营,交付业务预算资源,通过技术和运营手段提升整体资源成本效率; 2、负责建立平台各类资源的定价体系,并以成本优化为目标,设计有驱动力的资源成本运营机制,推动业务与平台共同优化资源成本; 3、建设全面清晰的成本效率数据和指标体系,持续跟踪分析识别优化方向、制定优化目标、设计和推进优化方案; 4、设计并研发资源运营平台,规范资源运营流程,提升资源运营效率。
包括英文材料
学历+
系统设计+
https://roadmap.sh/system-design
Everything you need to know about designing large scale systems.
https://www.youtube.com/watch?v=F2FmTdLtb_4
This complete system design tutorial covers scalability, reliability, data handling, and high-level architecture with clear explanations, real-world examples, and practical strategies.
相关职位
实习J1014
1、负责容器云平台资源运营领域的设计与开发,优化资源管理效率; 2、基于Kubernetes增强容器云平台的资源管理能力,提升资源利用率; 3、通过技术手段优化资源流转效率,确保资源健康、高效流转; 4、通过数据驱动精细化运营,识别优化目标,落地技术优化方案,提升服务效能。
更新于 2025-03-06
社招3年以上ACG
-负责 GPU,RDMA 等 IaaS 资源自动化准入和性能评测; -负责 k8s 容器平台建设,关注安全风险、平台高可用、性能等非功能性需求; -负责大模型算法推理和训练相关业务性能调优和问题排查; -负责运维平台和运营平台后端研发等。
更新于 2025-08-05
社招
1. 负责小鹏汽车扶摇AI平台的运维工作,为业务平台的可用性负责 2. 调查解决大规模GPU集群管理和大规模AI训练情况下遇到的各种系统/稳定性问题 3. 持续建设AI平台运维体系、在稳定性建设、故障定位、资源运营等方向,推动运维工作自动化、工程化
更新于 2025-01-23