logo of kuaishou

快手容器云资源运营工程师

社招全职5年以上D7197地点:北京状态:招聘

任职要求


1、本科及以上学历,5年以上工作经验;
2、有较资深的技术背景,熟悉云相关技术架构,熟悉常规业务架构和设计;
3、有云厂商定价计费、大规模资源规划、成本优化工作经验,熟悉资源运营机制和策略,对成本优化治理、资源效率提升有较深的理解和实践;
4、对数字敏感,具备较强的业务沟通能力、项目管理和推动能力、良好的客户服务意识。

工作职责


1、负责公司容器云平台资源的管理和运营,交付业务预算资源,通过技术和运营手段提升整体资源成本效率;
2、负责建立平台各类资源的定价体系,并以成本优化为目标,设计有驱动力的资源成本运营机制,推动业务与平台共同优化资源成本;
3、建设全面清晰的成本效率数据和指标体系,持续跟踪分析识别优化方向、制定优化目标、设计和推进优化方案;
4、设计并研发资源运营平台,规范资源运营流程,提升资源运营效率。
包括英文材料
学历+
系统设计+
相关职位

logo of kuaishou
实习J1014

1、负责容器云平台资源运营领域的设计与开发,优化资源管理效率; 2、基于Kubernetes增强容器云平台的资源管理能力,提升资源利用率; 3、通过技术手段优化资源流转效率,确保资源健康、高效流转; 4、通过数据驱动精细化运营,识别优化目标,落地技术优化方案,提升服务效能。

更新于 2025-03-06
logo of baidu
社招3年以上ACG

-负责 GPU,RDMA 等 IaaS 资源自动化准入和性能评测; -负责 k8s 容器平台建设,关注安全风险、平台高可用、性能等非功能性需求; -负责大模型算法推理和训练相关业务性能调优和问题排查; -负责运维平台和运营平台后端研发等。

更新于 2025-08-05
logo of xpeng
社招

1. 负责小鹏汽车扶摇AI平台的运维工作,为业务平台的可用性负责 2. 调查解决大规模GPU集群管理和大规模AI训练情况下遇到的各种系统/稳定性问题 3. 持续建设AI平台运维体系、在稳定性建设、故障定位、资源运营等方向,推动运维工作自动化、工程化

更新于 2025-01-23
logo of liauto
社招智能与信息技术

1. 负责理想汽车AI平台RDMA网络下大规模GPU集群和并行高速存储的运维工作,为业务平台的可用性负责 2. 调查解决大规模GPU集群管理和大规模AI训练情况下遇到的各种系统/稳定性问题,打造自动化,稳定,易于运维的高速网络和超算集群 3. 深入理解业务,推动AI平台在K8S多集群架构、监控平台、日志等方向的云原生架构演进并落地解决方案 4. 持续建设AI平台运维体系、在稳定性建设、故障定位、资源运营等方向,推动运维工作自动化、工程化