网易AI平台运维工程师
社招全职3年以上网易游戏(互娱)地点:广州状态:招聘
任职要求
1、3年以上游戏AI业务管理经验,熟悉K8S生态及云原生技术栈(服务网格/监控/日志系统)。 2、具备复杂业务迁移能力(如机房搬迁),擅长跨团队协作,熟悉主流公有…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1、负责AI服务全生命周期的治理工作,制定AI服务重保方案及部署规范(日志/监控/故障处理/SLA); 2、参与基础平台多种异构算力加入,涵盖硬件选型、性能压测、云商能力评估等。 3、参与建设AI平台核心能力,包括日志/监控/镜像分发/服务网格等系统,保障重点业务SLA(如游戏AI玩法上线)以及基础算力管理与调度优化。 4、支撑AIGC、游戏AI等核心业务的高效稳定运行。
包括英文材料
Kubernetes+
https://kubernetes.io/docs/tutorials/kubernetes-basics/
This tutorial provides a walkthrough of the basics of the Kubernetes cluster orchestration system.
https://kubernetes.io/zh-cn/docs/tutorials/kubernetes-basics/
本教程介绍 Kubernetes 集群编排系统的基础知识。每个模块包含关于 Kubernetes 主要特性和概念的一些背景信息,还包括一个在线教程供你学习。
https://www.youtube.com/watch?v=s_o8dwzRlu4
Hands-On Kubernetes Tutorial | Learn Kubernetes in 1 Hour - Kubernetes Course for Beginners
https://www.youtube.com/watch?v=X48VuDVv0do
Full Kubernetes Tutorial | Kubernetes Course | Hands-on course with a lot of demos
还有更多 •••