logo of netease

网易资深 AI 工程师(机器学习平台方向)

社招全职3-5年网易游戏(互娱)地点:广州状态:招聘

任职要求


1、熟练掌握 K8s 大规模集群运维管理,精通容器、镜像、存储、网络,熟悉云原生 CI/CD服务网格主流工具链;
2、具备完整 MLOps 平台落地经验,熟悉 KubeflowMLflow、Ray 至少一种生态工具;
3、熟悉 TensorFlow / PyTorch 主流框架,了解分布…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、负责企业级云原生机器学习平台建设,支撑模型开发、训练、部署、上线全生命周期管理;
2、负责机器学习平台核心组件落地与优化,包含分布式训练调度、模型版本管理、模型服务化推理部署;
3、负责 GPU 算力集群精细化运营,通过资源调度、弹性伸缩、异构算力管理,优化大模型训练 / 推理成本;
4、搭建平台监控、告警、可观测体系,保障机器学习集群及业务系统高可用、高稳定;
5、对接算法、业务团队,拆解需求并提供 MLOps 标准化平台解决方案。
包括英文材料
Kubernetes+
CI+
CD+
Service Mesh+
Kubeflow+
MLflow+
还有更多 •••