logo of mi

小米容器研发工程师(GPU 方向)

社招全职A149079地点:北京状态:招聘

任职要求


- 熟悉 GPU 相关技术,对 Nvidia GPU 技术有深入了解;
- 有 GPU 池化、虚拟化、调度优化等技术经验者优先;
- 有大规模 GPU 集群建设和调优经验者优先;
- 熟练掌握 Kubernetes/Docker/Linux/Go/Python 等相关技术和语言,编程功底强;

工作职责


- 负责基于 Kubernetes 的云原生 AI 算力管理能力的建设,包括 GPU 的调度、虚拟化、池化、混部等技术;
- 负责提升 Kubernetes GPU 集群的故障容错能力,提升大规模集群的可靠性;
- 负责推动云原生 GPU 相关技术在业务的落地,提升业务的训练、推理等稳定性和效率;
包括英文材料
Kubernetes+
Docker+
Linux+
Go+
Python+
相关职位

logo of bytedance
社招A23916

1、负责混合云PaaS方向架构设计、系统开发,容器服务等产品化工作; 2、负责混合云云原生AI套件,GPU架构的研发,提升AI效率、性能。

更新于 2024-11-13
logo of bytedance
社招A170680

1、负责混合云PaaS方向架构设计、系统开发,容器服务等产品化工作; 2、负责混合云云原生AI套件,GPU架构的研发,提升AI效率、性能。

更新于 2024-11-13
logo of baidu
社招1年以上ACG

-负责云原生产品 Kubernetes 容器引擎、镜像服务、可观测服务等的设计与研发工作,提升产品竞争力及体验 -负责大规模 AI Infra 云原生底座的设计与研发工作,基于云原生技术打造异构多元芯算力底座,支持国产化信创,支持业务进行大规模训练、容错及弹性推理,构建异构多元芯算力底座 -负责打造现代化的云原生智能运维能力,设计和实现覆盖 AI 场景全栈的故障感知、诊断及自愈能力 -持续提升云原生产品服务及基础设施的稳定性,优化服务性能,提升架构的可扩展性 -探索业界最新技术方向,参与开源社区,提升百度云原生核心竞争力

更新于 2025-04-28
logo of quark
社招3年以上技术类-开发

1. 云原生容器平台建设:为智能信息引擎设计、研发高效可靠的容器平台 2. 资源供给优化:能结合复杂多样的业务类型,提出CPU/Memory/GPU等维度资源的评估模型与优化建议,提升资源效率 3. 机器学习工程平台建设:与团队一起解决机器学习领域作业编排、资源弹性等极具挑战性的难题,持续优化平台核心业务流程 4. 通过技术手段和标准化方案、提升平台上客户服务稳定性、可维护性

更新于 2025-08-18