logo of mi

小米容器研发工程师(GPU 方向)

社招全职A149079地点:北京状态:招聘

任职要求


- 熟悉 GPU 相关技术,对 Nvidia GPU 技术有深入了解;
- 有 GPU 池化、虚拟化、调度优化等技术经验者优先;
- 有大规模 G…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


- 负责基于 Kubernetes 的云原生 AI 算力管理能力的建设,包括 GPU 的调度、虚拟化、池化、混部等技术;
- 负责提升 Kubernetes GPU 集群的故障容错能力,提升大规模集群的可靠性;
- 负责推动云原生 GPU 相关技术在业务的落地,提升业务的训练、推理等稳定性和效率;
包括英文材料
Kubernetes+
Docker+
还有更多 •••
相关职位

logo of shein
社招5年以上信息技术类

职位简介 负责在 大规模 Kubernetes 集群 中设计、优化云网络架构与 GPU 虚拟化调度体系,支持 AI、大数据、电商等业务场景。您将深入 Linux 内核、虚拟化与容器网络技术栈,运用 eBPF 等工具提升系统性能与稳定性,并推动跨云平台的资源优化与整合 核心职责 1.设计与优化 Kubernetes 云网络架构(CNI、VPC),确保高性能、低延迟和稳定性。 2.基于 Cilium/Calico 等网络插件进行二次开发,支持跨集群通信和多租户隔离。 3.研究与落地 GPU 虚拟化技术(vGPU、MIG、GPU Passthrough),实现多租户隔离与动态资源调度。 4.应用 eBPF、perf、sysdig 等工具监控和分析网络与 GPU 虚拟化性能瓶颈。 5.在 混合云/多云环境 中实现跨平台网络与 GPU 兼容性优化。 6.开发定制 Kubernetes 设备插件和 Operator,优化容器网络与 GPU 资源管理。

更新于 2025-12-03南京
logo of bytedance
社招A23916

1、负责混合云PaaS方向架构设计、系统开发,容器服务等产品化工作; 2、负责混合云云原生AI套件,GPU架构的研发,提升AI效率、性能。

更新于 2024-11-13杭州
logo of bytedance
社招A170680

1、负责混合云PaaS方向架构设计、系统开发,容器服务等产品化工作; 2、负责混合云云原生AI套件,GPU架构的研发,提升AI效率、性能。

更新于 2024-11-13北京
logo of baidu
社招1年以上ACG

-负责云原生产品 Kubernetes 容器引擎、镜像服务、可观测服务等的设计与研发工作,提升产品竞争力及体验 -负责大规模 AI Infra 云原生底座的设计与研发工作,基于云原生技术打造异构多元芯算力底座,支持国产化信创,支持业务进行大规模训练、容错及弹性推理,构建异构多元芯算力底座 -负责打造现代化的云原生智能运维能力,设计和实现覆盖 AI 场景全栈的故障感知、诊断及自愈能力 -持续提升云原生产品服务及基础设施的稳定性,优化服务性能,提升架构的可扩展性 -探索业界最新技术方向,参与开源社区,提升百度云原生核心竞争力

更新于 2025-04-28北京|上海