logo of tencent

腾讯腾讯云-虚拟化研发工程师-AI机型研发方向(上海)

社招全职3年以上CSIG技术地点:深圳状态:招聘

任职要求


1.3年以上相关工作经验;
2.深入理解KVM虚拟化技术,具备内核开发,性能分析能力,Debug能力;
3.深入理解IOMMU,PCIe,硬件辅助虚拟化技术,熟悉GPU/NPU/DPU相关的技术解决方案;
4.深入理解主流GPU/NPU…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1.虚拟化平台异构计算方向功能、性能优化;
2.异构计算方向虚拟化能力适配;
3.异构计算方向虚拟化相关软件生态适配;
4.前瞻性技术预研。
包括英文材料
内核+
相关职位

logo of kuaishou
社招3-5年J0011

团队负责快手可灵在线推理服务的GPU资源利用,为 AI 视频生成模型提供算力基石。GPU集群算力规模大,且随着可灵业务持续快速增长中,团队积累了丰富的 GPU 资源调度与优化经验,旨在打造覆盖多场景、多地域的万卡级 GPU 算力平台。其中,在推理服务、模型训练等核心场景,通过算力调度、弹性伸缩、虚拟化混部等技术实现了GPU利用率的高水位。 1、参与GPU利用率下钻指标的建设及分析,挖掘潜在的GPU利用率提升手段; 2、通过算力调度策略,协同同步业务的资源供给; 3、参与虚拟化混部技术方案的架构设计和核心代码开发,协同推动方案落地,通过混部和潮汐资源提升面向业务的GPU供给能力; 4、参与模型推理执行优化,设计模型推理执行流水线。

更新于 2026-04-09北京
logo of mi
社招A149079

- 负责基于 Kubernetes 的云原生 AI 算力管理能力的建设,包括 GPU 的调度、虚拟化、池化、混部等技术; - 负责提升 Kubernetes GPU 集群的故障容错能力,提升大规模集群的可靠性; - 负责推动云原生 GPU 相关技术在业务的落地,提升业务的训练、推理等稳定性和效率;

更新于 2025-05-12北京
logo of aliyun
实习阿里云2026届

阿里云持续推进AI技术深化战略布局,围绕AI 和云计算的基础设施建设、AI基础模型平台、企业级AI应用方向构建核心场景。为此,我们正积极招募优秀人才: 负责云计算和大数据基础技术研发,包括不限于以下方向: 1、云基础设施技术,包括研发面向百万级服务器的网络(如RDMA、可编程芯片)、服务器(如异构计算)、数据中心,以及构建超大规模的基础设施智能化运维体系(如AIOps); 2、虚拟化技术,包括XEN、KVM等开源技术的改进,以及也包括我们自研的SDN、VPC等网络虚拟化、存储虚拟化技术,还包括Docker等轻量级的容器方案; 3、MySQL、PostgreSQL、MongoDB、Redis、HBase等开源数据库内核的改进; 4、包含单集群上万个节点,多地多集群的超大规模分布式存储系统(文件系统,KVstore,BigTable等等)、分布式计算系(MapReduce,DAG,MPI并行计算、Batch、类Hive/spark的计算系统包括离线,分布式开发语言,分布式开发IDE,查询优化,流式实时计算,图计算,MPP等等)、弹性分布式资源管理和调度(海量多维度的多目标的调度系统,多个资源维度资源隔离技术等等)、机器学习平台(包括Paratemter Server,深度学习,逻辑回归等等)、异构等新型硬件上计算(包括CPU,GPU,FPGA,RDMA等等); 5、大数据在线引擎体系的目标是集广告、搜索、推荐的投放三位于一体,在近百毫秒周期内,从服务端跨越至移动端上智能,支撑总体近TB级的模型,完成知识推理向量匹配等各种召回,以及其它深度学习的排序和预测算法,参与计算的数十亿商品保持实时更新,支持数百位算法工程师面向众多场景展开测试,在算子流图化的抽象之下,引擎内的模型和数据可随时调整布局满足迭代所需; 6、参与大规模高并发场景下的开发者工具如IDE、SDK、CLI的开发工作,toB相关认证、权限、审计平台合规等相关工具平台的研发工作。

更新于 2025-04-29北京|成都|杭州
logo of antgroup
社招2年以上技术类-开发

蚂蚁DeepXPU团队专注在基于GPU等AI芯片的高性能异构计算系统研发,欢迎加入我们一起致力于: ● Software&Hardware Co-Design:深入分析GPU等AI芯片的硬件架构,打磨极致高效的算子与显存优化技术,优化大模型引擎,构建异构虚拟化能力。通过系统建设和优化,推动计算效率逼近硬件的性能极限,打造面向大模型的AI系统生态,提升智算集群的整体效率。 ● Algorithm&System Co-Design:从系统的视角出发,和算法团队紧密配合,共同探索大模型结构和范式的创新,并面向大规模AI应用场景进行系统级优化与落地。

更新于 2026-01-27北京|杭州