logo of aligenie

智能互联阿里云智能-终端智能 GPU驱动与VGPU虚拟化专家-杭州

社招全职5年以上地点:杭州状态:招聘

任职要求


1. 本科及以上学历,计算机、电子工程、微电子等相关专业,5年以上GPU驱动开发与VGPU虚拟化相关工作经验,有大型商用项目落地经验者优先(硕士学历可适当放宽经验要求,参考行业学历分布);
2. 精通C/C++编程语言,深入理解操作系统内核原理(Linux/Windows),熟练掌握GPU驱动架构(DRM、KMD、UMD),具备独立完成驱动模块设计、开发与调试的能力,熟悉GPU底层架构与处理管线;
3. 精通VGPU虚拟化核心技术,深入理解KVM/QEMU、Hyper-V、ESXi等虚拟化平台,熟练掌握SR-IOV、VFIO、virtio-GPU、MIG等虚拟化相关规范与技术,有NVIDIA GRID驱动、vGPU许可证配置相关经验者优先;
4. 熟悉主流GPU芯片(NVIDIA/AMD/国产GPU)的架构与特性,掌握GPU性能优化方法,能针对图形渲染、AI计算等场景进行驱动与虚拟化性能调优,有芯片Bring-up、FPGA仿真测试经验者优先;
5.…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 主导GPU驱动(KMD/UMD)的设计、开发、调试与优化,覆盖Linux/Windows双系统,负责驱动模块的架构迭代、性能调优及问题定位,解决驱动与硬件、系统的兼容性问题,熟练使用GDB/KGDB/Windbg等调试工具排查复杂软件问题;
2. 负责VGPU虚拟化全流程技术方案设计与落地,深入研究NVIDIA vGPU、AMD MxGPU、Intel GVT-g及国产GPU虚拟化技术,主导SR-IOV、Mediated Pass-Through、MIG等虚拟化方案的选型、开发与优化,适配AI计算、专业图形渲染等不同场景需求(C模式/vCS许可证、Q模式/vDWS许可证适配);
3. 负责GPU驱动与VGPU虚拟化模块的集成测试、性能基准搭建,制定测试标准与流程,基于kvm-unit-tests、qemu-test、GPU-burn等工具打造回归测试体系,确保驱动稳定性与虚拟化性能无回退,处理线上大规模算力场景下的故障定位与热修复;
4. 跟踪GPU硬件架构(如Ampere及后续新一代架构)与虚拟化技术前沿动态,结合业务需求引入新技术、新方案,主导技术难点攻关,输出技术白皮书与架构设计文档,推动技术标准化落地;
5. 负责技术团队的技术指导与能力培养,带领小团队完成核心模块开发与项目交付,配合硬件、测试、产品等跨部门协作,推动GPU驱动与VGPU虚拟化技术在业务场景中的落地应用,对接GPU厂商(NVIDIA/AMD/国产厂商)进行技术协同与问题协同解决;
6. 负责GPU驱动的移植适配、版本迭代及残留清理(如使用DDU工具),保障驱动安装的兼容性与纯净性,支持异构计算框架的集成与调优,适配CUDA、OpenCL、OpenGL等图形/计算API。
包括英文材料
学历+
C+
C+++
内核+
Linux+
Windows+
性能调优+
还有更多 •••
相关职位

logo of aligenie
社招5年以上

1. 架构设计和验证:主导Android/Linux多系统融合的技术战略规划,负责从选型调研到整体架构设计的全链路验证;包括资源隔离、跨域通信、系统安全及硬件资源共享(GPU/NPU/多媒体编解码)等核心技术领域; 2. 前沿技术转化:跟进全球前沿的OS虚拟化技术(如MicroVM、AVF、Hypervisor等)在AI创新业务中方向和落地场景,保持技术架构的先进性;制定内部技术规范与标准,积极推动生态化建设; 3. 量产落地攻坚:驱动技术方案在核心产品中的规模化落地,针对系统集成中的关键卡点(如性能瓶颈、兼容性冲突)提出创新性解决方案,确保项目高质量交付。

更新于 2026-04-01北京|杭州|上海
logo of aliyun
社招10年以上云智能集团

岗位定位 当AI的战场从云端延伸到每一台终端设备,我们需要一位能重新定义端侧智能体验的技术领军者。 您将全面负责端侧AI应用与智能Agent平台的技术规划与产品研发。这个平台要解决的核心命题是:如何构建一套融合 端侧智能模型、高性能低功耗端推理引擎、Agent On-Device框架、隐私计算与环境安全等能力于一体的解决方案,在手机、PC、IoT等终端设备上流畅、安全、低延迟地运行本地智能体——同时与云端大模型能力无缝协同,形成"云端深度思考、终端即时响应"的一体化智能体验。 这是一个同时跨越系统工程与AI前沿的战略级岗位。您将拥有从端侧架构定义、推理引擎优化到设备生态合作的完整决策空间,带领团队在端侧AI这个正在爆发的赛道上建立技术壁垒与产品优势。 核心职责 技术战略与端侧架构 ● 制定端侧AI应用与Agent平台的整体技术路线,定义跨iOS、Android、桌面端及IoT设备的统一终端架构 ● 设计高性能端侧存储与检索方案——包括本地向量数据库、多模态数据索引与端侧语义检索引擎,支撑海量本地文档、图片、消息等信息的毫秒级检索 ● 主导端云协同大模型应用架构的端侧落地:定义端侧与云端的能力边界与协作协议,实现查询分发、结果融合、隐私保护的端到端链路 端侧推理与Agent能力 ● 推动端侧大模型推理能力建设——模型压缩、量化、蒸馏与硬件加速适配,实现轻量化大模型在终端设备上的高效运行 ● 设计端侧Agent框架,赋予AI对设备功能的智能感知与操控能力(系统API调用、跨应用协作、传感器数据融合) ● 主导隐私增强计算方案的落地,确保本地数据处理与推理过程中的用户数据安全与合规 工程交付与生态协作 ● 领导跨平台客户端工程团队,负责端侧核心模块的架构设计、性能优化与高质量交付 ● 与芯片厂商和设备厂商建立深度技术合作,打通硬件加速能力,推动NPU/GPU推理链路的联合优化 ● 建立端侧性能评测体系,持续追踪推理延迟、内存占用、功耗等核心指标,驱动体验持续优化 组织建设与技术文化 ● 搭建兼具系统工程深度与AI能力的复合型技术团队,主导核心人才引进与梯队建设 ● 营造注重工程质量、追求极致性能与用户体验的技术文化 ● 代表团队参与行业生态交流,在端侧AI领域建立技术品牌影响力

更新于 2026-04-07杭州
logo of aligenie
社招10年以上

岗位定位 当AI的战场从云端延伸到每一台终端设备,我们需要一位能重新定义端侧智能体验的技术领军者。 您将全面负责端侧AI应用与智能Agent平台的技术规划与产品研发。这个平台要解决的核心命题是:如何构建一套融合 端侧智能模型、高性能低功耗端推理引擎、Agent On-Device框架、隐私计算与环境安全等能力于一体的解决方案,在手机、PC、IoT等终端设备上流畅、安全、低延迟地运行本地智能体——同时与云端大模型能力无缝协同,形成"云端深度思考、终端即时响应"的一体化智能体验。 这是一个同时跨越系统工程与AI前沿的战略级岗位。您将拥有从端侧架构定义、推理引擎优化到设备生态合作的完整决策空间,带领团队在端侧AI这个正在爆发的赛道上建立技术壁垒与产品优势。 核心职责 技术战略与端侧架构 ● 制定端侧AI应用与Agent平台的整体技术路线,定义跨iOS、Android、桌面端及IoT设备的统一终端架构 ● 设计高性能端侧存储与检索方案——包括本地向量数据库、多模态数据索引与端侧语义检索引擎,支撑海量本地文档、图片、消息等信息的毫秒级检索 ● 主导端云协同大模型应用架构的端侧落地:定义端侧与云端的能力边界与协作协议,实现查询分发、结果融合、隐私保护的端到端链路 端侧推理与Agent能力 ● 推动端侧大模型推理能力建设——模型压缩、量化、蒸馏与硬件加速适配,实现轻量化大模型在终端设备上的高效运行 ● 设计端侧Agent框架,赋予AI对设备功能的智能感知与操控能力(系统API调用、跨应用协作、传感器数据融合) ● 主导隐私增强计算方案的落地,确保本地数据处理与推理过程中的用户数据安全与合规 工程交付与生态协作 ● 领导跨平台客户端工程团队,负责端侧核心模块的架构设计、性能优化与高质量交付 ● 与芯片厂商和设备厂商建立深度技术合作,打通硬件加速能力,推动NPU/GPU推理链路的联合优化 ● 建立端侧性能评测体系,持续追踪推理延迟、内存占用、功耗等核心指标,驱动体验持续优化 组织建设与技术文化 ● 搭建兼具系统工程深度与AI能力的复合型技术团队,主导核心人才引进与梯队建设 ● 营造注重工程质量、追求极致性能与用户体验的技术文化 ● 代表团队参与行业生态交流,在端侧AI领域建立技术品牌影响力

更新于 2026-04-07杭州
logo of aliyun
社招5年以上云智能集团

1. 负责新一代AI驱动的PC产品质量保证工作与团队建设,主导质量团队的组织架构设计、人才梯队培养及绩效管理,打造一支具备系统底层、应用上层及 AI 评测能力的复合型质量团队,对最终产品交付质量与用户体验负责; 2. 构建覆盖“安卓系统-上层应用-AI Agent"的全链路质量保证体系。主导跨域质量架构设计,解决终端稳定性兼容性、云边端协同、分布式系统一致性、AI非确定性输出等复杂质量挑战,制定统一的质量门禁与发布准出标准,确保端到端交付质量; 3. 引领测试技术的智能化转型,探索"AI for Testing"与"Testing for AI"双轮驱动模式。一方面将 AI 能力融入自动化测试、用例生成、缺陷分析等环节提升效能;另一方面建立针对 AI Agent/LLM 产品的专项评估体系(如准确性、安全性、幻觉检测),解决非确定性输出的质量挑战,保持行业技术领先性; 4. 主导测试能力平台化与服务化建设,构建系统级、应用级、服务端及 AI 评估的自动化用例库。推动质量能力与 CI/CD 流水线深度集成,实现代码变更的自动化质量卡点。打造自助式质量验证平台,赋能研发、运维及合作伙伴,降低质量验证门槛,提升整体交付效率; 5. 建立多维度的质量度量体系,结合线上监控、灰度发布数据及用户反馈,驱动质量问题的根因分析与持续改进闭环,对线上重大质量事故负责,建立快速响应与防御机制,保障业务连续性。

更新于 2026-03-27北京|深圳|杭州