阿里巴巴达摩院-AI软件栈测试leader-计算技术

社招全职8年以上技术-芯片2026-05-25地点：上海状态：招聘

扫码手机上打开

任职要求

必备条件：
● 计算机科学、电子工程或相关专业硕士及以上学历；
● 8年以上软件测试经验，其中至少5年在AI/高性能计算软件领域；
● 3年以上技术团队管理经验，具备跨地域或混合用工（正式+外包）团队管理实践；
● 深入理解AI软件栈架构，包括但不限于：
  ○ 驱动层（KMD/UMD/Runtime/CCL/Video/Security）
  ○ 编译器（LLVM、AI Compiler、Triton）
  ○ 算子与模型推理（PyTorch、vLLM、Model Zoo）
  ○ …

登录查看完整任职要求

微信扫码，1秒登录

工作职责

我们正在寻找一位具备深厚AI系统与软件栈测试经验的技术专家，担任AI软件栈测试负责人。你将全面负责从底层驱动、编译器、算子、框架到工具链及全栈集成的端到端质量保障体系，领导覆盖模块测试、集成测试与专项测试（性能/稳定性/精度）的多维度测试团队，确保AI软件栈在CPU/GPU/NPU等异构平台上的功能正确性、性能卓越性与长期稳定性。

核心职责：
测试战略与体系建设：制定并落地AI软件栈整体测试策略，覆盖驱动（KMD/UMD/Runtime/CCL/Video/Security）、编译器（DFCA/LLVM/Triton/AI Compiler）、算子、深度学习框架（PyTorch/vLLM等）、工具链（调试/Profiling/覆盖率）及云原生环境的全生命周期质量保障。
团队管理与能力建设：技术上领导约50人的测试团队（含正式与外包资源），合理分配模块测试、集成测试与专项测试人力，持续提升自动化覆盖率、测试效率与缺陷拦截能力。
跨模块协同与质量左移：与AI架构、驱动开发、编译器、算法及产品团队紧密协作，在需求与设计阶段介入，推动可测性设计（Design for Testability）和质量内建（Quality Built-in）。
关键质量维度保障：
功能正确性：主导边界、异常、多进程、虚拟化、硬件适配等场景的测试覆盖；
性能与功耗：建立标准化性能基线，监控推理/训练吞吐、延迟、能效比等指标；
精度一致性：确保CPU/GPU/NPU间数值精度对齐，支持FP16/INT8/BF16等混合精度验证；
稳定性与鲁棒性：设计并执行长稳、OOM、Harvesting、压力及故障注入等专项测试。
自动化与工具链建设：推动EMU仿真环境、自动化回归流水线、设备级代码覆盖率工具、Sanitizer等基础设施的落地与优化，提升测试左移与右移能力。
质量度量与持续改进：建立质量看板，监控缺陷逃逸率、回归通过率、自动化覆盖率等核心指标，驱动流程与技术持续优化。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

安全防护+

LLVM+

Triton Inference Server+

PyTorch+

vLLM+

GDB+

还有更多 •••

登录查看完整学习资料