阿里云阿里云智能-异构计算软硬件结合高级开发专家-北京/杭州

社招全职8年以上云智能集团2025-09-09地点：北京 | 杭州状态：招聘

扫码手机上打开

任职要求

1. 熟悉GPU/AI ASIC部件的硬件设计、芯片架构以及对应的服务器系统设计，熟悉至少一种主流GPU架构者（NVIDIA GPU、AMD GPU等）优先；
2. 具有 GPGPU 微架构分析的实践经验。具有 AI 芯片设计及相关软硬件技术研究成果者优先；
3. 熟悉 GPU loading 运行过程中常见的 RAS 质量稳定性及软硬件结合性能profiling等相关技术问题，而且具备解决问题的能力。
4. 熟悉python、C++及linux开发环境 ，熟练掌握…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1. 针对整机柜服务器产品进行全面的计算、互联、监控等能力的全面赋能和开发；
2. 寻找适合于整机柜异构服务器产品的业务产品并进行对应的昆仑组件设计和开发，包含性能评测分析、容器镜像等
3. 针对整机柜硬件架构及业务落地场景，构建故障异常case并能设计故障诊断方案；
4. 负责跟踪及研究主流GPU架构设计技术，参与下一代AI Infra的设计；
5. 根据业务画像，构建有竞争力的异构硬件和系统全链路的量化分析，形成数据决策数据库；有效推动异构服务器产品的规划和落地。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

系统设计+

Python+

C+++

Linux+

CUDA+

PyTorch+

还有更多 •••

登录查看完整学习资料

相关职位

阿里云智能-异构计算软硬件结合高级开发工程师-杭州/深圳

社招3年以上云智能集团

1.负责分析硬件加速特征与拓扑结构，研发面向云端AI 硬件服务器的优化算子库，释放硬件潜能，确保性能符合硬件设计预期。 2.结合主流大模型推理框架，研发硬件相关的算子/异步等优化插件，确保优化库快速的被业务集成应用。 3.提供场景化的定制优化能力，识别并解决大模型在不同业务场景下的性能瓶颈，研发满足需求的性能优化组件，并推动业务的应用。

更新于 2026-01-05深圳|杭州

阿里云智能-异构计算软硬件结合高级研发工程师-深圳/杭州

社招3年以上云智能集团

1. 基于对主流AI芯片和服务器架构的深刻理解，分析硬件加速特征与内部拓扑结构，提供硬件优化实践和调优指南，确保充分发挥硬件潜能。 2. 结合主流LLM推理框架 (如sglang/vLLM) 和大模型结构及其计算特性，通过软硬件协同优化和技术创新 (包括但不限于硬件算子优化、显存以及并行化等)，负责新服务器上的端到端性能分析和优化。 3. 提供场景化的定制优化能力，识别并解决大模型在不同业务场景下的性能瓶颈，快速的给出满足需求的性能优化方案。 4. 熟悉系统调优和Profiling工具 (如 nsys/ncu系列、通用工具如Perf、火焰图等)，负责系统级性能分析与瓶颈定位能力，并能基于硬件特性进行软件适配与优化。 5. 洞悉大模型的发展趋势和技术演进，结合硬件Profling和Trace 数据，为下一代AI基础设施的服务器设计与研发提供量化数据分析支持。

更新于 2025-09-24深圳|杭州

阿里云智能-AI异构软硬件结合高级开发工程师-上海

社招3年以上云智能集团

1. 负责研发AI异构计算软件栈，通过结合不同加速芯片的特性，实现AI计算的全链路优化，助力打造在业界具有竞争力的高可靠、高性能、高效率的大规模AI算力基础设施。 2. 结合具体业务场景，开展软硬件协同优化和技术创新（包括但不限于算子优化与编译、量化压缩，计算通讯融合，系统调度、分布式推理优化等工程任务），为实际业务提供卓越的性能和成本效益。 3. 洞察人工智能及深度学习的发展趋势，积极参与下一代AI基础设施的设计与研发。

更新于 2025-08-08上海

阿里云智能-异构计算软硬件结合高级研发工程师-杭州

社招5年以上云智能集团

1. 基于对目前主流AI芯片的深刻理解，分析硬件系统结构，提供软硬件优化实践和调优指南； 2. 了解市场上主流AI，大数据，HPC应用对异构计算系统设计的挑战，应用AI加速芯片，设计打造高效异构计算产品； 3. 聚焦异构资源在线性能分析，负责系统级性能分析和业务瓶颈定位，助力异构集群的极致稳定； 4. 实现异构计算基础设施serverless化，驱动异构云原生架构演进； 5. 洞悉人工智能及深度学习的应用发展趋势，参与下一代机器学习算力产品设计。

更新于 2025-09-24杭州