logo of aliyun

阿里云阿里云智能-异构计算软硬件结合开发专家-杭州/深圳

社招全职5年以上云智能集团地点:深圳 | 杭州状态:招聘

任职要求


1. 具备扎实的工程能力,精通C++Python等编程语言,熟悉 sglang/vLLM等主流LLM推理框架优化的技术。
2. 熟悉主流AI加速芯片的系统结构、指令集和计算特性,具备异构计算硬件下的开发和性能优化经验。
3. 熟悉软硬结合技术规划,了解行业的技术趋势,有异构软硬件结合的领域技术规划经验。
4. 具备良好的沟通协作能力和项目组织能力,能与不同背景的团队高效沟通和协同,并对项目进行有效的组织与规划,以确保项目按时按质按量完成。

工作职责


1.负责分析硬件加速特征与内部拓扑结构,设计硬件优化实践和调优方案,并主导优化实现,充分发挥硬件潜能,确保性能符合预期。
2.结合主流LLM推理框架 (如sglang/vLLM) 和 大模型结构及计算特征,设计面向框架性能分析和优化插件并主导实现。
3.提供场景化的定制优化能力,识别并解决大模型在不同业务场景下的性能瓶颈,快速的给出满足需求的性能优化方案,并推动业务的交付应用。
4.洞悉大模型的发展趋势和硬件技术演进,结合软硬件优化的经验和数据,分析硬件的发展趋势,提炼AI硬件规格需求,形成软硬结合技术规划。
包括英文材料
C+++
Python+
SGLang+
大模型+
vLLM+
相关职位

logo of aliyun
社招8年以上云智能集团

1. 针对整机柜服务器产品进行全面的计算、互联、监控等能力的全面赋能和开发; 2. 寻找适合于整机柜异构服务器产品的业务产品并进行对应的昆仑组件设计和开发,包含性能评测分析、容器镜像等 3. 针对整机柜硬件架构及业务落地场景,构建故障异常case并能设计故障诊断方案; 4. 负责跟踪及研究主流GPU架构设计技术,参与下一代AI Infra的设计; 5. 根据业务画像,构建有竞争力的异构硬件和系统全链路的量化分析,形成数据决策数据库;有效推动异构服务器产品的规划和落地。

更新于 2025-09-09
logo of aliyun
社招5年以上云智能集团

1. 基于对目前主流AI芯片的深刻理解,分析硬件系统结构,提供软硬件优化实践和调优指南; 2. 了解市场上主流AI,大数据,HPC应用对异构计算系统设计的挑战,应用AI加速芯片,设计打造高效异构计算产品; 3. 聚焦异构资源在线性能分析,负责系统级性能分析和业务瓶颈定位,助力异构集群的极致稳定; 4. 实现异构计算基础设施serverless化,驱动异构云原生架构演进; 5. 洞悉人工智能及深度学习的应用发展趋势,参与下一代机器学习算力产品设计。

更新于 2025-07-16
logo of aliyun
社招技术类-开发

1. 负责研发AI异构计算软件栈,通过结合不同加速芯片的特性,实现AI计算的全链路优化,助力打造在业界具有竞争力的高可靠、高性能、高效率的大规模AI算力基础设施。 2. 结合具体业务场景,开展软硬件协同优化和技术创新(包括但不限于算子优化与编译、量化压缩,计算通讯融合,系统调度、分布式推理优化等工程任务),为实际业务提供卓越的性能和成本效益。 3. 洞察人工智能及深度学习的发展趋势,积极参与下一代AI基础设施的设计与研发。

更新于 2025-07-02
logo of aliyun
社招5年以上云智能集团

1、设计并实现高效的AIGC工程/图像/视频处理软硬件一体化方案,参与媒体计算产品全生命周期开发。 2、负责系统性能调优,识别并解决关键瓶颈,提升稳定性与效率。 3、开发和维护底层驱动、基础软件及图像/视频SDK,确保硬件(ASIC/FPGA/GPU)与应用高效协同。

更新于 2025-09-08