logo of aliyun

阿里云阿里云智能-异构计算软硬件结合高级研发工程师-杭州

社招全职5年以上云智能集团地点:杭州状态:招聘

任职要求


1.拥有扎实的编码功底,熟悉C/C++/Go/Rust等语言,拥有规范的工程化能力;
2.深入理解Linux系统,有大规模生产系统软件的开发与运维经验;
3.熟悉异构计算编程, 熟悉主流AI加速芯片(如NVIDIA,AMD等)的系统结构和计算特性;
4.熟悉异构硬件系统调优和Profiling工具,如nsys/ncu系列等。
5.熟悉docker/containerd等主流容器运行实现,熟悉kubernetes系统架构和编程范…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 基于对目前主流AI芯片的深刻理解,分析硬件系统结构,提供软硬件优化实践和调优指南;
2. 了解市场上主流AI,大数据,HPC应用对异构计算系统设计的挑战,应用AI加速芯片,设计打造高效异构计算产品;
3. 聚焦异构资源在线性能分析,负责系统级性能分析和业务瓶颈定位,助力异构集群的极致稳定;
4. 实现异构计算基础设施serverless化,驱动异构云原生架构演进;
5. 洞悉人工智能及深度学习的应用发展趋势,参与下一代机器学习算力产品设计。
包括英文材料
C+
C+++
Go+
Rust+
还有更多 •••
相关职位

logo of aliyun
社招3年以上云智能集团

1. 基于对主流AI芯片和服务器架构的深刻理解,分析硬件加速特征与内部拓扑结构,提供硬件优化实践和调优指南,确保充分发挥硬件潜能。 2. 结合主流LLM推理框架 (如sglang/vLLM) 和大模型结构及其计算特性,通过软硬件协同优化和技术创新 (包括但不限于硬件算子优化、显存以及并行化等),负责新服务器上的端到端性能分析和优化。 3. 提供场景化的定制优化能力,识别并解决大模型在不同业务场景下的性能瓶颈,快速的给出满足需求的性能优化方案。 4. 熟悉系统调优和Profiling工具 (如 nsys/ncu系列、通用工具如Perf、火焰图等),负责系统级性能分析与瓶颈定位能力,并能基于硬件特性进行软件适配与优化。 5. 洞悉大模型的发展趋势和技术演进,结合硬件Profling和Trace 数据,为下一代AI基础设施的服务器设计与研发提供量化数据分析支持。

更新于 2025-09-24深圳|杭州
logo of aliyun
社招3年以上云智能集团

1. 负责研发针对AI 硬件的性能画像模型,跟踪业界模型的发展和框架的发展,结合阿里云AI服务器提供场景化的性能预估和优化策略推荐。 2. 负责提供场景化的定制分析能力,分析大模型在不同服务器下的性能差异,快速的给出满足业务的性能优化配置策略,加速业务的部署。 3. 负责调优和Profiling工具的分析和应用,跟踪和分析硬件性能优化技术,快速的使能新AI服务器。 4. 与硬件设计和规划人员协同,结合历史性能数据,提炼性能影响的关键硬件特征和需求,为下一代AI基础设施的服务器设计提供输入。

更新于 2025-08-08深圳|杭州
logo of aliyun
社招3年以上云智能集团

1.负责分析硬件加速特征与拓扑结构,研发面向云端AI 硬件服务器的优化算子库,释放硬件潜能,确保性能符合硬件设计预期。 2.结合主流大模型推理框架,研发硬件相关的算子/异步等优化插件,确保优化库快速的被业务集成应用。 3.提供场景化的定制优化能力,识别并解决大模型在不同业务场景下的性能瓶颈,研发满足需求的性能优化组件,并推动业务的应用。

更新于 2026-01-05深圳|杭州
logo of aliyun
社招3年以上云智能集团

1. 负责研发AI异构计算软件栈,通过结合不同加速芯片的特性,实现AI计算的全链路优化,助力打造在业界具有竞争力的高可靠、高性能、高效率的大规模AI算力基础设施。 2. 结合具体业务场景,开展软硬件协同优化和技术创新(包括但不限于算子优化与编译、量化压缩,计算通讯融合,系统调度、分布式推理优化等工程任务),为实际业务提供卓越的性能和成本效益。 3. 洞察人工智能及深度学习的发展趋势,积极参与下一代AI基础设施的设计与研发。

更新于 2025-08-08上海