logo of aliyun

阿里云阿里云智能-服务器软硬件结合高级开发工程师-深圳/北京

社招全职3年以上云智能集团地点:北京 | 深圳状态:招聘

任职要求


1、计算机/电子/数学等相关专业,精通C++/Python/Rust,具备3年以上高性能计算或GPU相关软件开发经验。
2、熟悉常用数据结构算法;对计算机体系结构(如缓存/多线程/SIMD 等)有一定理解,能够深入性能瓶颈细节进行优化;
3、熟悉主流AI框架(PyTorch/TensorFlow)及优化工具(TensorRT-LLM、TVM),有LLM或扩散模型等生成式AI场景的调优经验。
4、对AI技术前沿有强烈兴趣,能快速学习并解决复杂技术问题,熟练掌握行业论文的分析能力;
5、具有优秀的逻辑思维能力,能够适应AI软硬件结合技术的快速变化,能跟上主流AI优化技术的发展节奏;
6、有强烈技术热情和好奇心,自驱力和学习力强;具备良好的分析与解决问题的能力、沟通以及团队合作能力;…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、参与视觉生成/多模态模型(包括文本、图像、视频生成等)在 GPU、ASIC、FPGA 等异构硬件上的推理/后训练加速开发与软硬件结合的性能优化工作,包括但不限于模型量化、attention优化、显存优化、编译优化、计算与通信优化、内存管理以及多卡或多设备的并行推理方案等;
2、在主流深度学习框架(如 PyTorch)基础上,基于GPU/xPU硬件特点,对关键算子进行软硬件结合优化,提升模型运行效率;
3、与硬件以及算法工程师紧密配合,共同优化整体推理速度与资源占用;
4、跟踪学术界与工业界前沿技术(如扩散模型优化、VAE并行优化、AI编解码、面向机器的编解码等),推动软硬件协同创新。
包括英文材料
C+++
Python+
Rust+
数据结构+
算法+
缓存+
多线程+
PyTorch+
TensorFlow+
还有更多 •••
相关职位

logo of aliyun
社招3年以上云智能集团

1、服务器软硬件一体系统设计与开发:基于产品需求分析,进行整体技术方案设计、开发和验证交付。 2、系统性能优化:对服务器进行软硬件一体性能优化和分析,实现软件系统稳定性/性能的提升。 3、系统测试与维护:对软硬件系统进行集成验证交付,对系统性问题进行分析定位,快速解决,保证满足系统性能、稳定性等要求。

更新于 2025-07-17深圳|杭州
logo of aliyun
社招3年以上云智能集团

1.负责分析硬件加速特征与拓扑结构,研发面向云端AI 硬件服务器的优化算子库,释放硬件潜能,确保性能符合硬件设计预期。 2.结合主流大模型推理框架,研发硬件相关的算子/异步等优化插件,确保优化库快速的被业务集成应用。 3.提供场景化的定制优化能力,识别并解决大模型在不同业务场景下的性能瓶颈,研发满足需求的性能优化组件,并推动业务的应用。

更新于 2026-01-05深圳|杭州
logo of aliyun
社招3年以上云智能集团

1. 基于对主流AI芯片和服务器架构的深刻理解,分析硬件加速特征与内部拓扑结构,提供硬件优化实践和调优指南,确保充分发挥硬件潜能。 2. 结合主流LLM推理框架 (如sglang/vLLM) 和大模型结构及其计算特性,通过软硬件协同优化和技术创新 (包括但不限于硬件算子优化、显存以及并行化等),负责新服务器上的端到端性能分析和优化。 3. 提供场景化的定制优化能力,识别并解决大模型在不同业务场景下的性能瓶颈,快速的给出满足需求的性能优化方案。 4. 熟悉系统调优和Profiling工具 (如 nsys/ncu系列、通用工具如Perf、火焰图等),负责系统级性能分析与瓶颈定位能力,并能基于硬件特性进行软件适配与优化。 5. 洞悉大模型的发展趋势和技术演进,结合硬件Profling和Trace 数据,为下一代AI基础设施的服务器设计与研发提供量化数据分析支持。

更新于 2025-09-24深圳|杭州
logo of aliyun
社招3年以上云智能集团

1. 负责研发针对AI 硬件的性能画像模型,跟踪业界模型的发展和框架的发展,结合阿里云AI服务器提供场景化的性能预估和优化策略推荐。 2. 负责提供场景化的定制分析能力,分析大模型在不同服务器下的性能差异,快速的给出满足业务的性能优化配置策略,加速业务的部署。 3. 负责调优和Profiling工具的分析和应用,跟踪和分析硬件性能优化技术,快速的使能新AI服务器。 4. 与硬件设计和规划人员协同,结合历史性能数据,提炼性能影响的关键硬件特征和需求,为下一代AI基础设施的服务器设计提供输入。

更新于 2025-08-08深圳|杭州