logo of antgroup

蚂蚁金服蚂蚁集团-DeepXPU 研发工程师-北京/杭州

社招全职2年以上技术类-开发地点:北京 | 杭州状态:招聘

任职要求


1.计算机相关学科专业,基本功扎实,3年以上相关工作经验。
2.熟悉Linux开发环境,掌握C/C++/Python编程语言,具备CUDA算子开发能力,掌握cutlass/CuTe/triton等算子开发工具,掌握nsys/ncu等profile工具。
3.深度理解GPU体系结构和CUDA编程模型,掌握GPU算子开发和性能调优技术,掌握GPU显存优化技术。
4.掌握FlashAttention/Flash…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


蚂蚁DeepXPU团队专注在基于GPU等AI芯片的高性能异构计算系统研发,欢迎加入我们一起致力于:
● Software&Hardware Co-Design:深入分析GPU等AI芯片的硬件架构,打磨极致高效的算子与显存优化技术,优化大模型引擎,构建异构虚拟化能力。通过系统建设和优化,推动计算效率逼近硬件的性能极限,打造面向大模型的AI系统生态,提升智算集群的整体效率。
● Algorithm&System Co-Design:从系统的视角出发,和算法团队紧密配合,共同探索大模型结构和范式的创新,并面向大规模AI应用场景进行系统级优化与落地。
包括英文材料
Linux+
C+
C+++
Python+
CUDA+
还有更多 •••
相关职位

暂无相关职位