logo of baidu

百度昆仑芯片-高性能软件开发工程师-2026AIDU(J85289)

校招全职AIDU项目地点:北京 | 上海状态:招聘

任职要求


-计算机及计算机相关专业硕士及以上学历;
-熟悉C/C++,良好的编程习惯,熟悉计算机基础算法数据结构,熟悉 Linux 开发环境,熟悉计算机体系结构;
-有深度学习框架(Pytorch, Tensorflow, PaddlePaddle等)开发或使用经验者优先;
-有GPU/NPU kernel开发的经验者优先;
-熟悉MPI、RDMA、GPU direct等技术者优先。

工作职责


-负责主流AI模型对昆仑AI芯片的适配和性能优化工作;
-探索昆仑AI芯片分布式训练、推理方案,解决芯片互联、通讯库等关键问题;
-探索新一代昆仑AI芯片编程模型、硬件Spec等关键问题。
包括英文材料
学历+
C+
C+++
编程规范+
算法+
数据结构+
Linux+
深度学习+
PyTorch+
TensorFlow+
PaddlePaddle+
内核+
相关职位

logo of baidu
社招ACG

-负责AI模型对昆仑AI芯片的适配和性能优化工作,完成客户需求的落地任务 -为昆仑AI芯片各系列高性能加速芯片提供推理及训练软件栈,包括框架,图编译器以及周边产品的技术支持 -支持主流框架的模型对接,算法优化,上线部署,并探索新一代AI芯片编程模型和架构 -参与昆仑AI芯片技术栈相关的研发工作

更新于 2025-05-07
logo of baidu
实习ACG

-结合前沿业务场景,构建昆仑芯AI大规模训练推理系统 -负责大模型分布式训练、推理框架的适配与调优,设计千卡级集群通信加速、混合精度训练等方案 -为昆仑芯AI芯片各系列高性能加速芯片提供软件栈,包括框架,图编译器以及周边产品的技术落地 -AI芯片性能深度学习高性能计算库开发,支持各种AI场景,持续提升系统效能

更新于 2025-03-17
logo of baidu
社招ACG

-负责昆仑芯AI芯片性能深度学习高性能计算库开发,支持各种AI场景 -探索新一代AI芯片编程模型和架构 -深度学习框架Pytorch/PaddlePaddle图性能优化 -大规模分布式训练性能优化,AI芯片通信库开发,探索高效的芯片互联架构

更新于 2025-04-18
logo of baidu
社招ACG

-负责基于昆仑芯AI芯片的自动驾驶高性能计算库的开发及算法优化 -负责基于昆仑芯AI芯片的主流自动驾驶模型训练部署和性能优化工作 -负责Pytorch等深度学习框架的定制和性能优化工作 -负责重点客户的自动驾驶训练业务支持工作 -探索基于昆仑芯AI芯片的自动驾驶端到端大模型技术路径

更新于 2025-05-07