logo of baidu

百度昆仑芯-AI芯片软件研发实习生(J83485)

实习兼职ACG地点:北京 | 上海状态:招聘

任职要求


-2026届及以后在校生(微电子,计算机,数学等相关专业)
-熟悉Python/C/C++,良好的编程习惯,熟悉计算机基础算法数据结构,熟悉 Linux 开发环境
-熟悉深度学习相关知识,有框架(Pytorch, PaddlePaddle,TVM,MLIR,ONNX等)开发或使用经验优先  
-熟悉CUDAOpenCL等高性能计算编程经验优先

工作职责


-结合前沿业务场景,构建昆仑芯AI大规模训练推理系统
-负责大模型分布式训练、推理框架的适配与调优,设计千卡级集群通信加速、混合精度训练等方案
-为昆仑芯AI芯片各系列高性能加速芯片提供软件栈,包括框架,图编译器以及周边产品的技术落地
-AI芯片性能深度学习高性能计算库开发,支持各种AI场景,持续提升系统效能
包括英文材料
Python+
C+
C+++
编程规范+
算法+
数据结构+
Linux+
深度学习+
PyTorch+
PaddlePaddle+
ONNX+
CUDA+
OpenCL+
相关职位

logo of baidu
社招3年以上ACG

-负责从芯片、封装到板级、整机的散热设计和仿真分析; 主导昆仑芯AI芯片的散热设计及后续测试、样机制作、优化、转产等;主导输出散热设计方案和仿真报告 -负责芯片级到板级、整机的散热测试计划的制定和实施 -支持产品DVT/PVT等,支持工程、生产、售后等环节相关散热问题的闭环 -负责ODM/OEM厂家散热方案、散热测试计划和测试报告的把关和审查,跟踪散热相关问题的解决 -主导热设计平台的建设,完善热设计评估体系,不断优化热仿真模型精度, 提升热设计能力 -探索热设计、验证、材料工艺方向的新技术,驱动验证、引入、产品化落地

更新于 2025-05-07
logo of baidu
社招ACG

-负责昆仑芯AI芯片性能深度学习高性能计算库开发,支持各种AI场景 -探索新一代AI芯片编程模型和架构 -深度学习框架Pytorch/PaddlePaddle图性能优化 -大规模分布式训练性能优化,AI芯片通信库开发,探索高效的芯片互联架构

更新于 2025-04-18
logo of baidu
实习ACG

-结合前沿业务场景,构建昆仑AI大规模训练系统 -持续提升系统效能 -主流AI模型对昆仑AI芯片的适配和性能优化工作 -探索昆仑AI芯片分布式训练方案

更新于 2025-05-07
logo of baidu
社招ACG

-负责基于昆仑芯AI芯片的自动驾驶高性能计算库的开发及算法优化 -负责基于昆仑芯AI芯片的主流自动驾驶模型训练部署和性能优化工作 -负责Pytorch等深度学习框架的定制和性能优化工作 -负责重点客户的自动驾驶训练业务支持工作 -探索基于昆仑芯AI芯片的自动驾驶端到端大模型技术路径

更新于 2025-05-07