logo of baidu

百度昆仑芯-深度学习高性能计算研发工程师(J82858)

社招全职ACG地点:北京 | 上海状态:招聘

任职要求


-计算机相关专业,有C/C++/Python基础,熟悉linux开发环境
-有深度学习框架(Pytorch, Tensorflow, PaddlePaddle等)使用经验优先
-熟悉CUDAOpenCL等高性能计算编程经验优先
-有推荐系统,语音,自然语言处理,视觉等应用系统优化经验优先

工作职责


-负责昆仑芯AI芯片性能深度学习高性能计算库开发,支持各种AI场景
-探索新一代AI芯片编程模型和架构
-深度学习框架Pytorch/PaddlePaddle图性能优化
-大规模分布式训练性能优化,AI芯片通信库开发,探索高效的芯片互联架构
包括英文材料
C+
C+++
Python+
Linux+
深度学习+
PyTorch+
TensorFlow+
PaddlePaddle+
CUDA+
OpenCL+
推荐系统+
NLP+
相关职位

logo of baidu
社招ACG

-负责基于昆仑芯AI芯片的自动驾驶高性能计算库的开发及算法优化 -负责基于昆仑芯AI芯片的主流自动驾驶模型训练部署和性能优化工作 -负责Pytorch等深度学习框架的定制和性能优化工作 -负责重点客户的自动驾驶训练业务支持工作 -探索基于昆仑芯AI芯片的自动驾驶端到端大模型技术路径

更新于 2025-05-07
logo of aliyun
社招3年以上云智能集团

● 设计和实现高效的训练推理框架,提升多节点、多GPU环境下特别是异构算力场景下的计算效率。具备良好的工程实践和算法理论基础,熟悉底层的硬件编程和常见GPU的算子库开发,能对算法的运行效率如速度、显存占用等进行优化,推动算法稳定、高效的运行。 ● 完善优化训练推理框架,针对市面上的国产信创卡能提出统一的优化方案,并推进在底层的通信效率、资源占用、稳定性方面持续建设。 ● 设计并实现能够处理大规模并发请求的系统架构,确保极端负载下的稳定性和性能。完善错误自愈机制,提升平台训练的MFU,打造行业内一流的异构算力混训混推GPU框架。 ● 技术方案设计:主导核心模块技术方案设计与评审,结合业务需求与系统现状,制定可落地的架构规划。 ● 基础服务开发:构建高可用、可扩展的基础服务组件,支持训练/推理框架的快速迭代与稳定部署。 ● 项目管理:主导跨团队协作项目的全生命周期管理,包括需求拆解、排期规划、进度跟踪与风险控制,确保项目高效交付。 ● 持续关注并跟进业界技术发展,比如超长上下文、端到端推理思维链、多模态等方向。

更新于 2025-07-14
logo of baidu
实习ACG

-结合前沿业务场景,构建昆仑芯AI大规模训练推理系统 -负责大模型分布式训练、推理框架的适配与调优,设计千卡级集群通信加速、混合精度训练等方案 -为昆仑芯AI芯片各系列高性能加速芯片提供软件栈,包括框架,图编译器以及周边产品的技术落地 -AI芯片性能深度学习高性能计算库开发,支持各种AI场景,持续提升系统效能

更新于 2025-03-17
logo of baidu
社招ACG

-结合前沿业务场景,构建昆仑芯AI大规模训练系统 -持续提升系统效能 -主流AI模型对昆仑芯AI芯片的适配和性能优化工作 -探索昆仑芯AI芯片分布式训练方案

更新于 2025-05-07