百度昆仑芯-深度学习框架研发工程师(J82857)
社招全职ACG地点:北京 | 上海状态:招聘
任职要求
-计算机及计算机相关专业本科及以上学历 -熟悉C/C++,良好的编程习惯,熟悉计算机基础算法和数据结构,熟悉 Linux 开发环境 -有深度学习框架(P…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
-结合前沿业务场景,构建昆仑芯AI大规模训练系统 -持续提升系统效能 -主流AI模型对昆仑芯AI芯片的适配和性能优化工作 -探索昆仑芯AI芯片分布式训练方案
包括英文材料
学历+
C+
https://www.freecodecamp.org/chinese/news/the-c-beginners-handbook/
本手册遵循二八定律。你将在 20% 的时间内学习 80% 的 C 编程语言。
https://www.youtube.com/watch?v=87SH2Cn0s9A
https://www.youtube.com/watch?v=KJgsSFOSQv0
This course will give you a full introduction into all of the core concepts in the C programming language.
https://www.youtube.com/watch?v=PaPN51Mm5qQ
In this complete C programming course, Dr. Charles Severance (aka Dr. Chuck) will help you understand computer architecture and low-level programming with the help of the classic C Programming language book written by Brian Kernighan and Dennis Ritchie.
C+++
https://www.learncpp.com/
LearnCpp.com is a free website devoted to teaching you how to program in modern C++.
https://www.youtube.com/watch?v=ZzaPdXTrSb8
编程规范+
[英文] Google Style Guides
https://google.github.io/styleguide/
Every major open-source project has its own style guide: a set of conventions (sometimes arbitrary) about how to write code for that project. It is much easier to understand a large codebase when all the code in it is in a consistent style.
算法+
https://roadmap.sh/datastructures-and-algorithms
Step by step guide to learn Data Structures and Algorithms in 2025
https://www.hellointerview.com/learn/code
A visual guide to the most important patterns and approaches for the coding interview.
https://www.w3schools.com/dsa/
还有更多 •••
相关职位
社招ACG
-负责昆仑芯AI芯片性能深度学习高性能计算库开发,支持各种AI场景 -探索新一代AI芯片编程模型和架构 -深度学习框架Pytorch/PaddlePaddle图性能优化 -大规模分布式训练性能优化,AI芯片通信库开发,探索高效的芯片互联架构
更新于 2025-04-18北京|上海
社招ACG
-负责基于昆仑芯AI芯片的自动驾驶高性能计算库的开发及算法优化 -负责基于昆仑芯AI芯片的主流自动驾驶模型训练部署和性能优化工作 -负责Pytorch等深度学习框架的定制和性能优化工作 -负责重点客户的自动驾驶训练业务支持工作 -探索基于昆仑芯AI芯片的自动驾驶端到端大模型技术路径
更新于 2025-05-07北京|上海|深圳
社招3年以上云智能集团
● 设计和实现高效的训练推理框架,提升多节点、多GPU环境下特别是异构算力场景下的计算效率。具备良好的工程实践和算法理论基础,熟悉底层的硬件编程和常见GPU的算子库开发,能对算法的运行效率如速度、显存占用等进行优化,推动算法稳定、高效的运行。 ● 完善优化训练推理框架,针对市面上的国产信创卡能提出统一的优化方案,并推进在底层的通信效率、资源占用、稳定性方面持续建设。 ● 设计并实现能够处理大规模并发请求的系统架构,确保极端负载下的稳定性和性能。完善错误自愈机制,提升平台训练的MFU,打造行业内一流的异构算力混训混推GPU框架。 ● 技术方案设计:主导核心模块技术方案设计与评审,结合业务需求与系统现状,制定可落地的架构规划。 ● 基础服务开发:构建高可用、可扩展的基础服务组件,支持训练/推理框架的快速迭代与稳定部署。 ● 项目管理:主导跨团队协作项目的全生命周期管理,包括需求拆解、排期规划、进度跟踪与风险控制,确保项目高效交付。 ● 持续关注并跟进业界技术发展,比如超长上下文、端到端推理思维链、多模态等方向。
更新于 2025-07-14北京|杭州