小鹏汽车AI编译器工程师(前端)
社招全职地点:上海状态:招聘
任职要求
1.本科及以上, 有良好的计算机理论基础,熟悉体系结构者优先,包括GPU,CPU,NPU,DSP等 2.优秀的C/C++编程能力, 熟悉cuda以及pytorch等优先 3.有框架…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
主要负责ai模型量化和编译器相关的开发, 工作内容包括, 1.量化工具及模型量化,包括QAT和PTQ等相关的各种工具和算法 2.计算图优化及模型部署,包括各种网络的常见通用优化
包括英文材料
C+
https://www.freecodecamp.org/chinese/news/the-c-beginners-handbook/
本手册遵循二八定律。你将在 20% 的时间内学习 80% 的 C 编程语言。
https://www.youtube.com/watch?v=87SH2Cn0s9A
https://www.youtube.com/watch?v=KJgsSFOSQv0
This course will give you a full introduction into all of the core concepts in the C programming language.
https://www.youtube.com/watch?v=PaPN51Mm5qQ
In this complete C programming course, Dr. Charles Severance (aka Dr. Chuck) will help you understand computer architecture and low-level programming with the help of the classic C Programming language book written by Brian Kernighan and Dennis Ritchie.
C+++
https://www.learncpp.com/
LearnCpp.com is a free website devoted to teaching you how to program in modern C++.
https://www.youtube.com/watch?v=ZzaPdXTrSb8
CUDA+
https://developer.nvidia.com/blog/even-easier-introduction-cuda/
This post is a super simple introduction to CUDA, the popular parallel computing platform and programming model from NVIDIA.
https://www.youtube.com/watch?v=86FAWCzIe_4
Lean how to program with Nvidia CUDA and leverage GPUs for high-performance computing and deep learning.
还有更多 •••
相关职位
社招A15860
1、负责硬件加速平台多款芯片的传统编译器开发和优化; 2、负责Clang前端混合编译语法支持; 3、负责异构编译技术针对AI领域与异构硬件的功能开发与性能优化; 4、负责新架构的研究和讨论。
更新于 2025-01-09上海
社招3年以上技术-开发
1、全同态/AI编译器开发:设计并实现高效的编译器框架,支持全同态加密或AI模型的自动编译与优化。开发编译器前端、中间表示(IR)及后端,确保编译器能够高效处理复杂的数学运算和加密逻辑。优化编译器性能,提升生成代码的执行效率和资源利用率。 2、算子DSL设计与实现:设计并实现领域特定语言(DSL),用于描述全同态加密或AI算子的数学表达式和计算流程。确保DSL具备良好的可扩展性,支持多种硬件平台和算法需求。提供清晰的DSL接口文档和开发者工具链,降低用户使用门槛。 3、算子优化:针对全同态加密或AI算子进行深度优化,包括但不限于内存访问模式、并行化策略和硬件加速。分析现有算子的性能瓶颈,提出并实施优化方案,显著提升计算效率。探索新型算法和硬件架构(如GPU、TPU、FPGA等)在算子优化中的应用。 4、跨团队协作:与算法团队、硬件团队及产品团队紧密合作,确保编译器和算子优化方案满足实际业务需求。参与技术讨论和代码评审,推动团队技术水平的整体提升。 5、技术研究与创新:跟踪全同态加密和AI领域的最新研究成果,探索其在编译器优化中的潜在应用。发表相关技术论文或专利,提升公司在行业内的技术影响力。
更新于 2025-09-24北京|上海
社招3年以上D7842
1.负责AI芯片编译器的方案及开发实现(侧重点为高能效比与加速器的高利用率); 2.负责编译器及相应工具链的开发和维护; 3.结合AI算法,架构和产品需求,完成AI编译器的方案及软件开发; 4.模型的性能优化,研发性能和功耗分析及优化工作 5.结合业界编译器的发展动态,规划自研编译器的演进
更新于 2023-01-31北京|上海
