logo of xpeng

小鹏汽车AI编译器工程师(前端)

社招全职地点:上海状态:招聘

任职要求


1.本科及以上, 有良好的计算机理论基础,熟悉体系结构者优先,包括GPU,CPU,NPU,DSP等
2.优秀的C/C++编程能力, 熟悉cuda以及pytorch等优先
3.有框架…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


主要负责ai模型量化和编译器相关的开发, 工作内容包括,
1.量化工具及模型量化,包括QAT和PTQ等相关的各种工具和算法
2.计算图优化及模型部署,包括各种网络的常见通用优化
包括英文材料
C+
C+++
CUDA+
还有更多 •••
相关职位

logo of bytedance
社招A15860

1、负责硬件加速平台多款芯片的传统编译器开发和优化; 2、负责Clang前端混合编译语法支持; 3、负责异构编译技术针对AI领域与异构硬件的功能开发与性能优化; 4、负责新架构的研究和讨论。

更新于 2025-01-09上海
logo of antgroup
社招3年以上技术-开发

1、全同态/AI编译器开发:设计并实现高效的编译器框架,支持全同态加密或AI模型的自动编译与优化。开发编译器前端、中间表示(IR)及后端,确保编译器能够高效处理复杂的数学运算和加密逻辑。优化编译器性能,提升生成代码的执行效率和资源利用率。 2、算子DSL设计与实现:设计并实现领域特定语言(DSL),用于描述全同态加密或AI算子的数学表达式和计算流程。确保DSL具备良好的可扩展性,支持多种硬件平台和算法需求。提供清晰的DSL接口文档和开发者工具链,降低用户使用门槛。 3、算子优化:针对全同态加密或AI算子进行深度优化,包括但不限于内存访问模式、并行化策略和硬件加速。分析现有算子的性能瓶颈,提出并实施优化方案,显著提升计算效率。探索新型算法和硬件架构(如GPU、TPU、FPGA等)在算子优化中的应用。 4、跨团队协作:与算法团队、硬件团队及产品团队紧密合作,确保编译器和算子优化方案满足实际业务需求。参与技术讨论和代码评审,推动团队技术水平的整体提升。 5、技术研究与创新:跟踪全同态加密和AI领域的最新研究成果,探索其在编译器优化中的潜在应用。发表相关技术论文或专利,提升公司在行业内的技术影响力。

更新于 2025-09-24北京|上海
logo of mi
社招3年以上D7842

1.负责AI芯片编译器的方案及开发实现(侧重点为高能效比与加速器的高利用率); 2.负责编译器及相应工具链的开发和维护; 3.结合AI算法,架构和产品需求,完成AI编译器的方案及软件开发; 4.模型的性能优化,研发性能和功耗分析及优化工作 5.结合业界编译器的发展动态,规划自研编译器的演进

更新于 2023-01-31北京|上海
logo of sensetime
校招芯片设计

1. 参与 AI 编译器及工具链的开发与优化; 2. 参与开发和维护编译器前端、后端或中间层的分析与转换模块; 3. 参与算子调度、性能调优、调试可视化等工具模块的开发与维护; 4. 参与多平台、多设备(CPU/DSP/NPU)异构执行后端的调试 ; 5. 参与开发和维护DSP算子,以及DSP上算法的优化和部署; 6. 根据需求撰写必要的技术文档、接口说明及使用手册;

更新于 2025-08-19上海|深圳|无锡