logo of nio

蔚来AI 编译优化专家

社招全职7-10年数字技术地点:北京 | 上海状态:招聘

任职要求


1. 计算机、软件工程、自动化等相关专业本科及以上;
2. 熟练掌握 C/C++Python 开发,常用设计模式、算法及数据结构;
3. 熟悉编译原理,熟悉 LLVM 及 IR 抽象,具备自研开发经验或精通 TVM/XLA/Glow …
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 负责主导 AI 编译引擎及内部各子模块的方案选择、设计、实现及优化;
2. 负责支撑自动驾驶算法落地,确保算法模型正确、高效运行。
包括英文材料
C+
C+++
Python+
还有更多 •••
相关职位

logo of kuaishou
社招D11722

1、利用图优化,编译优化,CPU/GPU优化等技术加速CV/NLP/Speech等AI算法推理,充分挖掘处理器算力,为快手数亿用户提供高效稳定的算法能力输出; 2、追踪业界在异构计算性能优化方面的发展,并进行预研和应用探索; 3、工作内容包括但不限于: (1)CUDA kernel开发; (2)编译优化技术开发; (3)onnx parser开发; (4)训推一体加速库开发; (5)多卡推理技术开发; (6)针对Transformer/bert网络结构性能优化。

更新于 2025-05-16北京
logo of kuaishou
社招3-5年D7211

1、诊断模型训练、推理的性能问题,提升GPU资源使用率; 2、对模型做算子优化,提升模型的训练、推理性能。

更新于 2025-10-18北京
logo of xpeng
社招芯片板块

1、对于这个岗位,您将参与针对自研指令集及架构的完整的编译工具链设计与开发; 2、工作范围涉及图编译、算子与指令编译,Pythonic DSL及其编译器设计与开发,完整的编程语言与编译器配套软件开发; 3、与相关领域专家一起深度程参与自研芯片项目架构设计、硅前硅后AI大模型测试验证、汽车与机器人等场景量产部署全流程。 工作内容: 1、GPGPU特定的指令编译方案设计与开发,包含指令选择、指令调度等; 2、针对大模型的下一代AI编译器设计与开发,包括图编译、Cost-Model、低bit量化算法等; 3、Triton、Tilelang、Cutlass/Cute、Cute DSL/CuTile、Torch(torch.compile)等AI生态软件适配与支持;

更新于 2025-09-23上海
logo of mi
社招3年以上D7842

1.负责AI芯片编译器的方案及开发实现(侧重点为高能效比与加速器的高利用率); 2.负责编译器及相应工具链的开发和维护; 3.结合AI算法,架构和产品需求,完成AI编译器的方案及软件开发; 4.模型的性能优化,研发性能和功耗分析及优化工作 5.结合业界编译器的发展动态,规划自研编译器的演进

更新于 2023-01-31北京|上海