logo of nio

蔚来AI 编译优化专家

社招全职7-10年数字技术地点:北京 | 上海状态:招聘

任职要求


1. 计算机、软件工程、自动化等相关专业本科及以上;
2. 熟练掌握 C/C++Python 开发,常用设计模式算法数据结构;
3. 熟悉编译原理,熟悉 LLVM 及 IR 抽象,具备自研开发经验或精通 TVM/XLA/Glow 等 DL 编译栈内部实现原理;
4. 独立的开发、性能分析、问题追踪修复能力; 
5. 良好的编程风格习惯、文档撰写能力,团队沟通协作能力;

加分项:
- 熟悉异构计算平台,能够深入理解底层硬件
- 编译器开发经验
- 参与相关社区代码贡献

工作职责


1. 负责主导 AI 编译引擎及内部各子模块的方案选择、设计、实现及优化;
2. 负责支撑自动驾驶算法落地,确保算法模型正确、高效运行。
包括英文材料
C+
C+++
Python+
设计模式+
算法+
数据结构+
LLVM+
相关职位

logo of kuaishou
社招D11722

1、利用图优化,编译优化,CPU/GPU优化等技术加速CV/NLP/Speech等AI算法推理,充分挖掘处理器算力,为快手数亿用户提供高效稳定的算法能力输出; 2、追踪业界在异构计算性能优化方面的发展,并进行预研和应用探索; 3、工作内容包括但不限于: (1)CUDA kernel开发; (2)编译优化技术开发; (3)onnx parser开发; (4)训推一体加速库开发; (5)多卡推理技术开发; (6)针对Transformer/bert网络结构性能优化。

更新于 2025-05-16
logo of kuaishou
社招3-5年D7211

1、诊断模型训练、推理的性能问题,提升GPU资源使用率; 2、对模型做算子优化,提升模型的训练、推理性能。

更新于 2025-10-18
logo of mi
社招3年以上D7842

1.负责AI芯片编译器的方案及开发实现(侧重点为高能效比与加速器的高利用率); 2.负责编译器及相应工具链的开发和维护; 3.结合AI算法,架构和产品需求,完成AI编译器的方案及软件开发; 4.模型的性能优化,研发性能和功耗分析及优化工作 5.结合业界编译器的发展动态,规划自研编译器的演进

更新于 2023-01-31
logo of kuaishou
社招D2867

1、参与快手大规模深度学习推理框架的研发与优化,保障在线系统的高可用/高并发,为快手搜索数亿用户提供高效稳定的算力输出; 2、负责快手搜索模型推理优化工作,优化模型推理性能,高吞吐低延时支撑模型推理服务; 3、 支持大模型在搜索场景落地的相关模型优化,包括不局限于AI检索,Query改写等。

更新于 2025-04-03