logo of nio

蔚来AI算子开发工程师

社招全职3-5年算法地点:杭州 | 上海 | 合肥 | 深圳状态:招聘

任职要求


岗位要求:
1.熟悉C/C++python编程,有较好的编程习惯和编程基础;
2.熟悉常用数据结构算法,如堆/栈/队列/树/图等;
有如下经验优先考虑:
1.熟悉常用NN算子的实现方式,有算子开发和优化经验,包括Conv,DeConv,激活,Pool,Attention等;
2.有计算机体系结构背景,熟悉芯片架构/微架构(包括CPU/GPU/SoC/FPGA等),有软硬件协同设计经验;
3.熟悉GPGPU硬件架构,熟悉CUDA,熟悉cuDNN,有深度学习计算框架优化经验尤佳;
4.有复杂算法(如图像与视频处理、计算机视觉等)CUDA/OpenCL/汇编级优化经验尤佳;

工作职责


职位描述:
1.负责AI处理器的高性能算子方案设计,功能开发,性能优化工作;
2.负责算子自测试用例的设计和开发,保证算子的质量提升和 CI 看护;
3.探索AI高性能算子的软硬件协同优化方案,提升硬件的利用效率
4.开发算子库开发所需的功能和性能分析工具,提升算子库开发效率
包括英文材料
C+
C+++
Python+
编程规范+
数据结构+
算法+
SOC+
FPGA+
CUDA+
深度学习+
OpenCV+
OpenCL+
相关职位

logo of liauto
校招算法

1. 参与面向空间数据流推理芯片架构、基于 MLIR 框架的AI 算子编译器/算子库开发; 2. 参与包括AI大模型在内的各类 AI 负载的端到端编译,自动编译生成算子代码实现; 3. 根据模型负载和硬件架构特性,对AI负载进行热点分析和性能优化; 4. 参与软硬一体 AI 推理芯片架构的落地。

logo of liauto
校招算法

1. 参与面向空间数据流推理芯片架构、基于 MLIR 框架的AI 算子编译器/算子库开发; 2. 参与包括AI大模型在内的各类 AI 负载的端到端编译,自动编译生成算子代码实现; 3. 根据模型负载和硬件架构特性,对AI负载进行热点分析和性能优化; 4. 参与软硬一体 AI 推理芯片架构的落地。

logo of liauto
校招算法

1. 参与面向空间数据流推理芯片架构、基于 MLIR 框架的AI 算子编译器/算子库开发; 2. 参与包括AI大模型在内的各类 AI 负载的端到端编译,自动编译生成算子代码实现; 3. 根据模型负载和硬件架构特性,对AI负载进行热点分析和性能优化; 4. 参与软硬一体 AI 推理芯片架构的落地。

logo of liauto
校招算法

1、参与面向空间数据流推理芯片架构、基于 MLIR 框架的AI 算子编译器/算子库开发; 2、参与包括AI大模型在内的各类 AI 负载的端到端编译,自动编译生成算子代码实现; 3、根据模型负载和硬件架构特性,对AI负载进行热点分析和性能优化; 4、参与软硬一体 AI 推理芯片架构的落地。