OPPO芯片编译软件工程师
社招全职3-10年SOFTWARE地点:上海状态:招聘
任职要求
1. 熟悉主流深度学习框架,如pytorch/tensorflow/tflite等,以及量化表达 2. 熟悉transformer base…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1. 负责AI NPU编译器架构设计以及开发 2. 根据硬件架构分析算法模型性能瓶颈,并进行编译优化 3. 基于开源指令集开发自定义高效算子 4. 与其他部门合作完成AI工具链整合
包括英文材料
深度学习+
https://d2l.ai/
Interactive deep learning book with code, math, and discussions.
PyTorch+
https://datawhalechina.github.io/thorough-pytorch/
PyTorch是利用深度学习进行数据科学研究的重要工具,在灵活性、可读性和性能上都具备相当的优势,近年来已成为学术界实现深度学习算法最常用的框架。
https://www.youtube.com/watch?v=V_xro1bcAuA
Learn PyTorch for deep learning in this comprehensive course for beginners. PyTorch is a machine learning framework written in Python.
TensorFlow+
https://www.youtube.com/watch?v=tpCFfeUEGs8
Ready to learn the fundamentals of TensorFlow and deep learning with Python? Well, you’ve come to the right place.
https://www.youtube.com/watch?v=ZUKz4125WNI
This part continues right where part one left off so get that Google Colab window open and get ready to write plenty more TensorFlow code.
还有更多 •••
相关职位
社招5-12年SOFTWARE
1. 负责AI NPU编译器架构设计以及开发 2. 根据硬件架构分析算法模型性能瓶颈,并进行编译优化 3. 基于开源指令集开发自定义高效算子 4. 与其他部门合作完成AI工具链整合
更新于 2025-10-20上海
社招4年以上嵌入式
1. 负责自研芯片AI编译器方案设计及开发实现(侧重点为高能效比与加速器的高利用率); 2. 负责开发编译器后端优化Pass,如指令调度、内存分配等,最大化发挥NPU算力; 3. 负责开发编译器性能调优工具链,支持模型推理效率分析和自动化优化。
更新于 2025-05-22深圳|上海
社招芯片板块
1、对于这个岗位,您将参与针对自研指令集及架构的完整的编译工具链设计与开发; 2、工作范围涉及图编译、算子与指令编译,Pythonic DSL及其编译器设计与开发,完整的编程语言与编译器配套软件开发; 3、与相关领域专家一起深度程参与自研芯片项目架构设计、硅前硅后AI大模型测试验证、汽车与机器人等场景量产部署全流程。 工作内容: 1、GPGPU特定的指令编译方案设计与开发,包含指令选择、指令调度等; 2、针对大模型的下一代AI编译器设计与开发,包括图编译、Cost-Model、低bit量化算法等; 3、Triton、Tilelang、Cutlass/Cute、Cute DSL/CuTile、Torch(torch.compile)等AI生态软件适配与支持;
更新于 2025-09-23上海