OPPO高级芯片编译软件工程师
社招全职5-12年SOFTWARE地点:上海状态:招聘
任职要求
1. 熟悉主流深度学习框架,如pytorch/tensorflow/tflite等,以及量化表达 2. 熟悉transformer base…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1. 负责AI NPU编译器架构设计以及开发 2. 根据硬件架构分析算法模型性能瓶颈,并进行编译优化 3. 基于开源指令集开发自定义高效算子 4. 与其他部门合作完成AI工具链整合
包括英文材料
深度学习+
https://d2l.ai/
Interactive deep learning book with code, math, and discussions.
PyTorch+
https://datawhalechina.github.io/thorough-pytorch/
PyTorch是利用深度学习进行数据科学研究的重要工具,在灵活性、可读性和性能上都具备相当的优势,近年来已成为学术界实现深度学习算法最常用的框架。
https://www.youtube.com/watch?v=V_xro1bcAuA
Learn PyTorch for deep learning in this comprehensive course for beginners. PyTorch is a machine learning framework written in Python.
TensorFlow+
https://www.youtube.com/watch?v=tpCFfeUEGs8
Ready to learn the fundamentals of TensorFlow and deep learning with Python? Well, you’ve come to the right place.
https://www.youtube.com/watch?v=ZUKz4125WNI
This part continues right where part one left off so get that Google Colab window open and get ready to write plenty more TensorFlow code.
还有更多 •••
相关职位
社招4年以上嵌入式
1. 负责自研芯片AI编译器方案设计及开发实现(侧重点为高能效比与加速器的高利用率); 2. 负责开发编译器后端优化Pass,如指令调度、内存分配等,最大化发挥NPU算力; 3. 负责开发编译器性能调优工具链,支持模型推理效率分析和自动化优化。
更新于 2025-05-22深圳|上海
社招5年以上A156779
1、参与并负责XR产品底层软件的开发与交付工作,参与新一代XR芯片的设计、软件开发以及产品化解决方案的交付工作; 2、参与并负责SOC芯片系统软件编译、Bringup、稳定性、性能、低功耗等功能特性的开发交付; 3、参与并负责XR产品所需外设器件的选型以及驱动Porting开发交付,负责相关芯片IP驱动的开发交付; 4、参与并负责智能硬件底层软件新技术的探索,并进行新技术的落地应用。
更新于 2023-06-02上海
社招4年以上芯片
1. 负责NPU IP前端设计,协助架构师进行架构分析,输出IP规格及详细设计方案,使用verilog完成NPU相关单元部件的逻辑设计; 2. 与算法、软件团队紧密配合,协助完成指令定义和编译器优化,协助网络性能、功耗等分析; 3. 协助EDA和SV验证团队来完成功能、性能和功耗的验证,对NPU进行性能分析和功耗优化; 4. 协助完成物理实现(布局布线,解决时序等)。
更新于 2025-03-31深圳|上海