小米高级llvm编译器开发工程师
社招全职3年以上A128153地点:北京状态:招聘
任职要求
1. 计算机科学、电子工程相关专业硕士及以上学历; 2. 3年以上编译器开发经验,有GPU/NPU编译器开发经验者优先; 4. 有SIMT编程语言(CUDA/HIP/OpenCL)编译器或运行时开发经验; 5. 精通LLVM编译器框架,具有实际参与Clang/LLVM…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1. 基于Clang/LLVM框架,设计并实现面向SIMT架构的编程语言编译器; 2.开发LLVM IR到SIMT硬件指令(如GPU/NPU并行指令集)的转换与优化; 3.扩展Clang前端支持SIMT编程语言特性; 4.设计针对SIMT架构的编译器优化策略: 5.与硬件团队协同设计编译器-芯片联合优化方案;
包括英文材料
学历+
CUDA+
https://developer.nvidia.com/blog/even-easier-introduction-cuda/
This post is a super simple introduction to CUDA, the popular parallel computing platform and programming model from NVIDIA.
https://www.youtube.com/watch?v=86FAWCzIe_4
Lean how to program with Nvidia CUDA and leverage GPUs for high-performance computing and deep learning.
OpenCL+
https://developer.nvidia.com/opencl
OpenCL™ (Open Computing Language) is a low-level API for heterogeneous computing that runs on CUDA-powered GPUs.
https://engineering.purdue.edu/~smidkiff/ece563/NVidiaGPUTeachingToolkit/Mod20OpenCL/3rd-Edition-AppendixA-intro-to-OpenCL.pdf
we will give a brief overview of OpenCL for CUDA programers.
[英文] Hands On OpenCL
https://handsonopencl.github.io/
An open source two-day lecture course for teaching and learning OpenCL
https://leonardoaraujosantos.gitbook.io/opencl/chapter1
Open Computing Language is a framework for writing programs that execute across heterogeneous platforms.
https://ulhpc-tutorials.readthedocs.io/en/latest/gpu/opencl/
OpenCL came as a standard for heterogeneous programming that enables a code to run in different platforms.
https://www.youtube.com/watch?v=4q9fPOI-x80
This presentation will show how to make use of the GPU from Java using OpenCL.
还有更多 •••
相关职位
社招技术类-安全
1.负责终端安全产品的技术架构设计、安全机制设计、安全核心模块的设计&研发&迭代; 2.结合业务发展需求以及安全技术趋势,进行新技术上的前瞻探索,建设下一代终端安全体系。
更新于 2025-06-12北京|杭州
社招微信技术
1.负责 AI 异构计算平台研发,打造 NLP/视觉/语音 等算法模型跨平台部署全流程优化,实现 AI 算力在微信生态(视频号、小程序、企业微信、微信读书、微信输入法等)的通用化和普惠; 2.分析 CNN、Transformer 等常用结构在微信实际业务场景中的性能瓶颈,在 CPU/GPU/NPU 上完成高性能实现与软硬件协同调优,实现性能极致的跨平台推理引擎; 3.引导算法团队设计性能/功耗兼顾的算法。
更新于 2025-06-25北京
社招微信技术
1.负责 AI 异构计算平台研发,打造 NLP/视觉/语音 等算法模型跨平台部署全流程优化,实现 AI 算力在微信生态(视频号、小程序、企业微信、微信读书、微信输入法等)的通用化和普惠; 2.分析 CNN、Transformer 等常用结构在微信实际业务场景中的性能瓶颈,在 CPU/GPU/NPU 上完成高性能实现与软硬件协同调优,实现性能极致的跨平台推理引擎; 3.引导算法团队设计性能/功耗兼顾的算法。
更新于 2025-06-25深圳