影石高性能计算专家
社招全职地点:深圳状态:招聘
任职要求
任职资格 1. 精通一种或多种用于高性能计算的 GPGPU技术(CUDA、Vulan、Metal),或者精通CPU微架构性能优化 2. 熟悉…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
工作职责 1. 各类算法在移动端、相机端、服务端的高性能实现和落地,协同算法研发人员优化算法 2. 对新算法进行工程化预研,进行可行性和算力性能评估 3. 领导团队进行专项算法性能攻坚和优化
包括英文材料
CUDA+
https://developer.nvidia.com/blog/even-easier-introduction-cuda/
This post is a super simple introduction to CUDA, the popular parallel computing platform and programming model from NVIDIA.
https://www.youtube.com/watch?v=86FAWCzIe_4
Lean how to program with Nvidia CUDA and leverage GPUs for high-performance computing and deep learning.
Metal+
[英文] Metal
https://developer.apple.com/metal/
Whether you want to build a graphics-intensive app, a cutting-edge game with beautiful visuals, or target demanding compute workloads like machine learning, Metal puts the advanced capabilities of Apple-designed GPUs at your fingertips.
[英文] Metal Tutorial
https://metaltutorial.com/
This tutorial will teach you the basics of Apple's Metal Graphics and Compute API, and help you understand how to program with it in C++ via the metal-cpp library.
https://www.kodeco.com/7475-metal-tutorial-getting-started
In this Metal tutorial, you will learn how to get started with Apple’s 3D graphics API by rendering a simple triangle to the screen.
[英文] learnmetal.com: Home
https://www.learnmetal.com/
Welcome to Learn Metal — an open-source tutorial site focused on learning and mastering Apple’s Metal graphics API.
还有更多 •••
相关职位
社招研发类
1、负责AIGC方向及LLM模型端侧化落地,包括模型小型化技术、计算加速技术和硬件优化技术以及虚拟人渲染相关及; 2、了解SoC IP和芯片架构设计,负责移动端硬件的深度分析,建立硬件能力量化分析方法论,指导AI业务端侧落地性能功耗优化,指导算法适配硬件设计; 3、负责平台硬件设计分析,横向分析行业硬件选型优劣势与应用方向,为平台硬件选型规划、算法硬化定制等提供改善建议; 4、结合业务方向,AI算法设计,为AI算法的芯片定制化提供指导。
更新于 2024-04-30杭州
社招5年以上研发类
1.精通 SoC 和 Ai 芯片,大模型算法结构设计,负责端侧大模型工程优化,建立硬件能力量化分析方法论,协同业务性能功耗调优算法适配硬件设计; 2.负责平台硬件设计分析,横向分析行业硬件选型优劣势与应用方向,为平台硬件选型规划、算法硬化定制等提供改善建议; 3.结合业务和 AI算法趋势,探索并行解码等全新的计算加速方法并推动落地。
更新于 2025-11-28杭州|深圳
社招5-15年研发类
1.协同算法团队,设计适合落地部署的影像算法SDK架构; 2.充分考虑算法落地优化需求,实现算法SDK原型; 3.针对当前SDK在产品中的问题与缺陷,提出并实施对应解决方案。
更新于 2025-07-07上海|杭州