阿里巴巴AI创新事业部-大模型蒸馏及推理加速专家/高级专家-未来生活实验室
社招全职3年以上技术类-算法地点:北京 | 杭州状态:招聘
任职要求
1. 背景:计算机、数学等相关专业硕博学历,3 年以上模型压缩或推理加速经验。 2. 核心能力(具备其一即可): ○ 蒸馏方向:精通知识蒸馏、模型训练策略及轻量化网络设计。 ○ 加速方向:精通模型量化、剪枝技术,熟悉硬件架构及其加速原理。 3. 技术栈: ○ 熟练掌握 PyTorch/TensorFlow,熟悉主…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1. 算法研发:负责模型蒸馏、量化、剪枝及稀疏化技术的研究与实现,提升大模型在推理端的效率。 2. 知识迁移:设计高效蒸馏方案,将千亿级模型能力迁移至轻量化模型,确保精度损失最小化。 3. 性能优化:针对 GPU、NPU进行全栈推理加速,优化算子执行逻辑,降低延迟并提升吞吐量。 4. 工具链开发:参与开发模型转换、自动压缩及加速工具链。
包括英文材料
学历+
PyTorch+
https://datawhalechina.github.io/thorough-pytorch/
PyTorch是利用深度学习进行数据科学研究的重要工具,在灵活性、可读性和性能上都具备相当的优势,近年来已成为学术界实现深度学习算法最常用的框架。
https://www.youtube.com/watch?v=V_xro1bcAuA
Learn PyTorch for deep learning in this comprehensive course for beginners. PyTorch is a machine learning framework written in Python.
TensorFlow+
https://www.youtube.com/watch?v=tpCFfeUEGs8
Ready to learn the fundamentals of TensorFlow and deep learning with Python? Well, you’ve come to the right place.
https://www.youtube.com/watch?v=ZUKz4125WNI
This part continues right where part one left off so get that Google Colab window open and get ready to write plenty more TensorFlow code.
TensorRT+
https://docs.nvidia.com/deeplearning/tensorrt/latest/getting-started/quick-start-guide.html
This TensorRT Quick Start Guide is a starting point for developers who want to try out the TensorRT SDK; specifically, it demonstrates how to quickly construct an application to run inference on a TensorRT engine.
还有更多 •••