腾讯腾讯智能座舱-大模型量化部署工程师
社招全职3年以上出行行业应用技术地点:深圳状态:招聘
任职要求
1.熟练掌握 C/C++、Python语言,有良好计算机体系结构知识; 2.具备高通/MTK/nvidia等芯片平台的端侧量化部署经验,至少一个平台; 3.熟悉大模型常见的部署框架(如TensorRT-LLM/vLLM/QNN等)和量化算法; 4.熟悉端侧大模型推理机制如计算图的执行、算子融合、KV 缓存优化、投机采样策略等…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1.负责座舱端侧大模型量化部署,如高通/MTK/Nvidia等座舱芯片平台; 2.探索不同芯片平台的算子能力与工程新特性,设计不同的量化策略与验证方法,优化量化前后精度损失; 3.负责端侧大模型部署过程中的性能优化,优化token生成速度与减少内存带宽的使用; 4.研究端侧大模型前沿的量化部署方法,提升端侧大模型整体性能与精度。
包括英文材料
C+
https://www.freecodecamp.org/chinese/news/the-c-beginners-handbook/
本手册遵循二八定律。你将在 20% 的时间内学习 80% 的 C 编程语言。
https://www.youtube.com/watch?v=87SH2Cn0s9A
https://www.youtube.com/watch?v=KJgsSFOSQv0
This course will give you a full introduction into all of the core concepts in the C programming language.
https://www.youtube.com/watch?v=PaPN51Mm5qQ
In this complete C programming course, Dr. Charles Severance (aka Dr. Chuck) will help you understand computer architecture and low-level programming with the help of the classic C Programming language book written by Brian Kernighan and Dennis Ritchie.
C+++
https://www.learncpp.com/
LearnCpp.com is a free website devoted to teaching you how to program in modern C++.
https://www.youtube.com/watch?v=ZzaPdXTrSb8
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
还有更多 •••
相关职位
社招
负责自动驾驶端侧大模型的部署与优化工作; 研究并落地大模型优化相关技术,包括模型量化、算子优化等,推动在自动驾驶业务中的应用; 参与模型部署与优化工具链的研发工作; 与算法团队协同配合,完成从模型训练到部署的全链路优化,确保软硬件之间的高效协同。
更新于 2025-07-08北京
校招算法与软件
1. 搭建高效的AI系统,为算法迭代和部署提供模型优化、量化、部署的高效算法工具链; 2. 使用模型优化技术,包括模型低精度量化、模型压缩/裁剪,熟悉大模型的量化、长上下文推理优化等,开发模型优化的工具链,对模型进行优化加速; 3. 参与软硬件协同优化设计。与硬件工程师协作,参与硬件设计和优化,提供模型在私有硬件平台的执行效率。
上海
