logo of tencent

腾讯腾讯智能座舱-大模型量化部署工程师

社招全职3年以上出行行业应用技术地点:深圳状态:招聘

任职要求


1.熟练掌握 C/C++Python语言,有良好计算机体系结构知识;
2.具备高通/MTK/nvidia等芯片平台的端侧量化部署经验,至少一个平台;
3.熟悉大模型常见的部署框架(如TensorRT-LLM/vLLM/QNN等)和量化算法;
4.熟悉端侧大模型推理机制如计算图的执行、算子融合、KV 缓存优化、投机采样策略等…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1.负责座舱端侧大模型量化部署,如高通/MTK/Nvidia等座舱芯片平台;
2.探索不同芯片平台的算子能力与工程新特性,设计不同的量化策略与验证方法,优化量化前后精度损失;
3.负责端侧大模型部署过程中的性能优化,优化token生成速度与减少内存带宽的使用;
4.研究端侧大模型前沿的量化部署方法,提升端侧大模型整体性能与精度。
包括英文材料
C+
C+++
Python+
大模型+
还有更多 •••
相关职位

logo of xpeng
社招

负责自动驾驶端侧大模型的部署与优化工作; 研究并落地大模型优化相关技术,包括模型量化、算子优化等,推动在自动驾驶业务中的应用; 参与模型部署与优化工具链的研发工作; 与算法团队协同配合,完成从模型训练到部署的全链路优化,确保软硬件之间的高效协同。

更新于 2025-07-08北京
logo of horizon
社招芯片序列

岗位描述: 1. 参与大模型端侧部署工作 2. 参与大模型的量化优化、推理加速等性能优化工作

更新于 2025-08-22北京|南京
logo of liauto
校招算法与软件

1. 搭建高效的AI系统,为算法迭代和部署提供模型优化、量化、部署的高效算法工具链; 2. 使用模型优化技术,包括模型低精度量化、模型压缩/裁剪,熟悉大模型的量化、长上下文推理优化等,开发模型优化的工具链,对模型进行优化加速; 3. 参与软硬件协同优化设计。与硬件工程师协作,参与硬件设计和优化,提供模型在私有硬件平台的执行效率。

上海
logo of horizon
社招算法序列

1. 搭建高效的AI系统,为算法迭代和部署提供模型优化、量化、部署的高效算法工具链; 2. 使用模型优化技术,包括模型低精度量化、模型压缩/裁剪,熟悉大模型的量化、长上下文推理优化等,开发模型优化的工具链,对模型进行优化加速; 3. 参与软硬件协同优化设计。与硬件工程师协作,参与硬件设计和优化,提供模型在私有硬件平台的执行效率。

更新于 2025-11-17北京|上海