logo of tencent

腾讯混元大模型量化压缩高级算法工程师

社招全职TEG技术地点:北京状态:招聘

任职要求


1.熟悉深度学习算法基本原理,熟练掌握PyTorch,熟悉Python语言;
2.熟悉主流LLM、多模态模型压缩算法,并且了解硬件及推理库上对于模型压缩的支持方案;
3.具有扎实的数理基础,熟悉常见的算法和数据结构,具有良好的编程习惯;
4.了解大模型算法基本原理,熟悉常见LLM或多模态模型。

加分项
…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1.参与LLM、多模态大模型压缩加速方案研究,包括投机采样、稀疏化、量化和蒸馏等方法;
2.设计可落地的大模型压缩算法及成本优化方案,助力大模型的性能加速;
3.分析业务性能瓶颈和模型特点,定制化开发大模型压缩优化工具,实现高速推理方案。
包括英文材料
深度学习+
算法+
PyTorch+
Python+
还有更多 •••
相关职位

logo of tencent
社招3年以上AI技术

1.负责大模型全量数据的向量化检索和向量化排重服务,实现实时向量化排重系统; 2.通过向量化检索性能的优化,提升文本排重的准确率和性能; 3.建立大模型数据清洗的反馈机制和反馈系统,提升全网数据抓取效率; 4.参与大模型的数据工程开发,为大模型提供基础数据。

更新于 2025-11-21深圳
logo of tencent
社招3年以上TEG技术

1.负责混元大模型相关研发工作,包括文本创作、文本理解、数学、翻译、Agent FunctionCalls等专项; 2.负责混元在公司内相关业务场景落地,根据业务需求优化混元模型,提升业务效果; 3.负责跟踪和探索大语言模型的前沿问题,结合实际场景,提供全面的技术解决方案,参与前沿算法与应用的研究。

更新于 2025-06-19北京
logo of tencent
社招TEG技术

1.基于大模型训练对于数据的需求进行互联网数据抓取,对提供给大模型训练/搜索等场景的语料进行清洗,提升语料纯度; 2.建设对标业内前沿的大模型训练数据集和数据清洗能力,提升数据质量和多样性,并验证数据价值和效果。

更新于 2025-06-18北京
logo of tencent
社招3年以上TEG技术

1.负责大语言模型后台系统的性能优化、流程建设、稳定性和研效提升; 2.负责建设混元大模型的研发体系后端; 3.参与新技术调研及实际业务场落地,不断提升业务指标。

更新于 2025-06-17深圳