logo of tencent

腾讯混元大模型量化压缩高级算法工程师

社招全职TEG技术地点:北京状态:招聘

任职要求


1.熟悉深度学习算法基本原理,熟练掌握PyTorch,熟悉Python语言;
2.熟悉主流LLM、多模态模型压缩算法,并且了解硬件及推理库上对于模型压缩的支持方案;
3.具有扎实的数理基础,熟悉常见的算法数据结构,具有良好的编程习惯;
4.了解大模型算法基本原理,熟悉常见LLM或多模态模型。

加分项
1.有投机采样相关丰富经验,或者其他模型加速的落地实现经验;
2.在主流机器学习顶会上有过论文成果。对模型压缩方向有较深了解,熟悉此领域SOTA方案,积极探索新算法;
3.了解GPU硬件架构,有CUDA编程经验,熟悉各种网络底层算子实现细节;
4.有过大模型训练/推理调优实操经验,熟悉其中的原理和技术方案。

工作职责


1.参与LLM、多模态大模型压缩加速方案研究,包括投机采样、稀疏化、量化和蒸馏等方法;
2.设计可落地的大模型压缩算法及成本优化方案,助力大模型的性能加速;
3.分析业务性能瓶颈和模型特点,定制化开发大模型压缩优化工具,实现高速推理方案。
包括英文材料
深度学习+
算法+
PyTorch+
Python+
大模型+
数据结构+
编程规范+
机器学习+
CUDA+
相关职位

logo of tencent
社招3年以上TEG技术

1.负责混元大模型相关研发工作,包括文本创作、文本理解、数学、翻译、Agent FunctionCalls等专项; 2.负责混元在公司内相关业务场景落地,根据业务需求优化混元模型,提升业务效果; 3.负责跟踪和探索大语言模型的前沿问题,结合实际场景,提供全面的技术解决方案,参与前沿算法与应用的研究。

更新于 2025-06-19
logo of tencent
社招TEG技术

1.基于大模型训练对于数据的需求进行互联网数据抓取,对提供给大模型训练/搜索等场景的语料进行清洗,提升语料纯度; 2.建设对标业内前沿的大模型训练数据集和数据清洗能力,提升数据质量和多样性,并验证数据价值和效果。

更新于 2025-06-18
logo of tencent
社招3年以上TEG技术

1.负责大语言模型后台系统的性能优化、流程建设、稳定性和研效提升; 2.负责建设混元大模型的研发体系后端; 3.参与新技术调研及实际业务场落地,不断提升业务指标。

更新于 2025-06-17
logo of tencent
社招TEG技术

1.设计和开发大规模预训练数据处理pipeline,为模型预训练提供稳定、可靠的高质量数据处理能力; 2.根据大模型训练数据特点,抽象并开发高效、可靠的数据加工框架,提升处理数据的工程效率; 3.建设对标业内前沿的大模型训练数据集,提升数据质量和多样性,并验证数据价值和效果。

更新于 2025-06-17