腾讯混元大模型推理加速工程师-北京/深圳

社招全职5年以上TEG公共技术2025-08-31地点：北京状态：招聘

扫码手机上打开

任职要求

1.熟练掌握 C/C++、Python语言，有计算机体系结构背景或软件开发背景，熟悉系统性能调优的方式；
2.具备基础的GPU编程能力，包括但不限于Cuda、OpenCL；熟悉至少一种GPU加速库，如cublas、cudnn、cutlass等；
3.有Tensorrt/FasterTransformer/Tensorrt-llm/vllm等深度学习推理框架的实际使用经验；
4.熟悉各类深度学习网络和算子底层实现细节，训练和推理模型调试、调优有实操经验优先；
5.熟悉CPU/GPU异构加速瓶颈分析方法，有服务器端 AI 芯片、GPU加速经验优先；
6.熟悉分布式推理常用加速方法，有超大模型分布式部署经验优先。

工作职责

1.配合算法工程师，推动深度学习相关算法的落地，打造高吞吐、低延时的推理系统；
2.优化大模型推理性能，提升吞吐并控制成本；
3.优化大模型推理框架，提升框架易用性和可调试性。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

C+

C+++

Python+

性能调优+

CUDA+

OpenCL+

大模型+

vLLM+

深度学习+

TensorRT+

相关职位

混元大模型推理研发高级工程师（深圳/北京/上海/杭州）

社招1年以上公共技术

1.配合算法工程师，推动深度学习相关算法的落地，打造高吞吐、低延时的推理系统； 2.优化大模型推理性能，提升吞吐并控制成本； 3.优化大模型推理框架，提升框架易用性和可调试性。

更新于 2025-10-20

混元大模型量化压缩高级算法工程师

社招TEG技术

1.参与LLM、多模态大模型压缩加速方案研究，包括投机采样、稀疏化、量化和蒸馏等方法； 2.设计可落地的大模型压缩算法及成本优化方案，助力大模型的性能加速； 3.分析业务性能瓶颈和模型特点，定制化开发大模型压缩优化工具，实现高速推理方案。

更新于 2025-05-26

混元AIGC算法研究员（多模态生成基模方向）（深圳/北京/上海）

社招腾讯云（TEG）

1.从事多模态生成大模型基础模型算法训练和优化，包括图像生成、视频生成、多模态迭代生成、多模态编辑等； 2.从事基础大模型的组建研发，如Diffusion Models、Autoregressive Models等； 3.从事大模型数据科学的设计与实现，大模型训练和推理加速，确保基础模型的竞争力领先和顺利落地。

更新于 2025-06-16

混元大语言模型算法工程师-大模型推理能力方向-深圳/北京

社招3年以上混元-模型算法技

1.负责大语言模型（LLM）规划、推理、反思能力的研究，提升大语言模型的高阶推理能力； 2.跟进推理领域的前沿技术，将其应用于混元大模型基座，持续提升大模型的推理能力。

更新于 2025-07-26