logo of tencent

腾讯混元大模型推理加速工程师-北京/深圳

社招全职5年以上TEG公共技术地点:北京状态:招聘

任职要求


1.熟练掌握 C/C++Python语言,有计算机体系结构背景或软件开发背景,熟悉系统性能调优的方式;
2.具备基础的GPU编程能力,包括但不限于CudaOpenCL;熟悉至少一种GPU加速库,如cublas、cudnn、cutlass等;
3.有Tensorrt/FasterTransformer/Tensorrt-llm/vllm深度学习推理框架的实际使用经验;
4.熟悉各类深度学习网络和算子底层实现细节,训练和推理模型调试、调优有实操经验优先;
5.熟悉CPU/GPU异构加速瓶颈分析方法,有服务器端 AI 芯片、GPU加速经验优先;
6.熟悉分布式推理常用加速方法,有超大模型分布式部署经验优先。

工作职责


1.配合算法工程师,推动深度学习相关算法的落地,打造高吞吐、低延时的推理系统;
2.优化大模型推理性能,提升吞吐并控制成本;
3.优化大模型推理框架,提升框架易用性和可调试性。
包括英文材料
C+
C+++
Python+
性能调优+
CUDA+
OpenCL+
大模型+
vLLM+
深度学习+
TensorRT+
相关职位

logo of tencent
社招1年以上公共技术

1.配合算法工程师,推动深度学习相关算法的落地,打造高吞吐、低延时的推理系统; 2.优化大模型推理性能,提升吞吐并控制成本; 3.优化大模型推理框架,提升框架易用性和可调试性。

更新于 2025-10-20
logo of tencent
社招TEG技术

1.参与LLM、多模态大模型压缩加速方案研究,包括投机采样、稀疏化、量化和蒸馏等方法; 2.设计可落地的大模型压缩算法及成本优化方案,助力大模型的性能加速; 3.分析业务性能瓶颈和模型特点,定制化开发大模型压缩优化工具,实现高速推理方案。

更新于 2025-05-26
logo of tencent
社招腾讯云(TEG)

1.从事多模态生成大模型基础模型算法训练和优化,包括图像生成、视频生成、多模态迭代生成、多模态编辑等; 2.从事基础大模型的组建研发,如Diffusion Models、Autoregressive Models等; 3.从事大模型数据科学的设计与实现,大模型训练和推理加速,确保基础模型的竞争力领先和顺利落地。

更新于 2025-06-16
logo of tencent
社招3年以上混元-模型算法技

1.负责大语言模型(LLM)规划、推理、反思能力的研究,提升大语言模型的高阶推理能力; 2.跟进推理领域的前沿技术,将其应用于混元大模型基座,持续提升大模型的推理能力。

更新于 2025-07-26