logo of tencent

腾讯元宝-LLM大模型推理工程师

社招全职2年以上元宝技术地点:北京状态:招聘

任职要求


1.熟练掌握 C++/Python/Go语言,有2年以上llm大模型推理优化经验;
2.具备基础的GPU编程能力,包括但不限于CudaOpenCL;熟悉至少一种GPU加速库,如cublas、cudnn等;
3.有Tensorrt/Triton/sglang/vllm等推理框架的实际使用经验及二次开发经验;
4.熟悉量化、剪枝、动态Shape、算子融合等优化方法的基本原理和适用场景;
5.熟悉分布式推理常用加速方法,有超大模型分布式部署经验优先;
6.具备较强的抗压能力、团队协作和沟通能力,能够高效,完成项目交付和技术创新。

工作职责


1.参与服务业务场景的llm大模型部署、运维、推理优化开发等相关工作;
2.负责推理加速方法的工程实现和落地,包括但不限于模型剪枝、模型量化、动态batch等方法;
3.调研前沿技术,推动稀疏化推理、异构推理、分布式推理等技术在搜索业务中的集成应用。
包括英文材料
C+++
Python+
Go+
大模型+
CUDA+
OpenCL+
TensorRT+
SGLang+
vLLM+
相关职位

logo of tencent
社招2年以上CSIG技术

1.参与服务业务场景的llm大模型部署、运维、推理优化开发等相关工作; 2.负责推理加速方法的工程实现和落地,包括但不限于模型剪枝、模型量化、动态batch等方法; 3.调研前沿技术,推动稀疏化推理、异构推理、分布式推理等技术在搜索业务中的集成应用。

更新于 2025-08-04
logo of tencent
社招元宝技术

1.负责大模型训练和推理系统的研发与性能优化,包括但不限于:模型计算性能优化、分布式大模型推理系统、大规模推理流量调度等; 2.负责解决系统高并发、高可靠性、高可扩展性等技术难关; 3.负责大模型训练和推理前瞻性技术架构的调研和引入,技术方案不限于子图匹配、编译优化、模型量化、本地及mooncake分布式kv store等; 4.与算法部门深度合作,进行算法与系统的联合优化。

更新于 2025-06-19
logo of tencent
社招5年以上搜索-元宝技术

1.负责AI搜索中大模型后训练方向的核心技术研发,包括SFT、偏好学习、强化学习等算法研发、优化与创新,提升AI搜索的回复效果; 2.跟踪AI搜索领域的前沿技术,参与前沿算法研究,推动研究成果在业务场景的落地应用; 3.参与产品讨论,基于技术对产品提出改进建议。

更新于 2025-09-22
logo of tencent
社招3年以上元宝技术

1、负责元宝AIGC应用(如文本生成、图像生成、音视频对话)的后台系统架构设计与开发,支撑高并发、低延迟的AI应用服务; 2、基于LLM大模型能力场景,推进建设AIGC平台研发落地,支持插件接入&管理、数据飞轮pipeline等平台能力,为AI Agent的研发上线提升效率和质量; 3、负责解决平台和服务在高并发场景下的性能优化,问题定位&解决,保障服务SLA。

更新于 2025-10-14