logo of tencent

腾讯搜索应用部-大模型研发工程师

社招全职3年以上搜索-元宝技术地点:北京状态:招聘

任职要求


1.计算机、电子工程等相关专业,2年以上推理优化经验;
2.精通C++/Go/Python,熟悉CUDA/OpenCL高性能编程;
3.至少熟练掌握一种推理框架(TensorRT/Triton/vLLM/…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1.参与AI搜索业务的大模型全流程开发,包括架构设计、数据预处理、训练、部署、推理加速等;
2.负责推理框架核心模块的设计与开发,包括算子调度、流量调度、模型管理、推理引擎集成等工作;
3.负责推理加速方法的工程实现和落地,包括但不限于模型剪枝、模型量化、动态batch等方法;
4.调研前沿技术,推动稀疏化推理、异构推理、分布式推理等技术在业务中的集成应用。
包括英文材料
C+++
Go+
Python+
CUDA+
还有更多 •••
相关职位

logo of tencent
社招3年以上元宝技术

1.负责元宝Post-training研发与应用,包括多轮对话、写作、长文理解、RAG、AI搜索、Agent、RL、RM等; 2.负责模型在元宝相关业务场景落地,根据业务需求优化模型,提升业务效果; 3.跟踪和探索大模型的前沿问题,结合实际场景,提供全面的技术解决方案,参与前沿算法与应用的研究。

更新于 2026-01-24北京
logo of tencent
社招2年以上CSIG技术

1.主导内容接入系统的架构设计与升级,构建灵活、高扩展性的分布式架构,支持业务快速迭代; 2.设计高性能数据处理链路,优化数据接入、清洗、存储及分发的全流程效率,保障系统高可用性(SLA≥99.9%); 3.解决高并发、低延迟场景下的技术难点,设计容灾方案,确保数据一致性及服务稳定性; 4.深入理解大模型训练与推理的数据需求,结合前沿的LLM能力,构建内容理解与特征提取系统,优化数据标注与结构化能力; 5.​。

更新于 2025-06-09北京
logo of baidu
社招基础模型研发部

-负责百度文心大模型的推理性能优化 -参与飞桨深度学习平台( PaddlePaddle)推理框架的设计、开发和业务支持 -负责深度学习框架的性能优化工作,包括但不限于功能模块在CPU/GPU上的深度优化工作 -负责深度学习推理框架前瞻技术的跟踪调研,实现技术创新突破 -参与深度学习框架的易用性优化工作,使开发者能够以更简单的方式实现各类任务,降低学习成本和开发成本 -负责异构高性能计算平台的设计、研发,高性能计算库、通信库开发与优化 -支持百度萝卜快跑、搜索等业务大模型的推理性能优化

更新于 2026-01-28北京|上海|深圳
logo of baidu
社招基础模型研发部

-负责百度文心大模型的推理性能优化 -参与飞桨深度学习平台( PaddlePaddle)推理框架的设计、开发和业务支持 -负责深度学习框架的性能优化工作,包括但不限于功能模块在CPU/GPU上的深度优化工作 -负责深度学习推理框架前瞻技术的跟踪调研,实现技术创新突破 -参与深度学习框架的易用性优化工作,使开发者能够以更简单的方式实现各类任务,降低学习成本和开发成本 -负责异构高性能计算平台的设计、研发,高性能计算库、通信库开发与优化 -支持百度萝卜快跑、搜索等业务大模型的推理性能优化

更新于 2026-01-29北京|上海|深圳