腾讯搜索应用部-大模型研发工程师
社招全职3年以上搜索-元宝技术地点:北京状态:招聘
任职要求
1.计算机、电子工程等相关专业,2年以上推理优化经验; 2.精通C++/Go/Python,熟悉CUDA/OpenCL高性能编程; 3.至少熟练掌握一种推理框架(TensorRT/Triton/vLLM/…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1.参与AI搜索业务的大模型全流程开发,包括架构设计、数据预处理、训练、部署、推理加速等; 2.负责推理框架核心模块的设计与开发,包括算子调度、流量调度、模型管理、推理引擎集成等工作; 3.负责推理加速方法的工程实现和落地,包括但不限于模型剪枝、模型量化、动态batch等方法; 4.调研前沿技术,推动稀疏化推理、异构推理、分布式推理等技术在业务中的集成应用。
包括英文材料
C+++
https://www.learncpp.com/
LearnCpp.com is a free website devoted to teaching you how to program in modern C++.
https://www.youtube.com/watch?v=ZzaPdXTrSb8
Go+
https://www.youtube.com/watch?v=8uiZC0l4Ajw
学习Golang的完整教程!从开始到结束不到一个小时,包括如何在Go中构建API的完整演示。没有多余的内容,只有你需要知道的知识。
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
CUDA+
https://developer.nvidia.com/blog/even-easier-introduction-cuda/
This post is a super simple introduction to CUDA, the popular parallel computing platform and programming model from NVIDIA.
https://www.youtube.com/watch?v=86FAWCzIe_4
Lean how to program with Nvidia CUDA and leverage GPUs for high-performance computing and deep learning.
还有更多 •••
相关职位
社招3年以上元宝技术
1.负责元宝Post-training研发与应用,包括多轮对话、写作、长文理解、RAG、AI搜索、Agent、RL、RM等; 2.负责模型在元宝相关业务场景落地,根据业务需求优化模型,提升业务效果; 3.跟踪和探索大模型的前沿问题,结合实际场景,提供全面的技术解决方案,参与前沿算法与应用的研究。
更新于 2026-01-24北京
社招2年以上CSIG技术
1.主导内容接入系统的架构设计与升级,构建灵活、高扩展性的分布式架构,支持业务快速迭代; 2.设计高性能数据处理链路,优化数据接入、清洗、存储及分发的全流程效率,保障系统高可用性(SLA≥99.9%); 3.解决高并发、低延迟场景下的技术难点,设计容灾方案,确保数据一致性及服务稳定性; 4.深入理解大模型训练与推理的数据需求,结合前沿的LLM能力,构建内容理解与特征提取系统,优化数据标注与结构化能力; 5.。
更新于 2025-06-09北京
社招基础模型研发部
-负责百度文心大模型的推理性能优化 -参与飞桨深度学习平台( PaddlePaddle)推理框架的设计、开发和业务支持 -负责深度学习框架的性能优化工作,包括但不限于功能模块在CPU/GPU上的深度优化工作 -负责深度学习推理框架前瞻技术的跟踪调研,实现技术创新突破 -参与深度学习框架的易用性优化工作,使开发者能够以更简单的方式实现各类任务,降低学习成本和开发成本 -负责异构高性能计算平台的设计、研发,高性能计算库、通信库开发与优化 -支持百度萝卜快跑、搜索等业务大模型的推理性能优化
更新于 2026-01-28北京|上海|深圳