logo of tencent

腾讯元宝-大模型推理加速工程师

社招全职元宝技术地点:深圳状态:招聘

任职要求


1.职位要求;
2.熟练掌握 Linux 环境下的Rust/C++Python语言,有大规模机器学习系统相关经验;
3.熟悉至少一种机器学习框架(Tensorflow/PyTorch或其他自研框架);
4.熟悉至少一种大模型训练/推理框架,包括但不限于:vLLM、SGLang…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1.负责大模型训练和推理系统的研发与性能优化,包括但不限于:模型计算性能优化、分布式大模型推理系统、大规模推理流量调度等;
2.负责解决系统高并发、高可靠性、高可扩展性等技术难关;
3.负责大模型训练和推理前瞻性技术架构的调研和引入,技术方案不限于子图匹配、编译优化、模型量化、本地及mooncake分布式kv store等;
4.与算法部门深度合作,进行算法与系统的联合优化。
包括英文材料
Linux+
Rust+
C+++
Python+
机器学习+
还有更多 •••
相关职位

logo of tencent
社招2年以上元宝技术

1.参与服务业务场景的llm大模型部署、运维、推理优化开发等相关工作; 2.负责推理加速方法的工程实现和落地,包括但不限于模型剪枝、模型量化、动态batch等方法; 3.调研前沿技术,推动稀疏化推理、异构推理、分布式推理等技术在搜索业务中的集成应用。

更新于 2025-08-12北京
logo of tencent
社招2年以上CSIG技术

1.参与服务业务场景的llm大模型部署、运维、推理优化开发等相关工作; 2.负责推理加速方法的工程实现和落地,包括但不限于模型剪枝、模型量化、动态batch等方法; 3.调研前沿技术,推动稀疏化推理、异构推理、分布式推理等技术在搜索业务中的集成应用。

更新于 2025-08-04深圳
logo of tencent
社招3年以上搜索-元宝技术

1.参与AI搜索业务的大模型全流程开发,包括架构设计、数据预处理、训练、部署、推理加速等; 2.负责推理框架核心模块的设计与开发,包括算子调度、流量调度、模型管理、推理引擎集成等工作; 3.负责推理加速方法的工程实现和落地,包括但不限于模型剪枝、模型量化、动态batch等方法; 4.调研前沿技术,推动稀疏化推理、异构推理、分布式推理等技术在业务中的集成应用。

更新于 2026-01-24北京
logo of alibaba
社招

1. 负责1688用户产品规划设计与落地,包括但不限于秒杀、签到、元宝及其他创新互动类产品; 2. 以规模增长为导向,通过权益/营销体系设计、互动玩法等产品手段,设计用户参与路径,不断提升用户粘性,为dau及dac负责; 3. 不断研究竞对及市场上的主流互动玩法、导购组货逻辑,不断推陈出新, 通过产品创新带来用户体验提升。

更新于 2025-06-09杭州