logo of tencent

腾讯混元大模型推理研发专家(深圳/北京/上海/杭州)

社招全职3年以上公共技术地点:深圳状态:招聘

任职要求


1.精通 C/C++Python 编程语言,具备深厚的计算机体系结构功底(深入理解 CPU/GPU 缓存机制、指令流水线、内存层次结构)或大型分布式系统开发经验;精通系统性能调优方法论,熟练使用 perf、gprof、nsight 等调优工具进行底层瓶颈定位;
2.精通 CUDA 核心编程模型(线程束调度、内存 coalescing、共享内存优化),熟悉 OpenCL 等异构编程框架;深入理解 cublas、cudnn、cutlass 等 GPU 加速库底层实现原理与调优策略,能基于硬件特性定制化优化计算逻辑;
3.具备 TensorRT/TensorRT-LLM/FasterTransformer/vllm/sglang 等推理引擎深度实践经验,主导过基于上述引擎的大模型推理系统定制化开发与性能调优;精通推理引擎底层优化技术(算子融合、量化…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1.深度协同算法团队,主导深度学习算法端到端推理系统的架构设计与落地实践,聚焦高吞吐、低延时核心目标,攻克大模型推理工程化落地关键技术瓶颈;
2.针对大模型推理全链路进行性能瓶颈深度剖析,通过算子优化、量化策略、资源调度等手段实现推理吞吐最大化;建立性能 - 成本评估体系,制定资源利用率极致优化方案,实现推理成本可控化;
3.主导大模型推理框架底层架构优化,完善框架功能模块(如动态批处理、推理缓存、容错机制);构建工程化能力体系,提升框架易用性(API 设计、配置化能力)与可调试性(日志系统、性能埋点、调试工具链),支撑大规模推理服务稳定迭代。
包括英文材料
C+
C+++
Python+
缓存+
还有更多 •••
相关职位

logo of tencent
社招1年以上公共技术

1.配合算法工程师,推动深度学习相关算法的落地,打造高吞吐、低延时的推理系统; 2.优化大模型推理性能,提升吞吐并控制成本; 3.优化大模型推理框架,提升框架易用性和可调试性。

更新于 2025-12-18深圳
logo of tencent
社招腾讯云(TEG)

1.从事多模态生成大模型基础模型算法训练和优化,包括图像生成、视频生成、多模态迭代生成、多模态编辑等; 2.从事基础大模型的组建研发,如Diffusion Models、Autoregressive Models等; 3.从事大模型数据科学的设计与实现,大模型训练和推理加速,确保基础模型的竞争力领先和顺利落地。

更新于 2025-06-16北京
logo of tencent
社招3-5年TEG产品

1.业务需求洞察与转化:; 2.深入对接业务线(如算法团队、司内业务部门),理解大模型在应用场景中的业务痛点,输出产品需求文档并推动优先级共识; 3.深入分析行业痛点(如客服、内容生成、3D建模等),输出定制化解决方案,推动产品适配性优化; 4.平台能力构建与体验提升:; 5.主导设计大模型全生命周期管理功能,涵盖数据标注、模型训练、效果评测、部优化等环节的核心模块,构建大模型全生命周期管理闭环,重点突破高并发训练、分布式推理、多模态模型兼容等能力; 6.设计面向开发者的低门槛工具链(如可视化Prompt编排、一键式模型微调),提升平台DAU/留存率; 7.端到端功能交付与落地; 8.独立负责功能从PRD设计到上线的全流程管理,协调研发、测试、算法团队资源,确保技术方案与业务目标的强对齐; 9.建立关键指标(如模型迭代周期、资源利用率、用户满意度),通过数据验证功能价值; 10.主导交付后的用户培训、反馈收集及问题闭环; 11.跨团队协同与项目管理; 12.推动业务方、工程团队、算法团队三方协作; 13.推动太极在腾讯生态产品(如微信、腾讯文档、腾讯会议)中的深度合作与能力共建。

更新于 2025-05-30深圳
logo of tencent
社招3年以上混元-模型算法技

1.负责大语言模型(LLM)规划、推理、反思能力的研究,提升大语言模型的高阶推理能力; 2.跟进推理领域的前沿技术,将其应用于混元大模型基座,持续提升大模型的推理能力。

更新于 2025-10-31深圳