logo of tencent

腾讯混元大模型推理研发高级工程师(深圳/北京/上海/杭州)

社招全职1年以上公共技术地点:深圳状态:招聘

任职要求


1.熟练掌握 C/C++Python语言,有计算机体系结构背景或软件开发背景,熟悉系统性能调优的方式;
2.具备基础的GPU编程能力,包括但不限于CudaOpenCL,熟悉至少一种GPU加速库,如cublas、cudnn、cutlass等;
3.具备Tensorrt/FasterTransformer/Te…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1.配合算法工程师,推动深度学习相关算法的落地,打造高吞吐、低延时的推理系统;
2.优化大模型推理性能,提升吞吐并控制成本;
3.优化大模型推理框架,提升框架易用性和可调试性。
包括英文材料
C+
C+++
Python+
性能调优+
CUDA+
OpenCL+
还有更多 •••
相关职位

logo of tencent
社招3年以上公共技术

1.深度协同算法团队,主导深度学习算法端到端推理系统的架构设计与落地实践,聚焦高吞吐、低延时核心目标,攻克大模型推理工程化落地关键技术瓶颈; 2.针对大模型推理全链路进行性能瓶颈深度剖析,通过算子优化、量化策略、资源调度等手段实现推理吞吐最大化;建立性能 - 成本评估体系,制定资源利用率极致优化方案,实现推理成本可控化; 3.主导大模型推理框架底层架构优化,完善框架功能模块(如动态批处理、推理缓存、容错机制);构建工程化能力体系,提升框架易用性(API 设计、配置化能力)与可调试性(日志系统、性能埋点、调试工具链),支撑大规模推理服务稳定迭代。

更新于 2026-01-23深圳
logo of tencent
社招3年以上混元-模型算法技

1.负责大语言模型(LLM)规划、推理、反思能力的研究,提升大语言模型的高阶推理能力; 2.跟进推理领域的前沿技术,将其应用于混元大模型基座,持续提升大模型的推理能力。

更新于 2025-10-31深圳
logo of tencent
社招腾讯云(TEG)

1.从事多模态生成大模型基础模型算法训练和优化,包括图像生成、视频生成、多模态迭代生成、多模态编辑等; 2.从事基础大模型的组建研发,如Diffusion Models、Autoregressive Models等; 3.从事大模型数据科学的设计与实现,大模型训练和推理加速,确保基础模型的竞争力领先和顺利落地。

更新于 2025-06-16北京
logo of tencent
社招2年以上公共技术

1.AIGC应用的研发:深入理解业界AIGC应用场景,搭建LLM模型的在线推理服务,研发AIGC的C端产品,实现AIGC的商业化落地; 2.AIGC平台的研发:基于文生文、文生图和文生视频等能力建设AIGC平台,研发第三方插件的接入&管理平台,持续提升服务质量,降低服务成本。

更新于 2025-12-05深圳