腾讯混元大模型推理研发高级工程师（深圳/北京/上海/杭州）

社招全职1年以上公共技术2025-12-18地点：深圳状态：招聘

扫码手机上打开

任职要求

1.熟练掌握 C/C++、Python语言，有计算机体系结构背景或软件开发背景，熟悉系统性能调优的方式；
2.具备基础的GPU编程能力，包括但不限于Cuda、OpenCL，熟悉至少一种GPU加速库，如cublas、cudnn、cutlass等；
3.具备Tensorrt/FasterTransformer/Te…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1.配合算法工程师，推动深度学习相关算法的落地，打造高吞吐、低延时的推理系统；
2.优化大模型推理性能，提升吞吐并控制成本；
3.优化大模型推理框架，提升框架易用性和可调试性。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

C+

C+++

Python+

性能调优+

CUDA+

OpenCL+

还有更多 •••

登录查看完整学习资料

相关职位

混元大模型推理研发专家（深圳/北京/上海/杭州）

社招3年以上公共技术

1.深度协同算法团队，主导深度学习算法端到端推理系统的架构设计与落地实践，聚焦高吞吐、低延时核心目标，攻克大模型推理工程化落地关键技术瓶颈； 2.针对大模型推理全链路进行性能瓶颈深度剖析，通过算子优化、量化策略、资源调度等手段实现推理吞吐最大化；建立性能 - 成本评估体系，制定资源利用率极致优化方案，实现推理成本可控化； 3.主导大模型推理框架底层架构优化，完善框架功能模块（如动态批处理、推理缓存、容错机制）；构建工程化能力体系，提升框架易用性（API 设计、配置化能力）与可调试性（日志系统、性能埋点、调试工具链），支撑大规模推理服务稳定迭代。

更新于 2026-01-23深圳

混元大语言模型算法工程师-大模型推理能力方向-深圳/北京

社招3年以上混元-模型算法技

1.负责大语言模型（LLM）规划、推理、反思能力的研究，提升大语言模型的高阶推理能力； 2.跟进推理领域的前沿技术，将其应用于混元大模型基座，持续提升大模型的推理能力。

更新于 2025-10-31深圳

混元AIGC算法研究员（多模态生成基模方向）（深圳/北京/上海）

社招腾讯云（TEG）

1.从事多模态生成大模型基础模型算法训练和优化，包括图像生成、视频生成、多模态迭代生成、多模态编辑等； 2.从事基础大模型的组建研发，如Diffusion Models、Autoregressive Models等； 3.从事大模型数据科学的设计与实现，大模型训练和推理加速，确保基础模型的竞争力领先和顺利落地。

更新于 2025-06-16北京

混元AIGC后台开发工程师（深圳/北京）

社招2年以上公共技术

1.AIGC应用的研发：深入理解业界AIGC应用场景，搭建LLM模型的在线推理服务，研发AIGC的C端产品，实现AIGC的商业化落地； 2.AIGC平台的研发：基于文生文、文生图和文生视频等能力建设AIGC平台，研发第三方插件的接入&管理平台，持续提升服务质量，降低服务成本。

更新于 2025-12-05深圳