logo of tencent

腾讯混元大模型推理研发高级工程师(深圳/北京/上海/杭州)

社招全职1年以上公共技术地点:深圳状态:招聘

任职要求


1.熟练掌握 C/C++Python语言,有计算机体系结构背景或软件开发背景,熟悉系统性能调优的方式;
2.具备基础的GPU编程能力,包括但不限于CudaOpenCL,熟悉至少一种GPU加速库,如cublas、cudnn、cutlass等;
3.具备Tensorrt/FasterTransformer/Te…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1.配合算法工程师,推动深度学习相关算法的落地,打造高吞吐、低延时的推理系统;
2.优化大模型推理性能,提升吞吐并控制成本;
3.优化大模型推理框架,提升框架易用性和可调试性。
包括英文材料
C+
C+++
Python+
性能调优+
CUDA+
OpenCL+
还有更多 •••
相关职位

logo of kuaishou
社招3-5年J0012

1. 参与设计与研发快手公司级机器学习平台,赋能深度学习及大模型等核心AI的模型迭代; 2. 打造业界领先的机器学习自动化架构,支持模型开发、评估、部署、监控全链路智能闭环,集成模型版本控制、元数据管理等功能,支撑模型全生命周期管理,驱动核心业务指标持续突破; 3. 构建大模型分布式推理编排系统,实现多机角色调度,支持千亿级参数模型的分布式训练与推理任务拆分及协同计算; 4. 深度参与云原生AI基础设施的技术演进,研发包括:面向AI负载的预测式弹性伸缩系统,GPU资源调度与混部,高性能存储加速引擎等方向,持续推动云原生与AI技术的深度融合创新。

更新于 2025-08-26北京
logo of tencent
社招3年以上公共技术

1.深度协同算法团队,主导深度学习算法端到端推理系统的架构设计与落地实践,聚焦高吞吐、低延时核心目标,攻克大模型推理工程化落地关键技术瓶颈; 2.针对大模型推理全链路进行性能瓶颈深度剖析,通过算子优化、量化策略、资源调度等手段实现推理吞吐最大化;建立性能 - 成本评估体系,制定资源利用率极致优化方案,实现推理成本可控化; 3.主导大模型推理框架底层架构优化,完善框架功能模块(如动态批处理、推理缓存、容错机制);构建工程化能力体系,提升框架易用性(API 设计、配置化能力)与可调试性(日志系统、性能埋点、调试工具链),支撑大规模推理服务稳定迭代。

更新于 2026-01-23深圳
logo of tencent
社招3年以上混元-模型算法技

1.负责大语言模型(LLM)规划、推理、反思能力的研究,提升大语言模型的高阶推理能力; 2.跟进推理领域的前沿技术,将其应用于混元大模型基座,持续提升大模型的推理能力。

更新于 2025-10-31深圳
logo of tencent
社招3年以上AI技术

1.负责混元多模态大模型的RL后训练框架研发; 2.设计和开发高效的框架和算子,以支持各种硬件加速器; 3.参与强化学习算法的优化和实现,提高训练和推理性能; 4.跨团队协作,与算法、软件、硬件团队密切合作,提高框架性能和稳定性。

更新于 2026-04-03深圳