logo of tencent

腾讯异构引擎研发高级工程师(深圳/北京/上海/杭州)

社招全职1年以上公共技术地点:深圳状态:招聘

任职要求


1.熟练掌握C/C++Python编程语言,具备良好的coding和调试能力;
2.熟悉GPU/AI芯片编程,如CUDAOpenCL,Ascend C等;
3.熟悉常见的算子编译优化和算子调优手段,如torch.compile,triton等;
4.熟悉各类深度学习网络和算子底层实现细节,训练和推理模型调试、调优有实操经验优先;
5.熟悉主流推理框架,如…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1.研发及优化推理引擎、PD分离推理调度系统;
2.支持主流GPU和异构AI芯片,优化推理性能,打造极致性能成本优势。
包括英文材料
C+
C+++
Python+
CUDA+
OpenCL+
Triton Inference Server+
还有更多 •••
相关职位

logo of tencent
社招1年以上公共技术

1.参与Pytorch等大模型深度学习框架的研发工作,重点负责GPU及异构芯片的适配与性能优化; 2.深入研究框架引擎内部机制,参与或主导前沿大模型相关技术的探索与实践; 3.与团队合作,持续提升系统的稳定性和扩展性,确保系统能够满足大规模深度学习任务的需求。

更新于 2026-01-05深圳
logo of tencent
社招1年以上公共技术

1.配合算法工程师,推动深度学习相关算法的落地,打造高吞吐、低延时的推理系统; 2.优化大模型推理性能,提升吞吐并控制成本; 3.优化大模型推理框架,提升框架易用性和可调试性。

更新于 2025-12-18深圳
logo of tencent
社招微信技术

1.负责 AI 异构计算平台研发,打造 NLP/视觉/语音 等算法模型跨平台部署全流程优化,实现 AI 算力在微信生态(视频号、小程序、企业微信、微信读书、微信输入法等)的通用化和普惠; 2.分析 CNN、Transformer 等常用结构在微信实际业务场景中的性能瓶颈,在 CPU/GPU/NPU 上完成高性能实现与软硬件协同调优,实现性能极致的跨平台推理引擎; 3.引导算法团队设计性能/功耗兼顾的算法。

更新于 2025-06-25深圳
logo of oppo
校招AI/算法类

专注于大模型系统优化、异构计算的前沿技术研究和落地,研究领域包括不限于高性能大模型系统架构、LLM-as-a-Service技术等。 岗位职责: 1. 负责大模型轻量化及推理优化的研究,支持大模型在云侧及端侧的高效推理及微调; 2. 负责端上大模型及AI智能体运行引擎的研发和部署。

更新于 2025-07-23深圳