logo of tencent

腾讯微信-并行计算高级工程师

社招全职微信技术地点:北京状态:招聘

任职要求


1.本科以上学历,计算机相关专业;
2.优秀的 C++ 编程经验,熟练掌握常用数据结构算法,有一定的软件工程能力、良好的编程能力、逻辑思维和快速学习能力;
3.良好的团队合作意识,优秀的沟通和学习能力;
4.熟悉常见深度学习算法和视觉、LLM、图像视频生成 等模型,熟悉主流-ML平台框架(如 TensorFlow/PyTorch);
5.热爱技术,致力用技术为大量用户带来价值,为知名开源项目作出贡献或长期维护个人开源项目。

加分项
1.有以下一种或多种高性能计算、编译框架深入的研究和实践经验,或者基础扎实,有热心和毅力去学习钻研以下内容的,优先:;
2.A.精通现代 ARM/x64 体系结构与ISA/微架构以及 SIMD 指令集。能够从指令流水线/存储器层次结构 等级别量化分析性能瓶颈,并做出极致的优化;
3.B.精通 Nvidia/AMD/Adreno/Mali/PowerVR 等现代 GPU 体系结构与微架构;精通 CUDA/OpenCL/ROCm/Metal;熟悉现代 GPU 驱动的行为;能够从指令流水线/存储器层次结构/驱动调度 等级别量化分析性能瓶颈,并做出极致的优化。熟悉现代 GPU 渲染管线;
4.C.精通 Hexagon/Movidius 等 DSP 或 NPU 的体系结构与指令集,有 VLIW 指令集的优化经验,熟悉常用模拟器,能做到 cycle 级别的性能分析,熟悉 DMA/RPC 操作;
5.D.对常用计算/带宽密集型算子(如:GEMM/Conv/MultiheadAttention)实现做过面向 延迟/吞吐/功耗 的极致优化,性能超过开源或商业高性能计算库(如:TensorRT(LLM)/CoreML/MKL/OpenVINO 等);
6.E.有 AI 相关编译器(如:TVM/XLA/MLIR)开发经验;熟悉现代编译器框架(如:LLVM/gcc)。

工作职责


1.负责 AI 异构计算平台研发,打造 NLP/视觉/语音 等算法模型跨平台部署全流程优化,实现 AI 算力在微信生态(视频号、小程序、企业微信、微信读书、微信输入法等)的通用化和普惠;
2.分析 CNN、Transformer 等常用结构在微信实际业务场景中的性能瓶颈,在 CPU/GPU/NPU 上完成高性能实现与软硬件协同调优,实现性能极致的跨平台推理引擎;
3.引导算法团队设计性能/功耗兼顾的算法。
包括英文材料
学历+
C+++
数据结构+
算法+
深度学习+
大模型+
TensorFlow+
PyTorch+
CUDA+
OpenCL+
C+
RPC+
TensorRT+
LLVM+
GCC+
相关职位

logo of tencent
社招微信技术

1.负责 AI 异构计算平台研发,打造 NLP/视觉/语音 等算法模型跨平台部署全流程优化,实现 AI 算力在微信生态(视频号、小程序、企业微信、微信读书、微信输入法等)的通用化和普惠; 2.分析 CNN、Transformer 等常用结构在微信实际业务场景中的性能瓶颈,在 CPU/GPU/NPU 上完成高性能实现与软硬件协同调优,实现性能极致的跨平台推理引擎; 3.引导算法团队设计性能/功耗兼顾的算法。

更新于 2025-06-25
logo of tencent
社招2年以上视频号短视频技术

1.负责开发模型训练平台,支持超大规模稀疏模型的秒级实时训练与推理;负责开发模型推理平台,支撑数百个模型的复杂环境下的高并发、低延迟、低成本运行和海量资源的实时调度; 2.支撑视频号短视频推荐、直播推荐、红点推荐、图文推荐等大规模、复杂业务矩阵的高效迭代。

更新于 2025-08-15
logo of tencent
社招2年以上视频号短视频技术

1.负责视频号推荐的产品和算法需求,包括线上推荐策略开发、模型特征开发、数据与画像开发等工作; 2.负责视频号推荐后台的架构优化,降低请求延迟和计算成本,提升推荐效果; 3.负责视频号推荐后台组件的开发,支持短视频推荐、直播推荐、红点推荐、订阅号场景视频推荐等业务。

更新于 2025-06-30
logo of tencent
社招2年以上WXG技术

1.研发微信内通用的大模型训练框架 gCore 的研发,支持文本、多模态、文生图/视频等不同业务场景,以及预训练、SFT、RLHF等不同阶段的训练需求。通过并行策略和算子优化,使得 gCore 在不同的模型上都能达到 SOTA 的训练吞吐。

更新于 2025-06-10