拼多多高性能计算工程师

社招全职5年以上技术类2026-07-28地点：上海状态：招聘

扫码手机上打开

任职要求

1、扎实的计算机体系架构基础，五年以上C/C++开发经验。2、熟悉Linux/Unix开发环境，熟悉Linux下性能剖析和优化工具。3、熟悉TensorRT/TVM/XLA/MLIR等DAG优化技术4、了解CUDA kernel实现在GPU 硬件结构底层。5…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1、加入系统联合优化团队，负责服务框架开发、性能瓶颈分析以及调优，为电商推荐场景下提供全栈式 Compiler+Serving+Benchmark 不同层级优化方案。2、负责通过新硬件引入，软硬结合优化， 在异构计算硬件上，挤压算力的极限降低服务资源成本。3、负责持续跟踪业界最优实现深度学习模型，从训练到部署的并结合实际场景超越并创新。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

C+

C+++

Linux+

Unix+

TensorRT+

CUDA+

还有更多 •••

登录查看完整学习资料

相关职位

高性能计算工程师

社招8年以上软件

1. 负责高性能算法在编辑引擎的竞争力交付，对产品的用户体验负责 2. 负责算法准入把关、高性能算法sdk的整体架构设计、审评和演进，对可复用性、性能、兼容性和功耗等体验负责 3. 负责团队的人员的识别和培养，组织团队内的培训和技术交流，促进团队成员进步。

更新于 2026-06-12北京

高性能计算工程师

社招5年以上腾讯云技术

1.超大规模LLM性能工程：主导并规划千亿参数级大模型的极致性能优化技术路线。负责 PagedAttention、连续批处理等核心调度策略的深度定制与生产级架构设计，负责 vLLM/TensorRT-LLM 等主流推理框架的内核级优化与落地； 2.低比特与稀疏模型优化：牵头 INT4/FP8/AWQ 等前沿低比特量化技术的工业级系统化落地，平衡精度与计算效率。并设计面向 MoE 模型的分布式调度、路由、显存管理及跨卡通信的优化方案； 3.统一与多模态架构：定义并设计一套具备长期扩展性的统一 AI 推理引擎架构，以支撑自回归生成任务，并前瞻性地解决多模态大模型（如视觉-语言模型）的协同推理部署挑战； 4.异构算力与国产化适配：主导推理引擎在国产AI芯片（如昇腾、海光、天数等）平台上的战略级移植、生态适配与性能优化。对 HCCL/NCCL 等通信原语进行深度优化和定制，实现跨异构架构的算力自主可控； 5.核心算子优化与指令架构创新 (Enhanced Focus):深度介入 GPU/NPU 硬件底层，主导设计和实现LLM特有高性能算子。重点包括：高性能Attention Kernel、矩阵乘法（GEMM）的深度定制与融合、KV Cache读写优化等关键算子； 6.具备深入理解和利用硬件指令集架构（ISA）和微架构（Microarchitecture）的能力，通过 CUDA/Triton 或国产芯片底层编程语言，进行SIMD/SIMT指令优化、指令级并行（ILP）及寄存器重用等，将LLM推理性能推向硬件理论极限。

更新于 2026-07-01上海

高性能计算工程师

社招3年以上腾讯云技术

更新于 2026-04-08杭州

高性能计算工程师

社招3年以上腾讯云技术

更新于 2026-04-08深圳