字节跳动深度学习异构计算研发工程师（国产卡加速方向）

社招全职A1968102024-05-24地点：上海状态：招聘

扫码手机上打开

任职要求

1、本科及以上学历，计算机/电子/信息/通信/自动化/软件等相关专业，有AI工程优化经验的优先；
2、精通C/C++，精通算法与数据结构；熟悉镜像搭建和制作，了解服务端Debug流程；
3、深入理解计算机体系结构，熟悉AscendC/BangC/CUDA中的一种或者多种，熟悉计算密集型算子如F…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1、负责研发AI推理框架，适配并优化国产异构计算芯片，支持抖音、剪映等产品中的生成式算法落地，支撑字节跳动AI方向重要业务的发展；
2、负责使用国产芯片进行SD、多模态模型训练加速和推理加速。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

C+

C+++

还有更多 •••

登录查看完整学习资料

相关职位

视觉技术部视觉架构研发工程师（J83377）

社招TPG

-从事视觉感知、视觉生成、数字人等相关研发工作，聚焦高性能计算，追求产品性能和灵活性。 - 国产硬件适配 -分布式向量检索 -视频和视频流感知与生成 -平台化任务调度等。

更新于 2025-03-21北京

大模型异构计算优化工程师/专家

社招3-5年引擎

1、核心引擎开发与优化：负责或深度参与基于国产异构计算芯片（如NPU/PPU等）的大模型训练/推理引擎的架构设计、开发与迭代，构建高性能、高稳定性的上层软件栈； 2、大模型业务落地：将引擎能力应用于公司核心业务，主导或参与多模态、大语言模型等前沿AI模型在国产芯片上的训练、微调与推理部署，解决实际落地中的技术难题； 3、极致性能调优：针对各类业务大模型，进行深度的推理调度策略优化和关键算子（Kernel）的性能剖析与极致优化，持续提升系统的吞吐量、降低延迟； 4、生态合作与协同：作为技术接口人，与国产芯片原厂技术支持团队紧密合作，高效推进芯片驱动、基础软件栈的引入、问题排查与版本迭代，确保技术路线顺畅推进。

更新于 2026-03-28北京|上海

AI系统方案架构师

社招5年以上

1、跟踪行业最新技术动态，为公司的AI芯片技术发展提供前瞻性的建议和技术储备； 2、跟踪GPGPU/NPU行业最新动态、产品与技术架构，分析公司内外部业务系统需求，结合自研芯片架构，输出系统软硬件协同设计方案； 3、负责组织硬件平台、软件平台、生态平台等AI组件的SE专家，一起协同工作交付有竞争力的AI整体系统方案，并指导开发团队完成方案的开发交付落地； 4、推理基础设施方案设计，针对产品业务场景，优化模型在边缘设备（自研芯片平台、Jetson、机器人嵌入式系统）的部署性能，实现模型量化、动态计算图裁剪、异构硬件（GPU/NPU/FPGA）适配等关键技术；

更新于 2024-03-06上海

深度学习异构计算研发工程师（ AI 推理引擎方向）-PDI

社招A16530

1、负责端侧模型推理框架开发，包括模型压缩、优化技术，在端侧的接入、适配、算子开发工作，使之符合业务要求，提高性能收益； 2、负责探索和落地 AI 模型工程部署前沿技术，包括但不限于稀疏计算、编译优化。

更新于 2023-11-30上海