logo of bytedance

字节跳动深度学习异构计算研发工程师(国产卡加速方向)

社招全职A196810地点:上海状态:招聘

任职要求


1、本科及以上学历,计算机/电子/信息/通信/自动化/软件等相关专业,有AI工程优化经验的优先;
2、精通C/C++,精通算法与数据结构;熟悉镜像搭建和制作,了解服务端Debug流程;
3、深入理解计算机体系结构,熟悉AscendC/BangC/CUDA中的一种或者多种,熟悉计算密集型算子如F…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、负责研发AI推理框架,适配并优化国产异构计算芯片,支持抖音、剪映等产品中的生成式算法落地,支撑字节跳动AI方向重要业务的发展;
2、负责使用国产芯片进行SD、多模态模型训练加速和推理加速。
包括英文材料
学历+
C+
C+++
还有更多 •••
相关职位

logo of baidu
社招TPG

-从事视觉感知、视觉生成、数字人等相关研发工作,聚焦高性能计算,追求产品性能和灵活性。 - 国产硬件适配 -分布式向量检索 -视频和视频流感知与生成 -平台化任务调度等。

更新于 2025-03-21北京
logo of xiaohongshu
社招3-5年引擎

1、核心引擎开发与优化:负责或深度参与基于国产异构计算芯片(如NPU/PPU等)的大模型训练/推理引擎的架构设计、开发与迭代,构建高性能、高稳定性的上层软件栈; 2、大模型业务落地:将引擎能力应用于公司核心业务,主导或参与多模态、大语言模型等前沿AI模型在国产芯片上的训练、微调与推理部署,解决实际落地中的技术难题; 3、极致性能调优:针对各类业务大模型,进行深度的推理调度策略优化和关键算子(Kernel)的性能剖析与极致优化,持续提升系统的吞吐量、降低延迟; 4、生态合作与协同:作为技术接口人,与国产芯片原厂技术支持团队紧密合作,高效推进芯片驱动、基础软件栈的引入、问题排查与版本迭代,确保技术路线顺畅推进。

更新于 2026-02-02北京|上海
logo of xpeng
社招5年以上

1、跟踪行业最新技术动态,为公司的AI芯片技术发展提供前瞻性的建议和技术储备; 2、跟踪GPGPU/NPU行业最新动态、产品与技术架构,分析公司内外部业务系统需求,结合自研芯片架构,输出系统软硬件协同设计方案; 3、负责组织硬件平台、软件平台、生态平台等AI组件的SE专家,一起协同工作交付有竞争力的AI整体系统方案,并指导开发团队完成方案的开发交付落地; 4、推理基础设施方案设计,针对产品业务场景,优化模型在边缘设备(自研芯片平台、Jetson、机器人嵌入式系统)的部署性能,实现模型量化、动态计算图裁剪、异构硬件(GPU/NPU/FPGA)适配等关键技术;

更新于 2024-03-06上海
logo of bytedance
社招A16530

1、负责端侧模型推理框架开发,包括模型压缩、优化技术,在端侧的接入、适配、算子开发工作,使之符合业务要求,提高性能收益; 2、负责探索和落地 AI 模型工程部署前沿技术,包括但不限于稀疏计算、编译优化。

更新于 2023-11-30上海