logo of bytedance

字节跳动深度学习异构计算研发工程师(国产卡加速方向)

社招全职A196810地点:上海状态:招聘

任职要求


1、本科及以上学历,计算机/电子/信息/通信/自动化/软件等相关专业,有AI工程优化经验的优先;
2、精通C/C++,精通算法数据结构;熟悉镜像搭建和制作,了解服务端Debug流程;
3、深入理解计算机体系结构,熟悉AscendC/BangC/CUDA中的一种或者多种,熟悉计算密集型算子如Flash attention、Conv2d、GEMM、GEMV实现和加速;
4、熟悉Deepspeed、Megatron等训练加速框架;
5、了解主流AIGC、多模态算法模型原理,有AIGC训练和推理优化经验者优先;
6、了解Torch.compile、TVM等编译优化原理和有相关经验者优先。

工作职责


1、负责研发AI推理框架,适配并优化国产异构计算芯片,支持抖音、剪映等产品中的生成式算法落地,支撑字节跳动AI方向重要业务的发展;
2、负责使用国产芯片进行SD、多模态模型训练加速和推理加速。
包括英文材料
学历+
C+
C+++
算法+
数据结构+
CUDA+
Megatron+
相关职位

logo of baidu
社招TPG

-从事视觉感知、视觉生成、数字人等相关研发工作,聚焦高性能计算,追求产品性能和灵活性。 - 国产硬件适配 -分布式向量检索 -视频和视频流感知与生成 -平台化任务调度等。

更新于 2025-03-21
logo of xpeng
社招5年以上

1、跟踪行业最新技术动态,为公司的AI芯片技术发展提供前瞻性的建议和技术储备; 2、跟踪GPGPU/NPU行业最新动态、产品与技术架构,分析公司内外部业务系统需求,结合自研芯片架构,输出系统软硬件协同设计方案; 3、负责组织硬件平台、软件平台、生态平台等AI组件的SE专家,一起协同工作交付有竞争力的AI整体系统方案,并指导开发团队完成方案的开发交付落地; 4、推理基础设施方案设计,针对产品业务场景,优化模型在边缘设备(自研芯片平台、Jetson、机器人嵌入式系统)的部署性能,实现模型量化、动态计算图裁剪、异构硬件(GPU/NPU/FPGA)适配等关键技术;

更新于 2024-03-06
logo of bytedance
社招A16530

1、负责端侧模型推理框架开发,包括模型压缩、优化技术,在端侧的接入、适配、算子开发工作,使之符合业务要求,提高性能收益; 2、负责探索和落地 AI 模型工程部署前沿技术,包括但不限于稀疏计算、编译优化。

更新于 2023-11-30
logo of baidu
社招TPG

-参与深度学习平台飞桨( PaddlePaddle)推理框架的设计、开发和业务支持 -负责深度学习框架的性能优化工作,包括但不限于功能模块在CPU/GPU上的深度优化工作 -负责深度学习推理框架前瞻技术的跟踪调研,实现技术创新突破 -参与深度学习框架的易用性优化工作,使开发者能够以更简单的方式实现各类任务,降低学习成本和开发成本 -负责异构高性能计算平台的设计、研发,高性能计算库、通信库开发与优化 -负责文心一言、萝卜快跑、搜索等业务大模型的推理性能优化

更新于 2025-06-10