logo of bytedance

字节跳动AI芯片系统软件实习生-芯片研发

实习兼职A21353地点:北京状态:招聘

任职要求


1、2026届本科及以上学历在读,计算机、体系结构等相关专业;
2、每周至少实习4天,至少实习3个月,可长期实习优先考虑;
3、熟悉计算机体系架构,对深度学习有深入的理解,对GPGPU/NPU/CIM存算体系结构至少熟悉一种,理解其微架构、主要指令集等;
4、熟悉Linux C/C++开发,有Linux内核设备驱动开发调试经验;
5、熟悉Nvidia/A…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。
团队介绍:字节芯片研发团队隶属于系统部,目前工作主要集中在芯片设计环节。该团队主要围绕字节自身业务展开芯片探索,为字节多项业务的专用场景定制硬件优化,设计多款基于先进半导体工艺的云端复杂芯片,以期提升性能、降低成本。早期若干芯片项目已经进入到量产部署阶段,有多次一版成功的投片经历,所用工艺包含多个主流的先进工艺节点。和系统部基础设施工作的整体协同,能更容易和更好地发挥芯片研发的价值。

1、参与AI加速芯片软件栈研发,包括芯片Firmware/驱动/工具的开发与测试;
2、参与AI加速芯片的架构与性能分析,软硬协同设计和验证,基于可编程接口进行算子用例开发;
3、参与GPGPU/NPU/CIM新技术架构和新产品的调研分析;
4、参与C2C/D2D等高速接口的调试/测试,包括SDK和相关工具开发和调试。
包括英文材料
学历+
深度学习+
Linux+
C+
还有更多 •••
相关职位

logo of bytedance
实习A04067

ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:字节芯片研发团队隶属于系统部,目前工作主要集中在芯片设计环节。该团队主要围绕字节自身业务展开芯片探索,为字节多项业务的专用场景定制硬件优化,设计多款基于先进半导体工艺的云端复杂芯片,以期提升性能、降低成本。早期若干芯片项目已经进入到量产部署阶段,有多次一版成功的投片经历,所用工艺包含多个主流的先进工艺节点。和系统部基础设施工作的整体协同,能更容易和更好地发挥芯片研发的价值。 1、参与AI加速芯片软件栈研发,包括芯片Firmware/驱动/工具的开发与测试; 2、参与AI加速芯片的架构与性能分析,软硬协同设计和验证,基于可编程接口进行算子用例开发; 3、参与GPGPU/NPU/CIM新技术架构和新产品的调研分析; 4、参与C2C/D2D等高速接口的调试/测试,包括SDK和相关工具开发和调试。

更新于 2025-03-27深圳
logo of bytedance
实习A161671

ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:字节芯片研发团队隶属于系统部,目前工作主要集中在芯片设计环节。该团队主要围绕字节自身业务展开芯片探索,为字节多项业务的专用场景定制硬件优化,设计多款基于先进半导体工艺的云端复杂芯片,以期提升性能、降低成本。早期若干芯片项目已经进入到量产部署阶段,有多次一版成功的投片经历,所用工艺包含多个主流的先进工艺节点。和系统部基础设施工作的整体协同,能更容易和更好地发挥芯片研发的价值。 1、参与AI加速芯片软件栈研发,包括芯片Firmware/驱动/工具的开发与测试; 2、参与AI加速芯片的架构与性能分析,软硬协同设计和验证,基于可编程接口进行算子用例开发; 3、参与GPGPU/NPU/CIM新技术架构和新产品的调研分析; 4、参与C2C/D2D等高速接口的调试/测试,包括SDK和相关工具开发和调试。

更新于 2025-02-18上海
logo of bytedance
实习A83950

ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:字节芯片研发团队隶属于系统部,目前工作主要集中在芯片设计环节。该团队主要围绕字节自身业务展开芯片探索,为字节多项业务的专用场景定制硬件优化,设计多款基于先进半导体工艺的云端复杂芯片,以期提升性能、降低成本。早期若干芯片项目已经进入到量产部署阶段,有多次一版成功的投片经历,所用工艺包含多个主流的先进工艺节点。和系统部基础设施工作的整体协同,能更容易和更好地发挥芯片研发的价值。 1、参与AI加速芯片软件栈研发,包括芯片Firmware/驱动/工具的开发与测试; 2、参与AI加速芯片的架构与性能分析,软硬协同设计和验证,基于可编程接口进行算子用例开发; 3、参与GPGPU/NPU/CIM新技术架构和新产品的调研分析; 4、参与C2C/D2D等高速接口的调试/测试,包括SDK和相关工具开发和调试。

更新于 2025-03-27杭州
logo of baidu
实习ACG

-结合前沿业务场景,构建昆仑芯AI大规模训练推理系统 -负责大模型分布式训练、推理框架的适配与调优,设计千卡级集群通信加速、混合精度训练等方案 -为昆仑芯AI芯片各系列高性能加速芯片提供软件栈,包括框架,图编译器以及周边产品的技术落地 -AI芯片性能深度学习高性能计算库开发,支持各种AI场景,持续提升系统效能

更新于 2025-03-17北京|上海