字节跳动硬件加速训练框架研发工程师-Data
任职要求
1、对数据并行、模型并行、分布式数据并行等常见训练模式有深入理解; 2、参与过硬件加速器训练相关研发工作,包含算子开发、编译调度优化等; 3、有主动学习、快速解决问题的能力和自我驱动力。 以下为加分项: 1、熟悉计算机体系结构和并行计算; 2、了解编译器和代码…
工作职责
1、负责硬件加速器训练框架调研; 2、参与软硬件协同设计,对关键硬件参数进行仿真; 3、负责实际业务模型训练任务调研; 4、负责训练中通信算子研发以及性能优化。
1、负责内部机器学习平台训练框架的研究与开发(包括数据预处理/训练/推理),服务于广告、推荐、搜索等场景; 2、负责实时高性能推理系统设计与开发,如算子融合、编译优化、模型量化、混合精度、异构硬件加速等; 3、负责性能优化与架构升级,持续提升数据预处理/训练/推理性能; 4、与算法工程师深度合作,为重点项目进行算法与系统的联合优化。

岗位概述 参与美图影像研究院(MT Lab)核心 AI 底层基础设施与前沿交互应用的研发。作为支撑算法落地的全栈工程核心,你将参与构建从底层算子优化、算法中台到上层 AR 渲染的全链路系统,将前沿的计算机视觉与 AIGC 理论转化为影响亿级用户的真实影像体验。 本岗位为 2026 年暑期实习,全职实习时长 5 个月以上。实习期间表现优秀者,将有机会获得留用。 职责方向 ● 算法平台研发: 参与 AI 算法中台及基础设施的架构设计与 C++ 开发,构建支撑海量数据与大模型的高效训练、自动化评测与部署工具链。 ● 前沿 AR 研发: 参与跨平台 AR 特效引擎及图形渲染的底层研发,配合设计师打造创新 AR 特效,并对渲染相关技术进行前瞻性研究。 ● 极限算法调优: 深入 AI 落地“最后一公里”,负责深度学习模型在异构硬件(移动端/PC/服务端)上的极限性能调优,涵盖算子优化、内存管理及并发加速。 ● 全栈工程协作: 与顶尖算法研究员深度协作,以全栈视角理解复杂 AI 逻辑,设计高可用、高扩展的工程架构,加速 AI 能力的业务化落地。 任职资格 ● 教育背景: 本科及以上学历在读,计算机、人工智能、数学、电子等相关专业。 ● 计算机基础: 具备极度扎实的计算机科学基础,深入理解数据结构与算法、操作系统体系结构及计算机原理。 ● C++ 编程能力: 熟练掌握 C/C++,具备优秀的系统级开发、性能 Profiling 与复杂问题 Debug 能力,代码风格优雅。 ● AI Native 心态: 习惯并热衷于利用大模型等 AI 工具辅助开发。 ● 算法好奇心: 能够从底层架构视角洞察 AI 模型的工作原理,有志于成长为“懂算法”的全栈工程师。 ● 沟通与内驱力: 具备良好的沟通能力,能清晰阐述技术权衡;有独立解决前沿工程难题的内驱力。 加分项 ● 底层优化经验: 熟悉 ARM NEON 汇编、CUDA/OpenCL 编程,或有 TensorRT、NCNN 等推理框架实战经验。 ● 图形学背景: 熟悉计算机图形学,有 OpenGL、Vulkan 或 Metal 等底层图形 API 开发经验。 ● 开源与竞赛: 在 GitHub 相关生态中有实际 PR 贡献,或在 ACM/ICPC、NOI 等高水平算法竞赛中获得过优异成绩。 Overview: Join the MT Lab to build core AI infrastructure and pioneering interactive applications. As a full-stack engineering core supporting algorithm deployment, you will work on an end-to-end system spanning low-level operator optimization, algorithm middleware, and high-level AR rendering. Your mission is to transform cutting-edge Computer Vision and AIGC theories into ultimate imaging experiences for hundreds of millions of users. This is a full-time summer 2026 internship (5+ months). Strong performers will be considered for a return offer. Responsibilities ● Algorithm Platform R&D: Contribute to the architectural design and C++ development of AI middleware and infrastructures. You will build toolchains that support high-efficiency training, automated evaluation, and deployment for massive data and large-scale models. ● Frontier AR Development: Engage in the low-level C++ development of cross-platform AR engines and graphics rendering. Work closely with designers to create innovative AR effects and conduct forward-looking research on rendering technologies. ● Extreme Algorithm Tuning: Solve the "last mile" of AI deployment by conducting extreme performance optimization on heterogeneous hardware (Mobile/PC/Server), covering operator optimization, memory management, and multi-threading. ● Full-Stack Engineering Collaboration: Work closely with top-tier research scientists. You will interpret complex AI logic from a full-stack perspective to design high-availability and scalable architectures, accelerating the commercialization of AI capabilities.

岗位概述 参与美图影像研究院(MT Lab)核心 AI 底层基础设施与前沿交互应用的研发。作为支撑算法落地的全栈工程核心,你将参与构建从底层算子优化、算法中台到上层 AR 渲染的全链路系统,将前沿的计算机视觉与 AIGC 理论转化为影响亿级用户的真实影像体验。 本岗位为 2026 年暑期实习,全职实习时长 5 个月以上。实习期间表现优秀者,将有机会获得留用。 职责方向 ● 算法平台研发: 参与 AI 算法中台及基础设施的架构设计与 C++ 开发,构建支撑海量数据与大模型的高效训练、自动化评测与部署工具链。 ● 前沿 AR 研发: 参与跨平台 AR 特效引擎及图形渲染的底层研发,配合设计师打造创新 AR 特效,并对渲染相关技术进行前瞻性研究。 ● 极限算法调优: 深入 AI 落地“最后一公里”,负责深度学习模型在异构硬件(移动端/PC/服务端)上的极限性能调优,涵盖算子优化、内存管理及并发加速。 ● 全栈工程协作: 与顶尖算法研究员深度协作,以全栈视角理解复杂 AI 逻辑,设计高可用、高扩展的工程架构,加速 AI 能力的业务化落地。 任职资格 ● 教育背景: 本科及以上学历在读,计算机、人工智能、数学、电子等相关专业。 ● 计算机基础: 具备极度扎实的计算机科学基础,深入理解数据结构与算法、操作系统体系结构及计算机原理。 ● C++ 编程能力: 熟练掌握 C/C++,具备优秀的系统级开发、性能 Profiling 与复杂问题 Debug 能力,代码风格优雅。 ● AI Native 心态: 习惯并热衷于利用大模型等 AI 工具辅助开发。 ● 算法好奇心: 能够从底层架构视角洞察 AI 模型的工作原理,有志于成长为“懂算法”的全栈工程师。 ● 沟通与内驱力: 具备良好的沟通能力,能清晰阐述技术权衡;有独立解决前沿工程难题的内驱力。 加分项 ● 底层优化经验: 熟悉 ARM NEON 汇编、CUDA/OpenCL 编程,或有 TensorRT、NCNN 等推理框架实战经验。 ● 图形学背景: 熟悉计算机图形学,有 OpenGL、Vulkan 或 Metal 等底层图形 API 开发经验。 ● 开源与竞赛: 在 GitHub 相关生态中有实际 PR 贡献,或在 ACM/ICPC、NOI 等高水平算法竞赛中获得过优异成绩。 Overview: Join the MT Lab to build core AI infrastructure and pioneering interactive applications. As a full-stack engineering core supporting algorithm deployment, you will work on an end-to-end system spanning low-level operator optimization, algorithm middleware, and high-level AR rendering. Your mission is to transform cutting-edge Computer Vision and AIGC theories into ultimate imaging experiences for hundreds of millions of users. This is a full-time summer 2026 internship (5+ months). Strong performers will be considered for a return offer. Responsibilities ● Algorithm Platform R&D: Contribute to the architectural design and C++ development of AI middleware and infrastructures. You will build toolchains that support high-efficiency training, automated evaluation, and deployment for massive data and large-scale models. ● Frontier AR Development: Engage in the low-level C++ development of cross-platform AR engines and graphics rendering. Work closely with designers to create innovative AR effects and conduct forward-looking research on rendering technologies. ● Extreme Algorithm Tuning: Solve the "last mile" of AI deployment by conducting extreme performance optimization on heterogeneous hardware (Mobile/PC/Server), covering operator optimization, memory management, and multi-threading. ● Full-Stack Engineering Collaboration: Work closely with top-tier research scientists. You will interpret complex AI logic from a full-stack perspective to design high-availability and scalable architectures, accelerating the commercialization of AI capabilities.
团队介绍:字节芯片研发团队隶属于系统部,目前工作主要集中在芯片设计环节。该团队主要围绕字节自身业务展开芯片探索,为字节多项业务的专用场景定制硬件优化,设计多款基于先进半导体工艺的云端复杂芯片,以期提升性能、降低成本。早期若干芯片项目已经进入到量产部署阶段,有多次一版成功的投片经历,所用工艺包含多个主流的先进工艺节点。和系统部基础设施工作的整体协同,能更容易和更好地发挥芯片研发的价值。 课题介绍:探索电路、SoC和算法的协同架构;负责创新电路、架构和系统设计;与硬件设计团队合作,实现高协同的架构和系统设计。 研究方向:电路设计系统、芯片设计、半导体、机器学习、深度学习、计算机架构。 一、架构设计 1、负责AI芯片架构的探索与设计方案,包括计算/互联/存储等方向; 2、负责AI推理/训练系统的软硬件协同优化方案; 3、负责不同业务场景下AI模型结构和算子特性分析、硬件实现方案制定以及性能优化。 二、ASIC设计 1、负责数据中心内ASIC芯片的微架构探索、RTL设计和集成,包括计算/互联/访存几个方向; 2、支持AI加速芯片的Power/Performance/Area优化和设计流程优化; 3、跟踪调研业界最新AI芯片微架构,并进行量化分析和总结,梳理AI微架构benchmark。 三、AI工具链 1、负责硬件加速器训练框架研发; 2、参与软硬件协同设计,对关键硬件参数进行仿真; 3、负责实际业务模型训练任务调研; 4、负责训练中通信算子研发以及性能优化。