【字节跳动】硬件加速训练框架研发工程师-Data

社招A147267

1、负责内部机器学习平台训练框架的研究与开发（包括数据预处理/训练/推理），服务于广告、推荐、搜索等场景； 2、负责实时高性能推理系统设计与开发，如算子融合、编译优化、模型量化、混合精度、异构硬件加速等； 3、负责性能优化与架构升级，持续提升数据预处理/训练/推理性能； 4、与算法工程师深度合作，为重点项目进行算法与系统的联合优化。

更新于 2024-04-26北京

C++ 研发实习生（算法工程方向）/ C++ R&D Intern (Algorithm Engineering)（深圳）

校招研发类

岗位概述参与美图影像研究院（MT Lab）核心 AI 底层基础设施与前沿交互应用的研发。作为支撑算法落地的全栈工程核心，你将参与构建从底层算子优化、算法中台到上层 AR 渲染的全链路系统，将前沿的计算机视觉与 AIGC 理论转化为影响亿级用户的真实影像体验。本岗位为 2026 年暑期实习，全职实习时长 5 个月以上。实习期间表现优秀者，将有机会获得留用。职责方向 ● 算法平台研发：参与 AI 算法中台及基础设施的架构设计与 C++ 开发，构建支撑海量数据与大模型的高效训练、自动化评测与部署工具链。 ● 前沿 AR 研发：参与跨平台 AR 特效引擎及图形渲染的底层研发，配合设计师打造创新 AR 特效，并对渲染相关技术进行前瞻性研究。 ● 极限算法调优：深入 AI 落地“最后一公里”，负责深度学习模型在异构硬件（移动端/PC/服务端）上的极限性能调优，涵盖算子优化、内存管理及并发加速。 ● 全栈工程协作：与顶尖算法研究员深度协作，以全栈视角理解复杂 AI 逻辑，设计高可用、高扩展的工程架构，加速 AI 能力的业务化落地。任职资格 ● 教育背景：本科及以上学历在读，计算机、人工智能、数学、电子等相关专业。 ● 计算机基础：具备极度扎实的计算机科学基础，深入理解数据结构与算法、操作系统体系结构及计算机原理。 ● C++ 编程能力：熟练掌握 C/C++，具备优秀的系统级开发、性能 Profiling 与复杂问题 Debug 能力，代码风格优雅。 ● AI Native 心态：习惯并热衷于利用大模型等 AI 工具辅助开发。 ● 算法好奇心：能够从底层架构视角洞察 AI 模型的工作原理，有志于成长为“懂算法”的全栈工程师。 ● 沟通与内驱力：具备良好的沟通能力，能清晰阐述技术权衡；有独立解决前沿工程难题的内驱力。加分项 ● 底层优化经验：熟悉 ARM NEON 汇编、CUDA/OpenCL 编程，或有 TensorRT、NCNN 等推理框架实战经验。 ● 图形学背景：熟悉计算机图形学，有 OpenGL、Vulkan 或 Metal 等底层图形 API 开发经验。 ● 开源与竞赛：在 GitHub 相关生态中有实际 PR 贡献，或在 ACM/ICPC、NOI 等高水平算法竞赛中获得过优异成绩。 Overview: Join the MT Lab to build core AI infrastructure and pioneering interactive applications. As a full-stack engineering core supporting algorithm deployment, you will work on an end-to-end system spanning low-level operator optimization, algorithm middleware, and high-level AR rendering. Your mission is to transform cutting-edge Computer Vision and AIGC theories into ultimate imaging experiences for hundreds of millions of users. This is a full-time summer 2026 internship (5+ months). Strong performers will be considered for a return offer. Responsibilities ● Algorithm Platform R&D: Contribute to the architectural design and C++ development of AI middleware and infrastructures. You will build toolchains that support high-efficiency training, automated evaluation, and deployment for massive data and large-scale models. ● Frontier AR Development: Engage in the low-level C++ development of cross-platform AR engines and graphics rendering. Work closely with designers to create innovative AR effects and conduct forward-looking research on rendering technologies. ● Extreme Algorithm Tuning: Solve the "last mile" of AI deployment by conducting extreme performance optimization on heterogeneous hardware (Mobile/PC/Server), covering operator optimization, memory management, and multi-threading. ● Full-Stack Engineering Collaboration: Work closely with top-tier research scientists. You will interpret complex AI logic from a full-stack perspective to design high-availability and scalable architectures, accelerating the commercialization of AI capabilities.

更新于 2026-05-20深圳

C++ 研发实习生（算法工程方向）/ C++ R&D Intern (Algorithm Engineering)（厦门）

校招研发类

岗位概述参与美图影像研究院（MT Lab）核心 AI 底层基础设施与前沿交互应用的研发。作为支撑算法落地的全栈工程核心，你将参与构建从底层算子优化、算法中台到上层 AR 渲染的全链路系统，将前沿的计算机视觉与 AIGC 理论转化为影响亿级用户的真实影像体验。本岗位为 2026 年暑期实习，全职实习时长 5 个月以上。实习期间表现优秀者，将有机会获得留用。职责方向 ● 算法平台研发：参与 AI 算法中台及基础设施的架构设计与 C++ 开发，构建支撑海量数据与大模型的高效训练、自动化评测与部署工具链。 ● 前沿 AR 研发：参与跨平台 AR 特效引擎及图形渲染的底层研发，配合设计师打造创新 AR 特效，并对渲染相关技术进行前瞻性研究。 ● 极限算法调优：深入 AI 落地“最后一公里”，负责深度学习模型在异构硬件（移动端/PC/服务端）上的极限性能调优，涵盖算子优化、内存管理及并发加速。 ● 全栈工程协作：与顶尖算法研究员深度协作，以全栈视角理解复杂 AI 逻辑，设计高可用、高扩展的工程架构，加速 AI 能力的业务化落地。任职资格 ● 教育背景：本科及以上学历在读，计算机、人工智能、数学、电子等相关专业。 ● 计算机基础：具备极度扎实的计算机科学基础，深入理解数据结构与算法、操作系统体系结构及计算机原理。 ● C++ 编程能力：熟练掌握 C/C++，具备优秀的系统级开发、性能 Profiling 与复杂问题 Debug 能力，代码风格优雅。 ● AI Native 心态：习惯并热衷于利用大模型等 AI 工具辅助开发。 ● 算法好奇心：能够从底层架构视角洞察 AI 模型的工作原理，有志于成长为“懂算法”的全栈工程师。 ● 沟通与内驱力：具备良好的沟通能力，能清晰阐述技术权衡；有独立解决前沿工程难题的内驱力。加分项 ● 底层优化经验：熟悉 ARM NEON 汇编、CUDA/OpenCL 编程，或有 TensorRT、NCNN 等推理框架实战经验。 ● 图形学背景：熟悉计算机图形学，有 OpenGL、Vulkan 或 Metal 等底层图形 API 开发经验。 ● 开源与竞赛：在 GitHub 相关生态中有实际 PR 贡献，或在 ACM/ICPC、NOI 等高水平算法竞赛中获得过优异成绩。 Overview: Join the MT Lab to build core AI infrastructure and pioneering interactive applications. As a full-stack engineering core supporting algorithm deployment, you will work on an end-to-end system spanning low-level operator optimization, algorithm middleware, and high-level AR rendering. Your mission is to transform cutting-edge Computer Vision and AIGC theories into ultimate imaging experiences for hundreds of millions of users. This is a full-time summer 2026 internship (5+ months). Strong performers will be considered for a return offer. Responsibilities ● Algorithm Platform R&D: Contribute to the architectural design and C++ development of AI middleware and infrastructures. You will build toolchains that support high-efficiency training, automated evaluation, and deployment for massive data and large-scale models. ● Frontier AR Development: Engage in the low-level C++ development of cross-platform AR engines and graphics rendering. Work closely with designers to create innovative AR effects and conduct forward-looking research on rendering technologies. ● Extreme Algorithm Tuning: Solve the "last mile" of AI deployment by conducting extreme performance optimization on heterogeneous hardware (Mobile/PC/Server), covering operator optimization, memory management, and multi-threading. ● Full-Stack Engineering Collaboration: Work closely with top-tier research scientists. You will interpret complex AI logic from a full-stack perspective to design high-availability and scalable architectures, accelerating the commercialization of AI capabilities.

更新于 2026-05-20厦门

AI芯片研发工程师-芯片研发-筋斗云人才计划

校招A21770

团队介绍：字节芯片研发团队隶属于系统部，目前工作主要集中在芯片设计环节。该团队主要围绕字节自身业务展开芯片探索，为字节多项业务的专用场景定制硬件优化，设计多款基于先进半导体工艺的云端复杂芯片，以期提升性能、降低成本。早期若干芯片项目已经进入到量产部署阶段，有多次一版成功的投片经历，所用工艺包含多个主流的先进工艺节点。和系统部基础设施工作的整体协同，能更容易和更好地发挥芯片研发的价值。课题介绍：探索电路、SoC和算法的协同架构；负责创新电路、架构和系统设计；与硬件设计团队合作，实现高协同的架构和系统设计。研究方向：电路设计系统、芯片设计、半导体、机器学习、深度学习、计算机架构。一、架构设计 1、负责AI芯片架构的探索与设计方案，包括计算/互联/存储等方向； 2、负责AI推理/训练系统的软硬件协同优化方案； 3、负责不同业务场景下AI模型结构和算子特性分析、硬件实现方案制定以及性能优化。二、ASIC设计 1、负责数据中心内ASIC芯片的微架构探索、RTL设计和集成，包括计算/互联/访存几个方向； 2、支持AI加速芯片的Power/Performance/Area优化和设计流程优化； 3、跟踪调研业界最新AI芯片微架构，并进行量化分析和总结，梳理AI微架构benchmark。三、AI工具链 1、负责硬件加速器训练框架研发； 2、参与软硬件协同设计，对关键硬件参数进行仿真； 3、负责实际业务模型训练任务调研； 4、负责训练中通信算子研发以及性能优化。

更新于 2025-05-26北京

字节跳动硬件加速训练框架研发工程师-Data

任职要求

工作职责