字节跳动大模型推理优化工程师-Commercial AI
任职要求
1、代码能力、数据结构和基础算法功底,熟练掌握Linux环境下的C/C++、Python; 2、熟悉至少一种机器学习框架(PyTorch/TensorFlow/PaddlePaddle/Mindspore等训练框架),以及对应框架相应技术生态; 3、熟悉大模型推理框架(如vLLM/SGLang/TRT-LLM等框架); 4、掌握分布式系统原理,参与过分布式系统的设计、开发和维护; 5、有强…
工作职责
1、负责超大规模机器学习系统架构的设计开发,解决系统高并发、高可靠性、高可扩展性等技术难关; 2、负责大模型分布式推理任务性能优化,流量调度,池化部署等,涵盖LLM/MLLM/Diffusion等多个场景; 3、与算法部门深度合作,进行算法与系统的联合优化; 4、国产硬件的适配和性能优化。

岗位概述 参与美图影像研究院(MT Lab)核心 AI 底层基础设施与前沿交互应用的研发。作为支撑算法落地的全栈工程核心,你将参与构建从底层算子优化、算法中台到上层 AR 渲染的全链路系统,将前沿的计算机视觉与 AIGC 理论转化为影响亿级用户的真实影像体验。 本岗位为 2026 年暑期实习,全职实习时长 5 个月以上。实习期间表现优秀者,将有机会获得留用。 职责方向 ● 算法平台研发: 参与 AI 算法中台及基础设施的架构设计与 C++ 开发,构建支撑海量数据与大模型的高效训练、自动化评测与部署工具链。 ● 前沿 AR 研发: 参与跨平台 AR 特效引擎及图形渲染的底层研发,配合设计师打造创新 AR 特效,并对渲染相关技术进行前瞻性研究。 ● 极限算法调优: 深入 AI 落地“最后一公里”,负责深度学习模型在异构硬件(移动端/PC/服务端)上的极限性能调优,涵盖算子优化、内存管理及并发加速。 ● 全栈工程协作: 与顶尖算法研究员深度协作,以全栈视角理解复杂 AI 逻辑,设计高可用、高扩展的工程架构,加速 AI 能力的业务化落地。 任职资格 ● 教育背景: 本科及以上学历在读,计算机、人工智能、数学、电子等相关专业。 ● 计算机基础: 具备极度扎实的计算机科学基础,深入理解数据结构与算法、操作系统体系结构及计算机原理。 ● C++ 编程能力: 熟练掌握 C/C++,具备优秀的系统级开发、性能 Profiling 与复杂问题 Debug 能力,代码风格优雅。 ● AI Native 心态: 习惯并热衷于利用大模型等 AI 工具辅助开发。 ● 算法好奇心: 能够从底层架构视角洞察 AI 模型的工作原理,有志于成长为“懂算法”的全栈工程师。 ● 沟通与内驱力: 具备良好的沟通能力,能清晰阐述技术权衡;有独立解决前沿工程难题的内驱力。 加分项 ● 底层优化经验: 熟悉 ARM NEON 汇编、CUDA/OpenCL 编程,或有 TensorRT、NCNN 等推理框架实战经验。 ● 图形学背景: 熟悉计算机图形学,有 OpenGL、Vulkan 或 Metal 等底层图形 API 开发经验。 ● 开源与竞赛: 在 GitHub 相关生态中有实际 PR 贡献,或在 ACM/ICPC、NOI 等高水平算法竞赛中获得过优异成绩。 Overview: Join the MT Lab to build core AI infrastructure and pioneering interactive applications. As a full-stack engineering core supporting algorithm deployment, you will work on an end-to-end system spanning low-level operator optimization, algorithm middleware, and high-level AR rendering. Your mission is to transform cutting-edge Computer Vision and AIGC theories into ultimate imaging experiences for hundreds of millions of users. This is a full-time summer 2026 internship (5+ months). Strong performers will be considered for a return offer. Responsibilities ● Algorithm Platform R&D: Contribute to the architectural design and C++ development of AI middleware and infrastructures. You will build toolchains that support high-efficiency training, automated evaluation, and deployment for massive data and large-scale models. ● Frontier AR Development: Engage in the low-level C++ development of cross-platform AR engines and graphics rendering. Work closely with designers to create innovative AR effects and conduct forward-looking research on rendering technologies. ● Extreme Algorithm Tuning: Solve the "last mile" of AI deployment by conducting extreme performance optimization on heterogeneous hardware (Mobile/PC/Server), covering operator optimization, memory management, and multi-threading. ● Full-Stack Engineering Collaboration: Work closely with top-tier research scientists. You will interpret complex AI logic from a full-stack perspective to design high-availability and scalable architectures, accelerating the commercialization of AI capabilities.

岗位概述 参与美图影像研究院(MT Lab)核心 AI 底层基础设施与前沿交互应用的研发。作为支撑算法落地的全栈工程核心,你将参与构建从底层算子优化、算法中台到上层 AR 渲染的全链路系统,将前沿的计算机视觉与 AIGC 理论转化为影响亿级用户的真实影像体验。 本岗位为 2026 年暑期实习,全职实习时长 5 个月以上。实习期间表现优秀者,将有机会获得留用。 职责方向 ● 算法平台研发: 参与 AI 算法中台及基础设施的架构设计与 C++ 开发,构建支撑海量数据与大模型的高效训练、自动化评测与部署工具链。 ● 前沿 AR 研发: 参与跨平台 AR 特效引擎及图形渲染的底层研发,配合设计师打造创新 AR 特效,并对渲染相关技术进行前瞻性研究。 ● 极限算法调优: 深入 AI 落地“最后一公里”,负责深度学习模型在异构硬件(移动端/PC/服务端)上的极限性能调优,涵盖算子优化、内存管理及并发加速。 ● 全栈工程协作: 与顶尖算法研究员深度协作,以全栈视角理解复杂 AI 逻辑,设计高可用、高扩展的工程架构,加速 AI 能力的业务化落地。 任职资格 ● 教育背景: 本科及以上学历在读,计算机、人工智能、数学、电子等相关专业。 ● 计算机基础: 具备极度扎实的计算机科学基础,深入理解数据结构与算法、操作系统体系结构及计算机原理。 ● C++ 编程能力: 熟练掌握 C/C++,具备优秀的系统级开发、性能 Profiling 与复杂问题 Debug 能力,代码风格优雅。 ● AI Native 心态: 习惯并热衷于利用大模型等 AI 工具辅助开发。 ● 算法好奇心: 能够从底层架构视角洞察 AI 模型的工作原理,有志于成长为“懂算法”的全栈工程师。 ● 沟通与内驱力: 具备良好的沟通能力,能清晰阐述技术权衡;有独立解决前沿工程难题的内驱力。 加分项 ● 底层优化经验: 熟悉 ARM NEON 汇编、CUDA/OpenCL 编程,或有 TensorRT、NCNN 等推理框架实战经验。 ● 图形学背景: 熟悉计算机图形学,有 OpenGL、Vulkan 或 Metal 等底层图形 API 开发经验。 ● 开源与竞赛: 在 GitHub 相关生态中有实际 PR 贡献,或在 ACM/ICPC、NOI 等高水平算法竞赛中获得过优异成绩。 Overview: Join the MT Lab to build core AI infrastructure and pioneering interactive applications. As a full-stack engineering core supporting algorithm deployment, you will work on an end-to-end system spanning low-level operator optimization, algorithm middleware, and high-level AR rendering. Your mission is to transform cutting-edge Computer Vision and AIGC theories into ultimate imaging experiences for hundreds of millions of users. This is a full-time summer 2026 internship (5+ months). Strong performers will be considered for a return offer. Responsibilities ● Algorithm Platform R&D: Contribute to the architectural design and C++ development of AI middleware and infrastructures. You will build toolchains that support high-efficiency training, automated evaluation, and deployment for massive data and large-scale models. ● Frontier AR Development: Engage in the low-level C++ development of cross-platform AR engines and graphics rendering. Work closely with designers to create innovative AR effects and conduct forward-looking research on rendering technologies. ● Extreme Algorithm Tuning: Solve the "last mile" of AI deployment by conducting extreme performance optimization on heterogeneous hardware (Mobile/PC/Server), covering operator optimization, memory management, and multi-threading. ● Full-Stack Engineering Collaboration: Work closely with top-tier research scientists. You will interpret complex AI logic from a full-stack perspective to design high-availability and scalable architectures, accelerating the commercialization of AI capabilities.
我们是小红书中台大模型 Infra 团队,专注打造领先易用的「AI 大模型全链路基础设施」!团队深耕大模型「数-训-压-推-评」技术闭环,在大模型训练加速、模型压缩、推理优化、部署提效等方向积累了深厚的技术优势,基于 RedAccel 训练引擎、RedSlim 压缩工具、RedServing 推理部署引擎、DirectLLM 大模型 API 服务、QuickSilver 大模型生产部署平台等核心产品,持续赋能社区、商业、交易、安全、数平、研效等多个核心业务,实现 AI 技术高效落地! 1、参与设计实现支持RLHF/DPO等对齐技术的高效训练框架,优化强化学习阶段的Rollout、Reward Model集成、多阶段训练 Pipline; 2、研发支持多机多卡 RL 的分布式训练框架,开发TP/PP/ZeRO-3与RL流程的动态协同机制,解决 RL 算法在超长时序下的显存/通信瓶刭 3、构建端到端后训练工具链,主导框架与 MLOps 平台集成,提供训练可视化、自动超参搜索等生产级能力 4、与公司各算法部门深度合作,参与大语言模型LLM、多模态大模型 MLLM等业务在 SFT/RL领域的算法探索和引擎迭代; 5、参与分析各业务 GPU 利用率与饱和度等指标,结合业务场景持续优化训练框架能力,提升框架领先性。
【业务介绍】 作为公司统一的机器学习平台团队,负责调度公司所有模型训练与推理资源;基于自建的训推引擎,构建公司统一的机器学习平台,为公司所有算法同学(稀疏 & 稠密,含 LLM) 模型迭代提供端到端的一站式服务;包括 数据生产,模型训练,模型上线,特征管理,模型测试,资源管控等一系列能力。 【岗位职责】 1、负责机器学习链路,离在线数据相关的开发工作,包括样本数据、特征数据等的数据链路搭建、任务运维和调优、性能优化等 2、负责小红书大规模机器学习平台的后台系统设计和开发工作;包括样本平台,特征平台,训练平台,推理平台等AI应用后台建设等; 3、研究分析业内AI平台产品,优化技术方案,改进产品功能,完善产品体验。