字节跳动大模型推理优化工程师-Commercial AI

社招全职A97497A2026-05-21地点：北京状态：招聘

扫码手机上打开

任职要求

1、代码能力、数据结构和基础算法功底，熟练掌握Linux环境下的C/C++、Python；
2、熟悉至少一种机器学习框架（PyTorch/TensorFlow/PaddlePaddle/Mindspore等训练框架），以及对应框架相应技术生态；
3、熟悉大模型推理框架（如vLLM/SGLang/TRT-LLM等框架）；
4、掌握分布式系统原理，参与过分布式系统的设计、开发和维护；
5、有强…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1、负责超大规模机器学习系统架构的设计开发，解决系统高并发、高可靠性、高可扩展性等技术难关；
2、负责大模型分布式推理任务性能优化，流量调度，池化部署等，涵盖LLM/MLLM/Diffusion等多个场景；
3、与算法部门深度合作，进行算法与系统的联合优化；
4、国产硬件的适配和性能优化。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

数据结构+

算法+

Linux+

C+

C+++

Python+

机器学习+

PyTorch+

还有更多 •••

登录查看完整学习资料

相关职位

C++ 研发实习生（算法工程方向）/ C++ R&D Intern (Algorithm Engineering)（深圳）

校招研发类

岗位概述参与美图影像研究院（MT Lab）核心 AI 底层基础设施与前沿交互应用的研发。作为支撑算法落地的全栈工程核心，你将参与构建从底层算子优化、算法中台到上层 AR 渲染的全链路系统，将前沿的计算机视觉与 AIGC 理论转化为影响亿级用户的真实影像体验。本岗位为 2026 年暑期实习，全职实习时长 5 个月以上。实习期间表现优秀者，将有机会获得留用。职责方向 ● 算法平台研发：参与 AI 算法中台及基础设施的架构设计与 C++ 开发，构建支撑海量数据与大模型的高效训练、自动化评测与部署工具链。 ● 前沿 AR 研发：参与跨平台 AR 特效引擎及图形渲染的底层研发，配合设计师打造创新 AR 特效，并对渲染相关技术进行前瞻性研究。 ● 极限算法调优：深入 AI 落地“最后一公里”，负责深度学习模型在异构硬件（移动端/PC/服务端）上的极限性能调优，涵盖算子优化、内存管理及并发加速。 ● 全栈工程协作：与顶尖算法研究员深度协作，以全栈视角理解复杂 AI 逻辑，设计高可用、高扩展的工程架构，加速 AI 能力的业务化落地。任职资格 ● 教育背景：本科及以上学历在读，计算机、人工智能、数学、电子等相关专业。 ● 计算机基础：具备极度扎实的计算机科学基础，深入理解数据结构与算法、操作系统体系结构及计算机原理。 ● C++ 编程能力：熟练掌握 C/C++，具备优秀的系统级开发、性能 Profiling 与复杂问题 Debug 能力，代码风格优雅。 ● AI Native 心态：习惯并热衷于利用大模型等 AI 工具辅助开发。 ● 算法好奇心：能够从底层架构视角洞察 AI 模型的工作原理，有志于成长为“懂算法”的全栈工程师。 ● 沟通与内驱力：具备良好的沟通能力，能清晰阐述技术权衡；有独立解决前沿工程难题的内驱力。加分项 ● 底层优化经验：熟悉 ARM NEON 汇编、CUDA/OpenCL 编程，或有 TensorRT、NCNN 等推理框架实战经验。 ● 图形学背景：熟悉计算机图形学，有 OpenGL、Vulkan 或 Metal 等底层图形 API 开发经验。 ● 开源与竞赛：在 GitHub 相关生态中有实际 PR 贡献，或在 ACM/ICPC、NOI 等高水平算法竞赛中获得过优异成绩。 Overview: Join the MT Lab to build core AI infrastructure and pioneering interactive applications. As a full-stack engineering core supporting algorithm deployment, you will work on an end-to-end system spanning low-level operator optimization, algorithm middleware, and high-level AR rendering. Your mission is to transform cutting-edge Computer Vision and AIGC theories into ultimate imaging experiences for hundreds of millions of users. This is a full-time summer 2026 internship (5+ months). Strong performers will be considered for a return offer. Responsibilities ● Algorithm Platform R&D: Contribute to the architectural design and C++ development of AI middleware and infrastructures. You will build toolchains that support high-efficiency training, automated evaluation, and deployment for massive data and large-scale models. ● Frontier AR Development: Engage in the low-level C++ development of cross-platform AR engines and graphics rendering. Work closely with designers to create innovative AR effects and conduct forward-looking research on rendering technologies. ● Extreme Algorithm Tuning: Solve the "last mile" of AI deployment by conducting extreme performance optimization on heterogeneous hardware (Mobile/PC/Server), covering operator optimization, memory management, and multi-threading. ● Full-Stack Engineering Collaboration: Work closely with top-tier research scientists. You will interpret complex AI logic from a full-stack perspective to design high-availability and scalable architectures, accelerating the commercialization of AI capabilities.

更新于 2026-05-20深圳

C++ 研发实习生（算法工程方向）/ C++ R&D Intern (Algorithm Engineering)（厦门）

校招研发类

更新于 2026-05-20厦门

大模型训练框架研发工程师/专家

社招5-10年引擎

我们是小红书中台大模型 Infra 团队，专注打造领先易用的「AI 大模型全链路基础设施」！团队深耕大模型「数-训-压-推-评」技术闭环，在大模型训练加速、模型压缩、推理优化、部署提效等方向积累了深厚的技术优势，基于 RedAccel 训练引擎、RedSlim 压缩工具、RedServing 推理部署引擎、DirectLLM 大模型 API 服务、QuickSilver 大模型生产部署平台等核心产品，持续赋能社区、商业、交易、安全、数平、研效等多个核心业务，实现 AI 技术高效落地！ 1、参与设计实现支持RLHF/DPO等对齐技术的高效训练框架，优化强化学习阶段的Rollout、Reward Model集成、多阶段训练 Pipline； 2、研发支持多机多卡 RL 的分布式训练框架，开发TP/PP/ZeRO-3与RL流程的动态协同机制，解决 RL 算法在超长时序下的显存/通信瓶刭 3、构建端到端后训练工具链，主导框架与 MLOps 平台集成，提供训练可视化、自动超参搜索等生产级能力 4、与公司各算法部门深度合作，参与大语言模型LLM、多模态大模型 MLLM等业务在 SFT/RL领域的算法探索和引擎迭代； 5、参与分析各业务 GPU 利用率与饱和度等指标，结合业务场景持续优化训练框架能力，提升框架领先性。

更新于 2026-03-28上海|北京

AI平台开发工程师-数据方向-机器学习平台

社招3年以上机器学习平台

【业务介绍】作为公司统一的机器学习平台团队，负责调度公司所有模型训练与推理资源；基于自建的训推引擎，构建公司统一的机器学习平台，为公司所有算法同学（稀疏 & 稠密，含 LLM）模型迭代提供端到端的一站式服务；包括数据生产，模型训练，模型上线，特征管理，模型测试，资源管控等一系列能力。【岗位职责】 1、负责机器学习链路，离在线数据相关的开发工作，包括样本数据、特征数据等的数据链路搭建、任务运维和调优、性能优化等 2、负责小红书大规模机器学习平台的后台系统设计和开发工作；包括样本平台，特征平台，训练平台，推理平台等AI应用后台建设等； 3、研究分析业内AI平台产品，优化技术方案，改进产品功能，完善产品体验。

上海