logo of bytedance

字节跳动大模型推理优化工程师-Commercial AI

社招全职A97497A地点:北京状态:招聘

任职要求


1、代码能力、数据结构和基础算法功底,熟练掌握Linux环境下的C/C++Python;
2、熟悉至少一种机器学习框架(PyTorch/TensorFlow/PaddlePaddle/Mindspore等训练框架),以及对应框架相应技术生态;
3、熟悉大模型推理框架(如vLLM/SGLang/TRT-LLM等框架);
4、掌握分布式系统原理,参与过分布式系统的设计、开发和维护;
5、有强…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、负责超大规模机器学习系统架构的设计开发,解决系统高并发、高可靠性、高可扩展性等技术难关;
2、负责大模型分布式推理任务性能优化,流量调度,池化部署等,涵盖LLM/MLLM/Diffusion等多个场景;
3、与算法部门深度合作,进行算法与系统的联合优化;
4、国产硬件的适配和性能优化。
包括英文材料
数据结构+
算法+
Linux+
C+
C+++
Python+
机器学习+
PyTorch+
还有更多 •••
相关职位

logo of meitu
校招研发类

岗位概述 参与美图影像研究院(MT Lab)核心 AI 底层基础设施与前沿交互应用的研发。作为支撑算法落地的全栈工程核心,你将参与构建从底层算子优化、算法中台到上层 AR 渲染的全链路系统,将前沿的计算机视觉与 AIGC 理论转化为影响亿级用户的真实影像体验。 本岗位为 2026 年暑期实习,全职实习时长 5 个月以上。实习期间表现优秀者,将有机会获得留用。 职责方向 ● 算法平台研发: 参与 AI 算法中台及基础设施的架构设计与 C++ 开发,构建支撑海量数据与大模型的高效训练、自动化评测与部署工具链。 ● 前沿 AR 研发: 参与跨平台 AR 特效引擎及图形渲染的底层研发,配合设计师打造创新 AR 特效,并对渲染相关技术进行前瞻性研究。 ● 极限算法调优: 深入 AI 落地“最后一公里”,负责深度学习模型在异构硬件(移动端/PC/服务端)上的极限性能调优,涵盖算子优化、内存管理及并发加速。 ● 全栈工程协作: 与顶尖算法研究员深度协作,以全栈视角理解复杂 AI 逻辑,设计高可用、高扩展的工程架构,加速 AI 能力的业务化落地。 任职资格 ● 教育背景: 本科及以上学历在读,计算机、人工智能、数学、电子等相关专业。 ● 计算机基础: 具备极度扎实的计算机科学基础,深入理解数据结构与算法、操作系统体系结构及计算机原理。 ● C++ 编程能力: 熟练掌握 C/C++,具备优秀的系统级开发、性能 Profiling 与复杂问题 Debug 能力,代码风格优雅。 ● AI Native 心态: 习惯并热衷于利用大模型等 AI 工具辅助开发。 ● 算法好奇心: 能够从底层架构视角洞察 AI 模型的工作原理,有志于成长为“懂算法”的全栈工程师。 ● 沟通与内驱力: 具备良好的沟通能力,能清晰阐述技术权衡;有独立解决前沿工程难题的内驱力。 加分项 ● 底层优化经验: 熟悉 ARM NEON 汇编、CUDA/OpenCL 编程,或有 TensorRT、NCNN 等推理框架实战经验。 ● 图形学背景: 熟悉计算机图形学,有 OpenGL、Vulkan 或 Metal 等底层图形 API 开发经验。 ● 开源与竞赛: 在 GitHub 相关生态中有实际 PR 贡献,或在 ACM/ICPC、NOI 等高水平算法竞赛中获得过优异成绩。 Overview: Join the MT Lab to build core AI infrastructure and pioneering interactive applications. As a full-stack engineering core supporting algorithm deployment, you will work on an end-to-end system spanning low-level operator optimization, algorithm middleware, and high-level AR rendering. Your mission is to transform cutting-edge Computer Vision and AIGC theories into ultimate imaging experiences for hundreds of millions of users. This is a full-time summer 2026 internship (5+ months). Strong performers will be considered for a return offer. Responsibilities ● Algorithm Platform R&D: Contribute to the architectural design and C++ development of AI middleware and infrastructures. You will build toolchains that support high-efficiency training, automated evaluation, and deployment for massive data and large-scale models. ● Frontier AR Development: Engage in the low-level C++ development of cross-platform AR engines and graphics rendering. Work closely with designers to create innovative AR effects and conduct forward-looking research on rendering technologies. ● Extreme Algorithm Tuning: Solve the "last mile" of AI deployment by conducting extreme performance optimization on heterogeneous hardware (Mobile/PC/Server), covering operator optimization, memory management, and multi-threading. ● Full-Stack Engineering Collaboration: Work closely with top-tier research scientists. You will interpret complex AI logic from a full-stack perspective to design high-availability and scalable architectures, accelerating the commercialization of AI capabilities.

更新于 2026-05-20深圳
logo of meitu
校招研发类

岗位概述 参与美图影像研究院(MT Lab)核心 AI 底层基础设施与前沿交互应用的研发。作为支撑算法落地的全栈工程核心,你将参与构建从底层算子优化、算法中台到上层 AR 渲染的全链路系统,将前沿的计算机视觉与 AIGC 理论转化为影响亿级用户的真实影像体验。 本岗位为 2026 年暑期实习,全职实习时长 5 个月以上。实习期间表现优秀者,将有机会获得留用。 职责方向 ● 算法平台研发: 参与 AI 算法中台及基础设施的架构设计与 C++ 开发,构建支撑海量数据与大模型的高效训练、自动化评测与部署工具链。 ● 前沿 AR 研发: 参与跨平台 AR 特效引擎及图形渲染的底层研发,配合设计师打造创新 AR 特效,并对渲染相关技术进行前瞻性研究。 ● 极限算法调优: 深入 AI 落地“最后一公里”,负责深度学习模型在异构硬件(移动端/PC/服务端)上的极限性能调优,涵盖算子优化、内存管理及并发加速。 ● 全栈工程协作: 与顶尖算法研究员深度协作,以全栈视角理解复杂 AI 逻辑,设计高可用、高扩展的工程架构,加速 AI 能力的业务化落地。 任职资格 ● 教育背景: 本科及以上学历在读,计算机、人工智能、数学、电子等相关专业。 ● 计算机基础: 具备极度扎实的计算机科学基础,深入理解数据结构与算法、操作系统体系结构及计算机原理。 ● C++ 编程能力: 熟练掌握 C/C++,具备优秀的系统级开发、性能 Profiling 与复杂问题 Debug 能力,代码风格优雅。 ● AI Native 心态: 习惯并热衷于利用大模型等 AI 工具辅助开发。 ● 算法好奇心: 能够从底层架构视角洞察 AI 模型的工作原理,有志于成长为“懂算法”的全栈工程师。 ● 沟通与内驱力: 具备良好的沟通能力,能清晰阐述技术权衡;有独立解决前沿工程难题的内驱力。 加分项 ● 底层优化经验: 熟悉 ARM NEON 汇编、CUDA/OpenCL 编程,或有 TensorRT、NCNN 等推理框架实战经验。 ● 图形学背景: 熟悉计算机图形学,有 OpenGL、Vulkan 或 Metal 等底层图形 API 开发经验。 ● 开源与竞赛: 在 GitHub 相关生态中有实际 PR 贡献,或在 ACM/ICPC、NOI 等高水平算法竞赛中获得过优异成绩。 Overview: Join the MT Lab to build core AI infrastructure and pioneering interactive applications. As a full-stack engineering core supporting algorithm deployment, you will work on an end-to-end system spanning low-level operator optimization, algorithm middleware, and high-level AR rendering. Your mission is to transform cutting-edge Computer Vision and AIGC theories into ultimate imaging experiences for hundreds of millions of users. This is a full-time summer 2026 internship (5+ months). Strong performers will be considered for a return offer. Responsibilities ● Algorithm Platform R&D: Contribute to the architectural design and C++ development of AI middleware and infrastructures. You will build toolchains that support high-efficiency training, automated evaluation, and deployment for massive data and large-scale models. ● Frontier AR Development: Engage in the low-level C++ development of cross-platform AR engines and graphics rendering. Work closely with designers to create innovative AR effects and conduct forward-looking research on rendering technologies. ● Extreme Algorithm Tuning: Solve the "last mile" of AI deployment by conducting extreme performance optimization on heterogeneous hardware (Mobile/PC/Server), covering operator optimization, memory management, and multi-threading. ● Full-Stack Engineering Collaboration: Work closely with top-tier research scientists. You will interpret complex AI logic from a full-stack perspective to design high-availability and scalable architectures, accelerating the commercialization of AI capabilities.

更新于 2026-05-20厦门
logo of xiaohongshu
社招5-10年引擎

我们是小红书中台大模型 Infra 团队,专注打造领先易用的「AI 大模型全链路基础设施」!团队深耕大模型「数-训-压-推-评」技术闭环,在大模型训练加速、模型压缩、推理优化、部署提效等方向积累了深厚的技术优势,基于 RedAccel 训练引擎、RedSlim 压缩工具、RedServing 推理部署引擎、DirectLLM 大模型 API 服务、QuickSilver 大模型生产部署平台等核心产品,持续赋能社区、商业、交易、安全、数平、研效等多个核心业务,实现 AI 技术高效落地! 1、参与设计实现支持RLHF/DPO等对齐技术的高效训练框架,优化强化学习阶段的Rollout、Reward Model集成、多阶段训练 Pipline; 2、研发支持多机多卡 RL 的分布式训练框架,开发TP/PP/ZeRO-3与RL流程的动态协同机制,解决 RL 算法在超长时序下的显存/通信瓶刭 3、构建端到端后训练工具链,主导框架与 MLOps 平台集成,提供训练可视化、自动超参搜索等生产级能力 4、与公司各算法部门深度合作,参与大语言模型LLM、多模态大模型 MLLM等业务在 SFT/RL领域的算法探索和引擎迭代; 5、参与分析各业务 GPU 利用率与饱和度等指标,结合业务场景持续优化训练框架能力,提升框架领先性。

更新于 2026-03-28上海|北京
logo of xiaohongshu
社招3年以上机器学习平台

【业务介绍】 作为公司统一的机器学习平台团队,负责调度公司所有模型训练与推理资源;基于自建的训推引擎,构建公司统一的机器学习平台,为公司所有算法同学(稀疏 & 稠密,含 LLM) 模型迭代提供端到端的一站式服务;包括 数据生产,模型训练,模型上线,特征管理,模型测试,资源管控等一系列能力。 【岗位职责】 1、负责机器学习链路,离在线数据相关的开发工作,包括样本数据、特征数据等的数据链路搭建、任务运维和调优、性能优化等 2、负责小红书大规模机器学习平台的后台系统设计和开发工作;包括样本平台,特征平台,训练平台,推理平台等AI应用后台建设等; 3、研究分析业内AI平台产品,优化技术方案,改进产品功能,完善产品体验。

上海