百度大模型平台策略算法工程师（J97419）

社招全职ACG2026-02-10地点：北京 | 上海状态：招聘

扫码手机上打开

任职要求

-教育背景： 计算机、人工智能等相关专业本科及以上学历
-编程功底： 熟练掌握 Python、 PyTorch，具备扎实的数据结构与算法基础，具备良好的工程实现能力
-大模型经验： 熟悉 Transformer 架构及大模型训练原理、熟悉后训练常用技术（SFT、 DPO、 RFT）、熟悉分布式并行策略（…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

-负责Post-training工具链开发： 负责千帆MAAS平台大模型SFT、蒸馏、强化学习（RL）等后训练环节的工具链开发，提升大规模训练的稳定性与执行效率
-负责RLaaS能力落地： 参与“强化学习即服务（RLaaS）”的方案调研与实现，通过解耦算力资源与算法逻辑，让内外部客户能够高效低成本在自身业务数据上启动高效率的 RL 训练
-提升平台易用性与扩展性： 快速定位并解决用户线上问题，将高频业务需求沉淀为平台通用功能，通过组件化设计优化工具链的复用性
-前沿技术落地： 跟踪调研业内主流后训练技术，负责将其转化为平台核心能力，保持产品的技术领先性

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

Python+

PyTorch+

数据结构+

还有更多 •••

登录查看完整学习资料

相关职位

大模型平台策略算法实习生（J98793）

实习ACG

-负责大模型推理平台的资源优化与调度策略设计，提升推理服务吞吐量、降低响应延迟 -参与推理负载预测、请求路由、缓存策略等模块的策略优化和落地，保障服务稳定性与经济性 -探索前沿优化技术（如预测性调度、在线学习、组合优化）在推理场景中的应用，推动平台智能化升级 -参与策略系统工程研发，将优化算法沉淀为可复用的通用服务，提升策略系统的易用性和扩展性

更新于 2026-03-26北京

大模型平台策略推理优化工程师（J97422）

社招ACG

-负责千帆MaaS平台级推理降本与效率优化策略设计与落地，并支持定制化推理性能优化 -负责量化、投机推理（MTP / speculative decoding / Eagle）等训练–推理协同优化方案的设计与落地 -负责建设大模型推理性能评测与收益评估体系 -前沿技术落地：调研并落地大模型推理多维度优化技术，包括但不限于模型量化（INT4/INT8/FP8，含PTQ/QAT两种方式）、MTP投机推理优化、结构化剪枝与稀疏化等，持续提升推理效率与资源利用率，降低部署成本。

更新于 2026-02-10北京

Summer Camp - Agentic RL /大模型平台策略推理优化实习生（J100476）

实习ACG

-关于百度千帆 -百度智能云千帆策略部，深度支撑百度千帆MAAS平台业务，团队具备行业领先的训练–推理协同优化能力，构建了从模型训练、量化优化、投机推理到平台级调度与线上流量验证的闭环优化体系，实现大模型推理成本与效率的持续突破；我们深度服务代码、多轮对话、办公等高价值行业的真实 agent 场景，能接触到市面上最复杂、最多样的多步骤任务数据。我们在这里不做玩具实验——每一个模型迭代都直接对齐真实业务效果，每一次 RL 训练都有真实用户反馈闭环。我们一起帮客户做得更快、更好 -课题名称一：大模型MTP训练&投机推理加速优化 -课题说明 -复现 Deepseek MTP/Mimo MTP/Eagle3/DFlash 等高效的投机推理加速方案，并提出改进方案或全新的投机推理加速方案，进一步加速平台上模型的推理效率 -岗位方向：大模型平台策略推理优化实习生 -希望同学对大模型的结构和推理过程有细致的理解；熟悉 vLLM/SGLang 等推理框架中的推理实现细节；了解主流的投机推理方案技术及实现原理

更新于 2026-06-23北京

大模型安全策略运营实习生-内容质量与数据服务平台

实习A179699

ByteIntern：面向2027届毕业生（2026年9月-2027年8月期间毕业），为符合岗位要求的同学提供转正机会。团队介绍：CQC（中国内容质量与数据服务平台）归属于抖音集团，负责今日头条、抖音、西瓜视频等产品内容和抖音集团商业内容的安全质量与体验，支持各产品的运营和增长，以及为产品线提供AI算法算力的基础支持服务。 1、基于安全策略需求，负责为算法训练提供高质量数据支持，覆盖数据挖掘、筛选、清洗及标注规范制定； 2、通过SQL及数据分析工具，深入挖掘线上数据，定位模型安全能力短板，输出可量化的优化方向； 3、与下游标注团队紧密协作，承担精标项目的需求对接、任务拆解与进度跟进，保障数据交付质量与效率； 4、参与安全策略效果评估，结合准确率、召回率等核心指标，持续跟踪数据投入对模型能力的提升效果。

更新于 2026-05-28北京