logo of baidu

百度千帆大模型数据策略工程师(J83077)

社招全职ACG地点:北京 | 上海状态:招聘

任职要求


-熟练掌握 Python/GO 中至少一种编程语言,具备良好的编码习惯和常用设计模式的理解
-具备大规模的预训练/指令/偏好数据的收集、清洗、构建经验,有大模型数据合成、图文多模态数据处理经验者优先
-熟悉大模型评测方式和各类评估指标,对如何准确、高效地评估大模型各类能力有实践经验
-熟…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


-负责大模型数据合成相关工作,包括技术调研、数据生成与处理、模型训练及效果评估
-负责大规模文本、多模态数据的处理与清洗工作,优化数据质量
-支持大模型在实际业务场景中的应用落地,负责平台客户的场景建模任务,将模型算法落地到客户的业务场景中
-与其他角色和团队合作,共同完成相关项目需求
包括英文材料
Python+
Go+
编程规范+
设计模式+
还有更多 •••
相关职位

logo of baidu
社招ACG

-负责Post-training工具链开发: 负责千帆MAAS平台大模型SFT、蒸馏、强化学习(RL)等后训练环节的工具链开发,提升大规模训练的稳定性与执行效率 -负责RLaaS能力落地: 参与“强化学习即服务(RLaaS)”的方案调研与实现,通过解耦算力资源与算法逻辑,让内外部客户能够高效低成本在自身业务数据上启动高效率的 RL 训练 -提升平台易用性与扩展性: 快速定位并解决用户线上问题,将高频业务需求沉淀为平台通用功能,通过组件化设计优化工具链的复用性 -前沿技术落地: 跟踪调研业内主流后训练技术,负责将其转化为平台核心能力,保持产品的技术领先性

更新于 2026-02-10北京|上海
logo of baidu
社招ACG

-负责千帆MaaS平台级推理降本与效率优化策略设计与落地,并支持定制化推理性能优化 -负责量化、投机推理(MTP / speculative decoding / Eagle)等训练–推理协同优化方案的设计与落地 -负责建设大模型推理性能评测与收益评估体系 -前沿技术落地:调研并落地大模型推理多维度优化技术,包括但不限于模型量化(INT4/INT8/FP8,含PTQ/QAT两种方式)、MTP投机推理优化、结构化剪枝与稀疏化等,持续提升推理效率与资源利用率,降低部署成本。

更新于 2026-02-10北京
logo of baidu
实习ACG

-参与Qianfan-VL多模态模型训练工作,负责图像、视频与文本模态的对齐和指令微调数据构造与清洗,模型实验 -构建优质代码数据语料库,通过检索生成结合执行环境自动验证的方式构造合成数据,通过持续预训练、强化学习等方式训练精专代码大模型 -跟进并探索前沿的模型范式,研究样本质量/数量对模型效果的影响,摸索更高效、低成本的蒸馏方案,研究RL在特定需求场景下的适用性 -深刻理解模型训练、推理的性能瓶颈,通过底层优化提升训练、推理性能 -研究方向(新增数据策略方向): 多模态大模型预训练/后训练数据清洗与合成 多模态推理场景强化 多模态教育、解题场景增强 复杂指令遵循 Agent场景数据构建 复杂场景下的代码提升

更新于 2025-08-21北京|上海
logo of baidu
社招ACG

-协助进行大模型开发平台的需求分析、竞品调研、需求文档撰写,并跟进开发、测试及上线 -参与产研、运营多方紧密协同,推进各事项的稳步执行 -编写千帆大模型平台相关产品介绍、实践文档等材料 -跟进平台用户咨询及使用问题,并协调周围角色进行解决

更新于 2025-07-10北京