百度千帆大模型数据策略工程师(J83077)
社招全职ACG地点:北京 | 上海状态:招聘
任职要求
-熟练掌握 Python/GO 中至少一种编程语言,具备良好的编码习惯和常用设计模式的理解 -具备大规模的预训练/指令/偏好数据的收集、清洗、构建经验,有大模型数据合成、图文多模态数据处理经验者优先 -熟悉大模型评测方式和各类评估指标,对如何准确、高效地评估大模型各类能力有实践经验 -熟…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
-负责大模型数据合成相关工作,包括技术调研、数据生成与处理、模型训练及效果评估 -负责大规模文本、多模态数据的处理与清洗工作,优化数据质量 -支持大模型在实际业务场景中的应用落地,负责平台客户的场景建模任务,将模型算法落地到客户的业务场景中 -与其他角色和团队合作,共同完成相关项目需求
包括英文材料
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
Go+
https://www.youtube.com/watch?v=8uiZC0l4Ajw
学习Golang的完整教程!从开始到结束不到一个小时,包括如何在Go中构建API的完整演示。没有多余的内容,只有你需要知道的知识。
编程规范+
[英文] Google Style Guides
https://google.github.io/styleguide/
Every major open-source project has its own style guide: a set of conventions (sometimes arbitrary) about how to write code for that project. It is much easier to understand a large codebase when all the code in it is in a consistent style.
设计模式+
https://liaoxuefeng.com/books/java/design-patterns/index.html
设计模式,即Design Patterns,是指在软件设计中,被反复使用的一种代码设计经验。使用设计模式的目的是为了可重用代码,提高代码的可扩展性和可维护性。
[英文] Design Patterns
https://refactoring.guru/design-patterns
Design patterns are typical solutions to common problems in software design. Each pattern is like a blueprint that you can customize to solve a particular design problem in your code.
https://www.youtube.com/watch?v=NU_1StN5Tkk
Design Patterns tutorial explained in simple words using real-world examples.
还有更多 •••
相关职位
实习ACG
-参与Qianfan-VL多模态模型训练工作,负责图像、视频与文本模态的对齐和指令微调数据构造与清洗,模型实验 -构建优质代码数据语料库,通过检索生成结合执行环境自动验证的方式构造合成数据,通过持续预训练、强化学习等方式训练精专代码大模型 -跟进并探索前沿的模型范式,研究样本质量/数量对模型效果的影响,摸索更高效、低成本的蒸馏方案,研究RL在特定需求场景下的适用性 -深刻理解模型训练、推理的性能瓶颈,通过底层优化提升训练、推理性能 -研究方向(新增数据策略方向): 多模态大模型预训练/后训练数据清洗与合成 多模态推理场景强化 多模态教育、解题场景增强 复杂指令遵循 Agent场景数据构建 复杂场景下的代码提升
更新于 2025-08-21北京|上海
社招ACG
-协助进行大模型开发平台的需求分析、竞品调研、需求文档撰写,并跟进开发、测试及上线 -参与产研、运营多方紧密协同,推进各事项的稳步执行 -编写千帆大模型平台相关产品介绍、实践文档等材料 -跟进平台用户咨询及使用问题,并协调周围角色进行解决
更新于 2025-07-10北京
实习ACG
-协助进行大模型开发平台的需求分析、竞品调研、需求文档撰写,并跟进开发、测试及上线 -参与产研、运营多方紧密协同,推进各事项的稳步执行 -编写千帆大模型平台相关产品介绍、实践文档等材料 -跟进平台用户咨询及使用问题,并协调周围角色进行解决
更新于 2025-07-10上海