字节跳动大模型Agent数据运营专家-DMC
社招全职A155474地点:北京状态:招聘
任职要求
1、本科及以上学历,统计、计算机类专业,具有较好的学习理解和文本编辑能力优先; 2、有项目管理经验、大模型产品、产品运营、AI训练师等相关工作者优先; 3、有过运用PE工作流或脚本插件等方式辅助数据生产优先; 4、具备独立判断的思维,能够清晰、准确地传达信息和想法,优秀的沟通协调能力及团队合作精神; 5、有较强的自驱力、抗压能力,学习能力和适应能力。
工作职责
1、基于产品研发和业务需求,完成Agent方向大模型相关的标注工作,设计标注方案及规则,组织团队完成日常数据生产,达成相关模型训练和优化效果指标; 2、运用PE进行数据生产和过滤,了解大模型前沿训练信息,关注行业的发展方向; 3、有良好的理解与需求分析能力,能够分析理解数据核心需求与要解决的问题,并有良好的文字表达能力,能够清晰、准确地解释对应原因; 4、沟通表达能力好,能够顺利进行团队内外部相关方的沟通协作,保障数据交付,推进模型训练和优化过程的顺利进行; 5、思维灵活,能够适应业务间的快速切换,不断学习掌握各项新的标注逻辑和方式,对大模型PE能力有较高兴趣或有一定的使用经验。
包括英文材料
学历+
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
脚本+
[英文] Scripting language
https://en.wikipedia.org/wiki/Scripting_language
https://zhuanlan.zhihu.com/p/571097954
一个脚本通常是解释执行而非编译。脚本语言通常都有简单、易学、易用的特性,目的就是希望能让程序员快速完成程序的编写工作。
相关职位
社招3年以上A156693
1、搭建具有通用性和可拓展性的NLP标注框架,与算法团队对齐标准、撰写相关培训方案,根据模型迭代方向提供高质量数据; 2、负责大语言模型训练过程中各阶段数据生产,对自动化链路搭建、数据质量评估及外部资源管理负责,确保大语言模型训练数据有效; 3、能通过PE、代码完成数据预处理、分析和清洗,按照训练需求进行标注、分析和验证调优,提升模型效果; 4、与产品算法团队协同,积极探索自动化数据生产、数据合成等方法,提高数据标注效率,持续跟踪大模型技术进展,持续探索智能高效的数据生产模式。
更新于 2025-05-20
社招3年以上A197094
1、搭建具有通用性和可拓展性的TTS标注框架,与算法团队对齐标准、撰写相关培训方案,根据模型迭代方向提供高质量数据; 2、负责大语言模型训练过程中各阶段数据生产,对自动化链路搭建、数据质量评估及外部资源管理负责,确保大语言模型训练数据有效; 3、能通过PE、代码完成数据预处理、分析和清洗,按照训练需求进行标注、分析和验证调优,提升模型效果; 4、与产品算法团队协同,积极探索自动化数据生产、数据合成等方法,提高数据标注效率,持续跟踪大模型技术进展,持续探索智能高效的数据生产模式。
更新于 2025-02-08
社招A94465
1、联网模型迭代闭环:推动从数据定义到模型效果评估的执行,包括但不限于SFT、RM数据标注和生产、模型输出效果评测等; 2、联网模型产品运营:与算法团队、产品团队等密切协作,深度理解AI探索项目的特点,协助设计数据生产方案,提供策略优化建议; 3、联网模型数据运营:基于主流模型训练方法进行模型效果调优,通过WorkFlow、Agent自动化等手段为模型训练提供高精准数据,以提升模型表现。
更新于 2025-08-18