logo of bytedance

字节跳动大模型Agent数据运营专家-DMC

社招全职A155474地点:北京状态:招聘

任职要求


1、本科及以上学历,统计、计算机类专业,具有较好的学习理解和文本编辑能力优先;
2、有项目管理经验、大模型产品、产品运营、AI训练师等相关工作者优先;
3、有过运用PE工作流或脚本插件等方式辅助数据生产优先;
4、具备独立判断的思维,能够清晰、准确地传达信息和想法,优秀的沟通协调能力及团队合作精神;
5、有较强的自驱力、抗压能力,学习能力和适应能力。

工作职责


1、基于产品研发和业务需求,完成Agent方向大模型相关的标注工作,设计标注方案及规则,组织团队完成日常数据生产,达成相关模型训练和优化效果指标;
2、运用PE进行数据生产和过滤,了解大模型前沿训练信息,关注行业的发展方向;
3、有良好的理解与需求分析能力,能够分析理解数据核心需求与要解决的问题,并有良好的文字表达能力,能够清晰、准确地解释对应原因;
4、沟通表达能力好,能够顺利进行团队内外部相关方的沟通协作,保障数据交付,推进模型训练和优化过程的顺利进行;
5、思维灵活,能够适应业务间的快速切换,不断学习掌握各项新的标注逻辑和方式,对大模型PE能力有较高兴趣或有一定的使用经验。
包括英文材料
学历+
大模型+
脚本+
相关职位

logo of bytedance
社招3年以上A156693

1、搭建具有通用性和可拓展性的NLP标注框架,与算法团队对齐标准、撰写相关培训方案,根据模型迭代方向提供高质量数据; 2、负责大语言模型训练过程中各阶段数据生产,对自动化链路搭建、数据质量评估及外部资源管理负责,确保大语言模型训练数据有效; 3、能通过PE、代码完成数据预处理、分析和清洗,按照训练需求进行标注、分析和验证调优,提升模型效果; 4、与产品算法团队协同,积极探索自动化数据生产、数据合成等方法,提高数据标注效率,持续跟踪大模型技术进展,持续探索智能高效的数据生产模式。

更新于 2025-05-20
logo of bytedance
社招3年以上A197094

1、搭建具有通用性和可拓展性的TTS标注框架,与算法团队对齐标准、撰写相关培训方案,根据模型迭代方向提供高质量数据; 2、负责大语言模型训练过程中各阶段数据生产,对自动化链路搭建、数据质量评估及外部资源管理负责,确保大语言模型训练数据有效; 3、能通过PE、代码完成数据预处理、分析和清洗,按照训练需求进行标注、分析和验证调优,提升模型效果; 4、与产品算法团队协同,积极探索自动化数据生产、数据合成等方法,提高数据标注效率,持续跟踪大模型技术进展,持续探索智能高效的数据生产模式。

更新于 2025-02-08
logo of bytedance
社招A94465

1、联网模型迭代闭环:推动从数据定义到模型效果评估的执行,包括但不限于SFT、RM数据标注和生产、模型输出效果评测等; 2、联网模型产品运营:与算法团队、产品团队等密切协作,深度理解AI探索项目的特点,协助设计数据生产方案,提供策略优化建议; 3、联网模型数据运营:基于主流模型训练方法进行模型效果调优,通过WorkFlow、Agent自动化等手段为模型训练提供高精准数据,以提升模型表现。

更新于 2025-08-18
logo of bytedance
社招A250834

1、深入理解AI大模型,了解ToB场景,通过数据挖掘、数据合成、人工构造等方式生产高质量数据集; 2、与算法团队密切协作,积极提供ToB在游戏生成、深度研究、客服、数据分析等Agent场景有针对性的数据合成策略和建议; 2、能通过PE、代码完成数据预处理、分析和清洗,探索更高效的数据生产方式; 4、能通过输出和带教,提升数据团队对技术和大语言模型的了解,推动团队达成业务目标。

更新于 2025-04-15