logo of bytedance

字节跳动多模态大模型数据策略Leader-大模型数据服务中心

社招全职A168028地点:北京状态:招聘

任职要求


1、本科及以上学历,影视相关专业,广播电视编导、编剧、电影学、导演、戏剧与影视等优先;
2、熟悉图像/视频理解,具备从构图、光影、动作节奏、风格一致性等维度进行专业判断的能力,视频生成模型相关从业经历优先;
3、熟悉大模型模型评估,有数据标注与管理的经…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、深度参与多模态大模型前沿方向的数据工作,重点负责视频/图像生成模型及AI多模型产品的效果评估,以及多模态大模型训练数据策略及标注管理;
2、负责多模态数据任务的理解与拆解,基于图像/视频内容特征及业务目标,制定对应的数据规则与质量体系;
3、建设科学的多模态大模型评测方案与策略,确保评估体系能够准确反映模型问题与能力变化,助力模型效果达到业内一流;
4、深入理解业务场景、市场动态和大模型技术趋势,牵引数据团队和算法团队的深度融合。
包括英文材料
学历+
还有更多 •••
相关职位

logo of bytedance
社招5年以上A93257

团队介绍:平台治理国际电商算法团队,专注于与业务方产品和运营团队协作,对国际电商平台进行全面的生态和风险治理,涵盖商家与商品、创作者与内容两大方向。我们的目标是通过打击底线风险问题和优化健康电商生态,实现平台的可持续发展。智能审核作为平台治理算法团队的一个重要子方向,主要与审核产品和审核运营团队合作,致力于打造业内最先进的智能审核系统。工作内容包括优化审核模型算法、审核素材及提示,以及优化审核平台的人员排班调度和任务分配,实现审核质量和效率的持续提升。 1、领导智能审核算法团队,制定技术发展方向和策略; 2、通过优化审核模型算法,探索基于大模型和多模态模型的审核系统,提高模型自动审核覆盖比例; 3、优化审核平台的人员排班调度、任务分配、素材组织和提示,提高审核质量和效率; 4、与审核产品和运营团队紧密合作,确保审核系统的稳定性和高效性,推动审核质量和效率的持续提升; 5、关注业内最新技术动态,推动新技术在智能审核系统中的应用和落地。

更新于 2024-07-08上海
logo of bytedance
实习A98802B

日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:大模型数据服务中心,是抖音集团旗下为大模型业务提供数据、评估、运营等专业解决方案的团队,主要承接大模型数据生产、大模型评估及运营相关的业务,与研发、产品等团队紧密合作,在预训练、数据监督微调、模型强化学习、模型能力评估、产品运营等大模型全链路数据环节,共同推动模型能力持续提升与应用。 1、参与多模态任务的数据策略理解与任务拆解,支持图像、视频、人像、指令类等任务的数据规则设计与落地; 2、协助多模态数据生产流程建设,参与标注规范、质检标准与边界规则的整理与优化; 3、参与Prompt Engineering辅助标注、工程化标注及自动化提效实践,验证并支持方案落地; 4、支持数据质量监控与分析,协助定位标注冲突、规则模糊、模态不一致等问题,参与模型评测数据准备与错例分析,支持模型能力诊断与数据策路迭代; 5、协助沉淀任务文档、规则说明与案例材料,支持跨团队协作,有机会深度参与多模态大模型数据策略与交付体系建设,获得真实模型项目实践经验。

更新于 2025-12-31北京
logo of meituan
社招3年以上核心本地商业-基

1.数据策略与规划:负责文本和多模态大模型训练数据(包括预训练和后训练)的数据建设统筹规划,包括数据调研、数据引入、数据质量标准制定、数据验收等。 2.渠道管理:管理相关数据渠道,通过合作引入相关数据。 3.数据创新:探索新的数据来源(如开源数据、合成数据、用户反馈数据),提升数据规模和质量。

更新于 2025-04-29北京
logo of tongyi
社招3年以上技术类-开发

1、负责多模态数据数据pipeline建设、数据版本管理、数据处理、数据算子开发集成等工作。 2、开发自动化数据处理工具与脚本,优化数据清洗、标注及质量评估的效率和规模化能力。 3、参与多模态大模型训练数据的构建与管理,参与数据筛选、标注及质量评估工作。分析和挖掘现有数据资源,设计有效的数据分布策略,支持模型持续迭代; 4、与算法团队紧密协作,根据模型训练需求定制数据策略,提升训练效果。 5、参与模型推理与部署、模型蒸馏、推理服务服务化,能够支持tagging及服务优化工作。

更新于 2025-11-14北京|杭州