字节跳动技术运营实习生(数据采集方向)-大模型数据服务中心
任职要求
1、本科及以上学历在读,语音学、计算语言学、语用学、心理学、汉语言等相关专业; 2、使用过大模型实时交互功能,了解视频交互功能或有模型评测经验者更优; 3、具备优秀的统筹管理能力,项目理解力高,对数据指标敏感,有过社团管理、赛事举办经…
工作职责
日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:大模型数据服务中心,是抖音集团旗下为大模型业务提供数据、评估、运营等专业解决方案的团队; 主要承接大模型数据生产、大模型评估及运营相关的业务,与研发、产品等团队紧密合作,在预训练、数据监督微调、模型强化学习、模型能力评估、产品运营等大模型全链路数据环节,共同推动模型能力持续提升与应用。 1、协调业务、产品等跨部门资源,端到端负责AI模型训练数据支持项目的运营推进; 2、参与音视图文数据采集全流程设计与优化,包括标准制定、流程节点管理、自动化Workflow搭建及全链路质量监控体系建立; 3、使用AI工具应用场景落地与运营,持续优化数据生产效率与智能化水平,推动项目目标达成; 4、跟踪人工智能领域最新进展,结合项目需求探索创新性数据生产模式,并推动试点与规模化应用。
ByteIntern:面向2027届毕业生(2026年9月-2027年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:AI数据与安全团队为Seed基座模型及AI原生应用提供跨模态数据服务,覆盖数据生产全流程,包含模型评估标准的制定、数据规模化生产、数据飞轮搭建,不断提升数据质量,支持模型快速迭代。 团队由产品经理、数据工程、数据运营等跨职能人才组成,并通过与Seed研究员、行业专家、全球顶尖数据供应商紧密合作,从真实场景中收集反馈并分析模型表现数据,解决AI前沿突破过程中的复杂数据问题,推动模型性能与用户体验的双重提升。我们既是帮助模型技术迭代的一线贡献者,也是模型和AI产品的一手用户。 1、深入理解AI大模型视频通话场景,负责多模态对话、联网、Function Call等方向的数据采集、标注、质检与策略运营工作; 2、与产品研发团队紧密配合,快速沉淀多模态大模型数据理想态和标准,积极为模型后训提供数据策略和建议; 3、针对模型突出问题进行专项攻坚,通过设计PE策略、Workflow工作流等,探索更高效的数据生产方式。
-调研用户需求,分析产品目标群体,制定产品规划,完成产品设计,跟踪产品线上运营情况 -协调组织设计、开发、测试资源推动产品完成发布 -参与跨业务用户有效沟通 -参与产品功能迭代过程中的产品设计、帮助产品经理撰写需求文档、输出产品原型、协同设计团队完成交互设计与视觉设计 -参与项目落地过程中的资源协调
1、参与自动驾驶数据闭环相关工作,支持数据采集、清洗、筛选、标注及质量分析等流程优化。 2、协助建设数据闭环链路,参与问题数据挖掘、场景归因、样本回流与效果跟踪。 3、配合算法、数据、工程团队,推动感知/规划/控制等模块相关数据需求落地。 4、参与长尾场景、异常 case、典型问题的分析整理,沉淀数据策略和运营方法。 5、支持日常数据分析与专项项目推进,输出过程文档、分析报告和复盘总结。