logo of bytedance

字节跳动模型训练数据专家(图像/视频)-DMC

社招全职A164788地点:北京状态:招聘

任职要求


1、本科及以上学历,影视相关专业,广播电视编导、编剧、电影学、导演、戏剧与影视等优先;
2、熟悉大模型模型评估,有数据标注与管理的经验,具备从训练数据到模型效果评估到优化的完整经验者优先;
3、有较强的分析和沟通…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、深度参与大模型前沿方向的数据工作,重点负责视频生成模型的数据标注与管理,模型效果评估;
2、建设视频生成大模型的数据生产和质量提升流程,建设起行业领先的数据生产标准;
3、建立科学的模型效果评估方案与策略,保证对模型效果的正确评估,助力模型效果达到业内一流;
4、深入理解业务场景、市场动态和大模型技术趋势,牵引数据团队和算法团队的深度融合。
包括英文材料
学历+
大模型+
相关职位

logo of quark
社招3年以上技术类-开发

致力于构建高质量的大规模视觉训练数据集,支持图像、视频等多模态模型的研发。主导数据基础设施的设计与优化,确保数据具备良好的质量、多样性与可扩展性。 1. 开发并维护可扩展的数据基础设施,支持大规模图像和视频数据的采集、存储与管理; 2. 应用并部署机器学习模型用于数据清洗、预处理与格式标准化; 3. 实现可扩展且高效的工具,用于可视化、聚类以及深度理解数据; 4. 优化和并行化数据处理流程,以高效处理上亿级别的数据集; 5. 评估并提升训练数据的质量、多样性及标注准确性(包括但不限于caption生成); 6. 与模型研发团队紧密协作,根据训练效果和模型反馈持续迭代数据策略。

更新于 2025-10-24北京|杭州
logo of liauto
社招5年以上自动驾驶

1. 负责端到端模型方法研发和量产,包括障碍物预测和行为规划模型结构、训练方法研发; 2. 负责端到端模型训练数据,挖掘机制以及难样本分析等工具链,通过数据闭环持续迭代模型能力。

北京
logo of antgroup
社招3年以上技术类-算法

1、面向AGI创新产品,探索视觉内容生成和多模态互动。通过生成算法、计算机视觉、XR等多领域交叉,为用户打造全新的内容体验和交互模式; 2、负责基于开源或内部基模,进行文生图、文生视频、图像/视频编辑等AIGC技术能力的精调、优化,解决可控、互动、编辑等关键问题; 3、追踪领域前沿工作,包括但不限于Diffusion/AR generation model的架构演进、探索RLHF在视觉生成领域的scaling law等。

更新于 2025-11-28北京|杭州
logo of kuaishou
社招D12518

1、预训练模型结构和训练任务优化,提升预训练模型学习世界知识的能力; 2、持续收集和清洗大规模预训练数据,并研究数据构成和学习顺序对大模型效果的影响; 3、参与预训练模型评测,包括评测流程建设和完善、评测方法设计和优化等; 4、参与大模型Alignment相关工作,包括: a.Alignment方法设计与研究,包括SFT和 RLHF等相关的算法研究; b.Alignment整体数据建设,包括数据构建、标注以及分析其对模型能力的影响; c.从下游调优的角度探索如何提升大模型的逻辑推理能力。

更新于 2025-06-11北京