字节跳动模型训练数据专家(图像/视频)-DMC
社招全职A164788地点:北京状态:招聘
任职要求
1、本科及以上学历,影视相关专业,广播电视编导、编剧、电影学、导演、戏剧与影视等优先; 2、熟悉大模型模型评估,有数据标注与管理的经验,具备从训练数据到模型效果评估到优化的完整经验者优先; 3、有较强的分析和沟通…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1、深度参与大模型前沿方向的数据工作,重点负责视频生成模型的数据标注与管理,模型效果评估; 2、建设视频生成大模型的数据生产和质量提升流程,建设起行业领先的数据生产标准; 3、建立科学的模型效果评估方案与策略,保证对模型效果的正确评估,助力模型效果达到业内一流; 4、深入理解业务场景、市场动态和大模型技术趋势,牵引数据团队和算法团队的深度融合。
包括英文材料
学历+
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
相关职位
社招3年以上技术类-开发
致力于构建高质量的大规模视觉训练数据集,支持图像、视频等多模态模型的研发。主导数据基础设施的设计与优化,确保数据具备良好的质量、多样性与可扩展性。 1. 开发并维护可扩展的数据基础设施,支持大规模图像和视频数据的采集、存储与管理; 2. 应用并部署机器学习模型用于数据清洗、预处理与格式标准化; 3. 实现可扩展且高效的工具,用于可视化、聚类以及深度理解数据; 4. 优化和并行化数据处理流程,以高效处理上亿级别的数据集; 5. 评估并提升训练数据的质量、多样性及标注准确性(包括但不限于caption生成); 6. 与模型研发团队紧密协作,根据训练效果和模型反馈持续迭代数据策略。
更新于 2025-10-24北京|杭州
社招5年以上自动驾驶
1. 负责端到端模型方法研发和量产,包括障碍物预测和行为规划模型结构、训练方法研发; 2. 负责端到端模型训练数据,挖掘机制以及难样本分析等工具链,通过数据闭环持续迭代模型能力。
北京
社招3年以上技术类-算法
1、面向AGI创新产品,探索视觉内容生成和多模态互动。通过生成算法、计算机视觉、XR等多领域交叉,为用户打造全新的内容体验和交互模式; 2、负责基于开源或内部基模,进行文生图、文生视频、图像/视频编辑等AIGC技术能力的精调、优化,解决可控、互动、编辑等关键问题; 3、追踪领域前沿工作,包括但不限于Diffusion/AR generation model的架构演进、探索RLHF在视觉生成领域的scaling law等。
更新于 2025-11-28北京|杭州