logo of bytedance

字节跳动模型训练数据专家(图像/视频)-DMC

社招全职A164788地点:北京状态:招聘

任职要求


1、本科及以上学历,影视相关专业,广播电视编导、编剧、电影学、导演、戏剧与影视等优先;
2、熟悉大模型模型评估,有数据标注与管理的经验,具备从训练数据到模型效果评估到优化的完整经验者优先;
3、有较强的分析和沟通…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、深度参与大模型前沿方向的数据工作,重点负责视频生成模型的数据标注与管理,模型效果评估;
2、建设视频生成大模型的数据生产和质量提升流程,建设起行业领先的数据生产标准;
3、建立科学的模型效果评估方案与策略,保证对模型效果的正确评估,助力模型效果达到业内一流;
4、深入理解业务场景、市场动态和大模型技术趋势,牵引数据团队和算法团队的深度融合。
包括英文材料
学历+
大模型+
相关职位

logo of pinduoduo
社招2年以上技术类

1.生成模型研发: 负责高质量图像与视频生成模型的选型、训练与调优(如Stable Diffusion、DiT、Video Generation Models),针对业务需求开发可控生成方案(ControlNet、LoRA、Adapter),实现广告素材自动化生成、商品图智能设计等。 2.多模态理解与检索: 构建高性能的多模态理解与表征模型(CLIP、BLIP、MLLM),优化跨模态检索(Text-to-Image/Video Retrieval)和内容打标能力,赋能搜索相关性提升及推荐系统的多模态召回与排序。 3.业务场景落地: 深入理解搜推广业务,设计AIGC在广告创意优化、搜索结果增强(Generative Search)、短视频内容重组等场景的应用链路;建立A/B实验体系,对AIGC生成内容的点击率(CTR)、转化率(CVR)及用户留存负责。 4.数据与系统优化: 构建大规模高质量的图文/视频训练数据集与美学评分体系;与Infra团队配合,优化生成模型的推理延迟与吞吐(如Distillation、Quantization),确保在线服务的高并发稳定性。

更新于 2026-01-08上海
logo of quark
社招3年以上技术类-开发

致力于构建高质量的大规模视觉训练数据集,支持图像、视频等多模态模型的研发。主导数据基础设施的设计与优化,确保数据具备良好的质量、多样性与可扩展性。 1. 开发并维护可扩展的数据基础设施,支持大规模图像和视频数据的采集、存储与管理; 2. 应用并部署机器学习模型用于数据清洗、预处理与格式标准化; 3. 实现可扩展且高效的工具,用于可视化、聚类以及深度理解数据; 4. 优化和并行化数据处理流程,以高效处理上亿级别的数据集; 5. 评估并提升训练数据的质量、多样性及标注准确性(包括但不限于caption生成); 6. 与模型研发团队紧密协作,根据训练效果和模型反馈持续迭代数据策略。

更新于 2025-12-09北京|杭州
logo of liauto
社招5年以上自动驾驶

1. 负责端到端模型方法研发和量产,包括障碍物预测和行为规划模型结构、训练方法研发; 2. 负责端到端模型训练数据,挖掘机制以及难样本分析等工具链,通过数据闭环持续迭代模型能力。

北京
logo of antgroup
社招3年以上技术类-算法

1.面向AGI创新产品,探索内容生成和创新互动模式。通过内容生成(图像/视频/3D),为用户打造全新的内容体验和交互模式。 3. 结合产品场景,进行文生图、图像编辑、视频生成、3D生成模型的研究优化,解决生产质量、可控性、生成效率等关键问题。 3. 基于SOTA基模,进行Continue Pretrain/SFT/RL相关的优化,评测模型能力,探索各种下游应用场景。 4.追踪领域前沿工作,包括但不限于实时视频生成、世界模型等方向,探索RLHF在视觉生成领域的scaling law等。

更新于 2025-12-25北京|杭州