字节跳动模型训练数据专家（图像/视频）-DMC

社招全职A1647882024-09-26地点：北京状态：招聘

扫码手机上打开

任职要求

1、本科及以上学历，影视相关专业，广播电视编导、编剧、电影学、导演、戏剧与影视等优先；
2、熟悉大模型模型评估，有数据标注与管理的经验，具备从训练数据到模型效果评估到优化的完整经验者优先；
3、有较强的分析和沟通…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1、深度参与大模型前沿方向的数据工作，重点负责视频生成模型的数据标注与管理，模型效果评估；
2、建设视频生成大模型的数据生产和质量提升流程，建设起行业领先的数据生产标准；
3、建立科学的模型效果评估方案与策略，保证对模型效果的正确评估，助力模型效果达到业内一流；
4、深入理解业务场景、市场动态和大模型技术趋势，牵引数据团队和算法团队的深度融合。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

大模型+

相关职位

AIGC算法专家/工程师（图像/视频/多模态方向）

社招2年以上技术类

1.生成模型研发：负责高质量图像与视频生成模型的选型、训练与调优（如Stable Diffusion、DiT、Video Generation Models），针对业务需求开发可控生成方案（ControlNet、LoRA、Adapter），实现广告素材自动化生成、商品图智能设计等。 2.多模态理解与检索：构建高性能的多模态理解与表征模型（CLIP、BLIP、MLLM），优化跨模态检索（Text-to-Image/Video Retrieval）和内容打标能力，赋能搜索相关性提升及推荐系统的多模态召回与排序。 3.业务场景落地：深入理解搜推广业务，设计AIGC在广告创意优化、搜索结果增强（Generative Search）、短视频内容重组等场景的应用链路；建立A/B实验体系，对AIGC生成内容的点击率（CTR）、转化率（CVR）及用户留存负责。 4.数据与系统优化：构建大规模高质量的图文/视频训练数据集与美学评分体系；与Infra团队配合，优化生成模型的推理延迟与吞吐（如Distillation、Quantization），确保在线服务的高并发稳定性。

更新于 2026-01-08上海

千问C端事业群-大模型数据专家-图文多模方向

社招3年以上技术类-开发

致力于构建高质量的大规模视觉训练数据集，支持图像、视频等多模态模型的研发。主导数据基础设施的设计与优化，确保数据具备良好的质量、多样性与可扩展性。 1. 开发并维护可扩展的数据基础设施，支持大规模图像和视频数据的采集、存储与管理； 2. 应用并部署机器学习模型用于数据清洗、预处理与格式标准化； 3. 实现可扩展且高效的工具，用于可视化、聚类以及深度理解数据； 4. 优化和并行化数据处理流程，以高效处理上亿级别的数据集； 5. 评估并提升训练数据的质量、多样性及标注准确性（包括但不限于caption生成）； 6. 与模型研发团队紧密协作，根据训练效果和模型反馈持续迭代数据策略。

更新于 2025-12-09北京|杭州

【自动驾驶】资深端到端模型算法专家

社招5年以上自动驾驶

1. 负责端到端模型方法研发和量产，包括障碍物预测和行为规划模型结构、训练方法研发； 2. 负责端到端模型训练数据，挖掘机制以及难样本分析等工具链，通过数据闭环持续迭代模型能力。

北京

蚂蚁集团-AGI原生应用-AIGC算法专家

社招3年以上技术类-算法

1.面向AGI创新产品，探索内容生成和创新互动模式。通过内容生成（图像/视频/3D），为用户打造全新的内容体验和交互模式。 3. 结合产品场景，进行文生图、图像编辑、视频生成、3D生成模型的研究优化，解决生产质量、可控性、生成效率等关键问题。 3. 基于SOTA基模，进行Continue Pretrain/SFT/RL相关的优化，评测模型能力，探索各种下游应用场景。 4.追踪领域前沿工作,包括但不限于实时视频生成、世界模型等方向，探索RLHF在视觉生成领域的scaling law等。

更新于 2025-12-25北京|杭州