腾讯混元大模型数据渠道拓展
社招全职TEG内容地点:深圳状态:招聘
任职要求
1.具备影视行业从业经验,熟悉影视制作、数据资源丰富,有头部影视公司、版权平台或数据供应商资源网络沉淀;
2.熟悉视频数据质量标准(分辨率、帧率、内容合规性),能快速筛选符合AI训练需求的高价值语料;
3.熟悉大模型多模态数据需,了解主流数据清洗、标注工具及流程;
4.具备竞品数据策略获取和拆解能力,不断以此优化数据获取的策略和方法;
5.优秀谈判能力,能独立完成谈判及长期合作维护,协调内外部团队(技术、法务)推动数据交付;
具备以下能力优先:
1.熟悉AI生成技术数据的需求特性,有AI数据项目经验;
2.具备法律合规知识(如影视素材授权范围、隐私数据脱敏),熟悉版权风险规避策略。
工作职责
1.基于大模型训练需求,挖掘影视行业高质量视频/图片数据源,包括但不限于影视版权库、专业视频平台、头部影视制作公司及独立创作者资源; 2.通过采买、版权合作、联合标注等方式获取数据,解决稀缺数据获取难题,保障数据多样性(如4K/8K超高清、多场景片段、特效素材); 3.深度分析头部AI企业的数据获取、使用策略,包括数据来源分布、清洗标准、标注方法等,形成分析报告并指导自身数据策略优化。
包括英文材料
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
相关职位
社招TEG技术
1.基于大模型训练对于数据的需求进行互联网数据抓取,对提供给大模型训练/搜索等场景的语料进行清洗,提升语料纯度; 2.建设对标业内前沿的大模型训练数据集和数据清洗能力,提升数据质量和多样性,并验证数据价值和效果。
更新于 2025-06-18
社招TEG技术
1.设计和开发大规模预训练数据处理pipeline,为模型预训练提供稳定、可靠的高质量数据处理能力; 2.根据大模型训练数据特点,抽象并开发高效、可靠的数据加工框架,提升处理数据的工程效率; 3.建设对标业内前沿的大模型训练数据集,提升数据质量和多样性,并验证数据价值和效果。
更新于 2025-06-17
社招3年以上TEG产品
1.负责大模型标注的全流程管理,高效承接大模型文本、图片、视频等数据标注业务需求,包括但不限于项目规划、需求分析、进度把控、资源协调以及质量保障,确保项目按时交付并达到预期目标; 2.数据质量把控:负责数据质量把控,梳理并分析数据质量的问题,优化质控方案,能够反哺和迭代标注标准,提升标注质量; 3.团队协作:支持项目经理和产研团队的相关工作,理解项目需求、模型表现和相应的数据实验,协同产研提高模型质量。
更新于 2025-06-16