logo of aligenie

智能互联数据技术及产品部-AI 视频领域数据架构师-杭州/北京

社招全职5年以上技术类-数据地点:北京 | 杭州状态:招聘

任职要求


1.  计算机科学、人工智能、数据科学等相关专业,硕士及以上学历优先。
2.  5年以上AI数据相关经验,至少2年大模型(LLM/VLM)数据工作经验;有从0到1搭建数据团队或平台的经历;懂模型、懂数据、有产品 sense ,具备 AI 协同能力。
3.  技术深度:深入理解多模态大模型原理;精通数据清洗与质量评估方法;熟练…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


负责搭建并管理面向多模态视频领域大模型的全链路数据体系,包括数据评测、加工、合成与标注。作为模型算法团队与数据采集团队的核心桥梁,确保高质量、多样化数据供给。主要工作包括以下:

1.  评测体系构建:主导多模态视频领域大模型的评测标准制定,建立涵盖理解、生成、对齐、安全四大维度的评估框架,设计人工评测与自动评测相结合的混合评估方案,搭建评测数据集、生产管线,建立与SOTA模型(GPT-4V、Claude、Gemini等)的对比评测机制,输出专业评测报告。
2.  数据链路架构:构建大规模多模态训练数据的全生命周期处理链路:采集→清洗→去重→质量筛选→格式标准化→安全过滤,搭建数据质量监控体系,建立数据价值评估模型,确保高信息密度数据的持续供给;
3.  标注规范与质量体系:制定细粒度多模态标注规范:图像详细描述、视频时序标注、跨模态对齐、复杂推理链标注等;建立分层质检机制:机器预检→人工抽检→专家终审,确保标注的质量;设计标注人员培训体系与能力认证标准,搭建领域专家标注团队。
包括英文材料
数据科学+
学历+
还有更多 •••
相关职位

logo of aliyun
社招5年以上云智能行业解决方

1、负责阿里云东区出海客户的售前工作,设计云和AI技术架构,提供技术验证等服务,支撑销售团队达成业务目标。 2、基于阿里云全球化的技术产品和方案,为出海客户设计云上架构,响应关键需求,参与客户的方案比选,POC功能演示与性能测试,提供可落地的解决方案,支撑客户出海业务发展。 3、围绕技术领域(云原生、大数据、人工智能)和细分行业(视频智能、零售制造、电商游戏等),洞察市场,孵化行业创新解决方案,沉淀客户案例,推动行业发展。 4、与产品研发团队合作,传递来自客户侧的全球化市场需求,共同推动阿里云产品和解决方案的国际化发展。 5、对外发声建立行业影响力,组织内外部行业沙龙和技术分享,传递阿里云在出海业务的最佳实践。

更新于 2025-06-10杭州
logo of bytedance
校招A208225B

团队介绍:视频与边缘部门承载了字节跳动的媒体内容分发基建及技术中台,支持了字节全系产品的点播、直播、实时通信、图片等多媒体业务发展,同时将业务发展过程中沉淀下来的技术能力和工具,通过火山引擎对外输出,面向各行各业用户提供视频云产品和服务,愿景是为内外部业务伙伴提供最低成本、最优画质、最低延时、最安全可靠的富媒体内容分发解决方案,助力业务伙伴降本提效实现持续增长。 课题介绍:近年来,深度学习在视频及图像压缩领域逐渐成为研究热点。随着传统编码标准逐渐逼近性能瓶颈,深度学习方法受到了业界的高度重视,发展极为迅速。目前在部分场景下深度学习方法已经可以接近甚至超过H.266/VVC的压缩效率。然后相对传统编码,深度学习方法也面临着诸多挑战,例如在很多应用场景下的压缩效率依然落后于传统编码技术,运算复杂度高,跨平台编解码缺乏兼容性,难以标准化等等。此外,如何将传统编码算法和深度学习算法在统一的硬件架构下实现,并达到极致的算力利用效率,涉及到算法和硬件架构创新,是研究的难点。 1、负责研究新一代视频编码技术,产出相关技术的代码、专利、提案、论文; 2、参加标准会议,向标准组织报告产出的技术并争取标准采纳; 3、设计高效率的视频编码算法、C-model、和硬件架构; 3、与产品部门或者硬件团队同学深度合作,支撑部门前沿技术探索以及落地。

更新于 2025-05-26深圳
logo of bytedance
校招A186047

团队介绍:视频与边缘部门承载了字节跳动的媒体内容分发基建及技术中台,支持了字节全系产品的点播、直播、实时通信、图片等多媒体业务发展,同时将业务发展过程中沉淀下来的技术能力和工具,通过火山引擎对外输出,面向各行各业用户提供视频云产品和服务,愿景是为内外部业务伙伴提供最低成本、最优画质、最低延时、最安全可靠的富媒体内容分发解决方案,助力业务伙伴降本提效实现持续增长。 课题介绍:近年来,深度学习在视频及图像压缩领域逐渐成为研究热点。随着传统编码标准逐渐逼近性能瓶颈,深度学习方法受到了业界的高度重视,发展极为迅速。目前在部分场景下深度学习方法已经可以接近甚至超过H.266/VVC的压缩效率。然后相对传统编码,深度学习方法也面临着诸多挑战,例如在很多应用场景下的压缩效率依然落后于传统编码技术,运算复杂度高,跨平台编解码缺乏兼容性,难以标准化等等。此外,如何将传统编码算法和深度学习算法在统一的硬件架构下实现,并达到极致的算力利用效率,涉及到算法和硬件架构创新,是研究的难点。 1、负责研究新一代视频编码技术,产出相关技术的代码、专利、提案、论文; 2、参加标准会议,向标准组织报告产出的技术并争取标准采纳; 3、设计高效率的视频编码算法、C-model、和硬件架构; 3、与产品部门或者硬件团队同学深度合作,支撑部门前沿技术探索以及落地。

更新于 2025-05-26北京
logo of bytedance
校招A57687

团队介绍:视频与边缘部门承载了字节跳动的媒体内容分发基建及技术中台,支持了字节全系产品,如抖音、今日头条、番茄小说、西瓜视频等APP的点播、直播、实时通信、图片等多媒体业务发展,同时将业务发展过程中沉淀下来的技术能力和工具,通过火山引擎对外输出,面向各行各业用户提供视频云产品和服务,愿景是为内外部业务伙伴提供最低成本、最优画质、最低延时、最安全可靠的富媒体内容分发解决方案,助力业务伙伴降本提效实现持续增长。 课题介绍:近年来,深度学习在视频及图像压缩领域逐渐成为研究热点。随着传统编码标准逐渐逼近性能瓶颈,深度学习方法受到了业界的高度重视,发展极为迅速。目前在部分场景下深度学习方法已经可以接近甚至超过H.266/VVC的压缩效率。然后相对传统编码,深度学习方法也面临着诸多挑战,例如在很多应用场景下的压缩效率依然落后于传统编码技术,运算复杂度高,跨平台编解码缺乏兼容性,难以标准化等等。此外,如何将传统编码算法和深度学习算法在统一的硬件架构下实现,并达到极致的算力利用效率,涉及到算法和硬件架构创新,是研究的难点。 1、负责研究新一代视频编码技术,产出相关技术的代码、专利、提案、论文; 2、参加标准会议,向标准组织报告产出的技术并争取标准采纳; 3、设计高效率的视频编码算法、C-model、和硬件架构; 4、与产品部门或者硬件团队同学深度合作,支撑部门前沿技术探索以及落地。

更新于 2025-05-26上海