夸克智能信息-大安全标注平台产品-北京
任职要求
1.本科及以上学历,3年以上B端工具类产品经验;了解数据标注行业和模型训练流程
2.优秀的跨团队沟通能力、组织协调能力、…工作职责
1.负责智能信息-大安全线标注平台的产品规划、设计工作,提供图像、文本、语音等多模态数据标注所需的标注工具; 2.深入理解各算法团队的标注需求,与业务方、项目经理密切合作,持续改进平台能力和用户体验; 3.通过集成辅助标注工具,提升标注质量和效率
1. 结合质量安全业务场景,主导AI技术方案设计,推动多模态模型、动态知识图谱、风险推理等技术的产品化落地; 2. 制定技术路线图,协调算法、数据、工程团队资源,确保项目从原型到部署的全生命周期管理; 3. 负责多模态消费者投诉数据(文本、图像、音视频)的语义识别、智能标注及关联分析,构建基于事件驱动的动态知识图谱; 4. 开发时序演化模型(如LSTM、Transformer)与因果推理技术,实现产品安全事件演化预测及潜在缺陷关联性分析; 5. 设计并优化风险预警算法,融合知识增强推理(如逻辑规则、图神经网络),提升预警准确性与可解释性,并进行云端模型部署; 6. 协助智能安全与风险预警平台的设计、实现,以及相关监控报警的开发,协助搭建交互系统; 7. 与产品、业务部门紧密沟通,挖掘AI赋能场景(如舆情感知、缺陷追溯,风险分析与风险预警),跟踪大模型、多智能体等技术前沿,探索其在质量安全领域的创新应用。

负责搭建并管理面向多模态视频领域大模型的全链路数据体系,包括数据评测、加工、合成与标注。作为模型算法团队与数据采集团队的核心桥梁,确保高质量、多样化数据供给。主要工作包括以下: 1. 评测体系构建:主导多模态视频领域大模型的评测标准制定,建立涵盖理解、生成、对齐、安全四大维度的评估框架,设计人工评测与自动评测相结合的混合评估方案,搭建评测数据集、生产管线,建立与SOTA模型(GPT-4V、Claude、Gemini等)的对比评测机制,输出专业评测报告。 2. 数据链路架构:构建大规模多模态训练数据的全生命周期处理链路:采集→清洗→去重→质量筛选→格式标准化→安全过滤,搭建数据质量监控体系,建立数据价值评估模型,确保高信息密度数据的持续供给; 3. 标注规范与质量体系:制定细粒度多模态标注规范:图像详细描述、视频时序标注、跨模态对齐、复杂推理链标注等;建立分层质检机制:机器预检→人工抽检→专家终审,确保标注的质量;设计标注人员培训体系与能力认证标准,搭建领域专家标注团队。

负责搭建并管理面向语音领域大模型的全链路数据体系,包括数据评测、加工、合成与标注。作为模型算法团队与数据采集团队的核心桥梁,确保高质量、多样化数据供给。主要包括以下: 1. 评测体系构建:主导音频领域大模型的评测标准制定,建立涵盖理解、生成、对齐、安全四大维度的评估框架,设计人工评测与自动评测相结合的混合评估方案,搭建评测数据集、生产管线,建立与SOTA模型的对比评测机制,输出专业评测报告。 2. 数据链路架构:构建大规模语音训练数据的全生命周期处理链路:采集→清洗→去重→质量筛选→格式标准化→安全过滤,搭建数据质量监控体系,建立数据价值评估模型,确保高信息密度数据的持续供给; 3. 标注规范与质量体系:制定细粒度多模态标注规范;建立分层质检机制确保标注的质量;设计标注人员培训体系与能力认证标准,搭建领域专家标注团队。
日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:抖音集团内容质量与数据服务平台(DOUYIN GROUP CONTENT QUALITY AND DATA SERVICE,简称CQC)是负责抖音集团今日头条、抖音、西瓜等产品内容安全与质量工作的团队,在各产品运营增长方面开展支持工作,为产品线提供数据服务的基础支持。平台下设内容质量中心、数据中心及运营支持中心,在全国10余个城市有业务分布。 1、联网模型迭代闭环:推动从数据定义到模型效果评估的执行,包括但不限于SFT、RM数据标注和生产、模型输出效果评测等; 2、联网模型产品运营:与算法团队、产品团队等密切协作,深度理解AI探索项目的特点,协助设计数据生产方案,提供策略优化建议; 3、联网模型数据运营:基于主流模型训练方法进行模型效果调优,通过Workflow、Agent自动化等手段为模型训练提供高精准数据,以提升模型表现。