字节跳动大模型数据交付专家(内容治理)-DMC
任职要求
1、本科及以上学历,2年以上互联网内容产品或者大模型经验; 2、具备良好的逻辑能力及数据技能/数据分析能力,熟悉SQL,计算机/统计学专业优先; 3…
工作职责
1、承接来自抖音生态产品的数据需求,按照需求完成数据交付,提升模型准召; 2、支持抖音生态内容机审模型策略相关工作,通过数据标注、分析、挖掘,帮助模型算法提升识别能力; 3、对内容治理的算法特征能力建设进行进度追踪管理,主动发现问题、提出解决方案、验证数据效果; 4、理解生态业务的完整流程,支持抖音内容生态的后台工具搭建,提升相关团队查询和定位问题的效率。
1、主导多模态大模型的后训练全流程优化,包括指令微调(SFT)、强化学习(RLHF/DPO/PPO)、模型蒸馏等技术的研发与工程实现,持续提升模型在通用领域及垂直领域(如短视频理解、电商理解)的泛化能力和安全性; 2、参与多模态合成数据生成(覆盖纯文本、图文及视频等内容理解维度)、建立数据质量评估体系,设计数据蒸馏流程,推动数据-模型-评测迭代优化; 3、面向短视频社区、电商内容理解等场景,解决后训练阶段的核心挑战,如跨模态对齐一致性、长上下文推理、多任务指令冲突优化以及多模态智能推理探索等;推动技术成果转化,主导模型在快手短视频社区的集成落地(例如RAG增强系统、多模态Agent任务规划),并通过API封装与服务化支撑业务创新; 4、跟踪前沿多模态大模型后训练技术的前沿演进,探索SFT自动化迭代、轻量化RLHF以及reward model一体化等创新技术方向,形成专利或顶会论文提升团队技术影响力。
1、设计质量评估体系: 主导设计并持续优化面向人审、机审、大模型交付质量的全局性评估指标体系、评估链路与校准机制; 2、深度分析与洞察:对机审误伤和漏放的质量问题进行根因分析,定位问题至规则、模型、流程或人为维度,明确问题根本原因并输出解决方案; 3、主导治理效果评估: 深度分析治理策略的VVR 等核心业务指标影响,从用户体验和商业价值维度评估治理动作的ROI,为战略决策提供依据。 4、闭环推动与协同: 主动协同并驱动治理产品、规则策略、算法模型、审核运营等多方团队,建立高效的质量问题发现、定位、解决、复盘的全链路闭环机制。确保数据洞察转化为具体的产品功能迭代、规则优化、模型Retrain或流程改进,并对最终效果负责。
1、设计质量评估体系: 主导设计并持续优化面向人审、机审、大模型交付质量的全局性评估指标体系、评估链路与校准机制。 2、深度分析与洞察:带领团队对误伤和漏放的质量问题进行根因分析,定位问题至规则、模型、流程或人为维度,明确问题根本原因并输出解决方案; 3、主导治理效果评估: 深度分析治理策略的VVR 等核心业务指标影响,从用户体验和商业价值维度评估治理动作的ROI,为战略决策提供依据。 4、闭环推动与协同: 主动协同并驱动治理产品、规则策略、算法模型、审核运营等多方团队,建立高效的质量问题发现、定位、解决、复盘的全链路闭环机制。确保数据洞察转化为具体的产品功能迭代、规则优化、模型Retrain或流程改进,并对最终效果负责。 5、团队与能力建设:负责组建、培养和管理一支高绩效的数据分析与策略运营团队,提升团队成员的业务洞察、数据分析和项目推动能力。将最佳实践沉淀为可复用的分析模型、工具产品和方法论,提升整个中台的质量评估效率;