蚂蚁金服蚂蚁集团-内容数据评测专家-内容技术
任职要求
1、本科或以上学历,计算机科学、数据科学、数学、统计学或相关专业; 2、至少1年模型评测、搜广推相关业务&体验保障经验,熟练使用Scala、Java或Python等编程语言,熟练掌握SQL、Python或R等数据分析工具; 3、有良好的数据敏感性,能从数据中发现有价值的信息; 4、具有良好的沟通和团队合作能力,能够有效地与各个部门合作,以推动业务增长和成功; 5、有多媒体内容、直播等行业经验者优先,有搜索推荐等相关技术栈保障的经验优先。
工作职责
1、主要负责审核、理解、搜广推相关模型的评测工作,通过制定科学的评测方法和数据分析方法,挖掘模型效果上的badcase并推动链路上的优化; 2、负责流量分析、异常洞察、数据质量评估等通用数据分析能力开发; 3、有评测经验,熟悉搜推等相关数据产品的评测方法并有落地业务的经验; 4、深入理解公司产品及算法策略,通过数据挖掘,提出有实效的建议,驱动产品及技术迭代。
1. 跟踪国内外监管政策和大模型技术标准发展趋势,熟悉监管合规规范,了解大模型原理,结合大模型特性、AIGC 场景特点,设计出适配业务发展需要的内容安全解决方案并推动落地; 2. 基于语言模型、多模态模型的风险防控标准和要求,在大模型内生安全、围栏安全、安全评测等方面,设计体系化的防控策略并推动落地,确保安全与体验的平衡; 3. 识别业务场景潜在安全风险,跟进风险舆情,制定应急预案并快速响应,确保问题得到及时处理; 4. 与业务团队、法务、GA 和基础安全等团队深度协作,确保大模型产品及服务符合相关法律法规要求。
构建和完善服体大模型语料库,例如通过撰写对话语料来完成对话及NLP任务,重点是产出与客户服务相关的高质量对话数据; 负责迭代和调优数据语料,提升对话数据的质量情况、流畅度和和互动性; 深入分析和研究客户服务与用户体验场景,确保对话内容的精准度和创造性; 跨部门团队协作,根据项目需求,完善对应标准和流程,完成特定数据的生产任务; 输出与带教,协助团队其他非技术向员工,提升该群体对大语言模型的了解程度、教授实际应用技巧等,以辅助团队更好完成业务目标 带领团队高效完成标注和内容生产项目同时负责管理标注团队,积极推动标注工具、组织流程及交付流程优化,提升并完善团队的交付能力
1、负责音乐内容生产策略、标准与质量,能够根据各类音乐场景需求,设计音乐内容方案,为音乐类产品提供专业知识与技术支持; 2、与产品研发配合,为多样的音乐场景设计链条式的音乐内容解决方案,统筹音乐生产工具和素材等资源; 3、对音乐制作人员进行包括但不限于音乐制作、录音混音、音乐质量评测等能力的培训; 4、音乐生成技术和音乐产业战略调研,及时了解业界发展动态,辅助判断未来发展趋势。
1、主导多模态大模型的后训练全流程优化,包括指令微调(SFT)、强化学习(RLHF/DPO/PPO)、模型蒸馏等技术的研发与工程实现,持续提升模型在通用领域及垂直领域(如短视频理解、电商理解)的泛化能力和安全性; 2、参与多模态合成数据生成(覆盖纯文本、图文及视频等内容理解维度)、建立数据质量评估体系,设计数据蒸馏流程,推动数据-模型-评测迭代优化; 3、面向短视频社区、电商内容理解等场景,解决后训练阶段的核心挑战,如跨模态对齐一致性、长上下文推理、多任务指令冲突优化以及多模态智能推理探索等;推动技术成果转化,主导模型在快手短视频社区的集成落地(例如RAG增强系统、多模态Agent任务规划),并通过API封装与服务化支撑业务创新; 4、跟踪前沿多模态大模型后训练技术的前沿演进,探索SFT自动化迭代、轻量化RLHF以及reward model一体化等创新技术方向,形成专利或顶会论文提升团队技术影响力。