字节跳动AI数据运营-语言专家
任职要求
1、本科及以上学历,对智能服务和NLP领域有较高的热情和好奇心,对智能解决方案有较深理解; 2、能够利用AI能力…
工作职责
1、负责数据服务相关:为智能客服及人工客服领域的大语言模型搭建定制化NLP标注框架,为模型效果负责; 2、模型评估相关:搭建并优化迭代客服大模型效果评估体系,定期监控模型效果,分析问题并提供优化改进建议; 3、人工侧AI辅助人工能力建设相关:深入理解抖音人工客服业务,设计推动人工知识的模型化改造,优化AI辅助人工的模型服务语言和服务流程。
1、专注于大模型联网场景的搜索引擎多语言能力的优化; 2、依据联网场景的特点和要求,制定并持续优化数据生产的标准与流程,保障标注准确性与实验有效性; 3、与算法团队、产品团队等密切协作,深度理解AI搜索项目的特点,积极提供有针对性的数据合成、数据评测等策略优化建议; 4、能够独立完成多语言方向数据挖掘、数据预处理、数据合成等工作,闭环验证数据在模型实验上的有效性,提升数据在联网场景能力上的可用性与价值。
构建和完善服体大模型语料库,例如通过撰写对话语料来完成对话及NLP任务,重点是产出与客户服务相关的高质量对话数据; 负责迭代和调优数据语料,提升对话数据的质量情况、流畅度和和互动性; 深入分析和研究客户服务与用户体验场景,确保对话内容的精准度和创造性; 跨部门团队协作,根据项目需求,完善对应标准和流程,完成特定数据的生产任务; 输出与带教,协助团队其他非技术向员工,提升该群体对大语言模型的了解程度、教授实际应用技巧等,以辅助团队更好完成业务目标 带领团队高效完成标注和内容生产项目同时负责管理标注团队,积极推动标注工具、组织流程及交付流程优化,提升并完善团队的交付能力
ByteIntern:面向2027届毕业生(2026年9月-2027年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:AI数据与安全团队为Seed基座模型及AI原生应用提供跨模态数据服务,覆盖数据生产全流程,包含模型评估标准的制定、数据规模化生产、数据飞轮搭建,不断提升数据质量,支持模型快速迭代。 团队由产品经理、数据工程、数据运营等跨职能人才组成,并通过与Seed研究员、行业专家、全球顶尖数据供应商紧密合作,从真实场景中收集反馈并分析模型表现数据,解决AI前沿突破过程中的复杂数据问题,推动模型性能与用户体验的双重提升。我们既是帮助模型技术迭代的一线贡献者,也是模型和AI产品的一手用户。 1、深入理解AI大模型视频通话场景,负责多模态对话、联网、Function Call等方向的数据采集、标注、质检与策略运营工作; 2、与产品研发团队紧密配合,快速沉淀多模态大模型数据理想态和标准,积极为模型后训提供数据策略和建议; 3、针对模型突出问题进行专项攻坚,通过设计PE策略、Workflow工作流等,探索更高效的数据生产方式。