字节跳动AI搜索数据运营专家(多语言方向)-DMC
任职要求
1、本科及以上学历,海外留学经验优先; 2、英文能力过关,可用作日常沟通语言,英语、西班牙语、印尼语优先; 3、熟练使用市面上大模型相关应用,有一定AI理解,熟悉大模型训练,有搜索引擎优化的产品运营经验优先; 4、创新能力比较强,对于不断探索新的AI技术和应用场景有强烈意愿和主观能动性; 5、有良好的数据分析能力,能够从数据中洞察并提取有价值的业务信息,并提出数据优化方式; 6、有较强的自驱力、抗压能力和学习能力(包括论文研究),具备独立判断的思维,能够清晰、准确地传达信息和想法,优秀的沟通协调能力及团队合作精神。
工作职责
1、专注于大模型联网场景的搜索引擎多语言能力的优化; 2、依据联网场景的特点和要求,制定并持续优化数据生产的标准与流程,保障标注准确性与实验有效性; 3、与算法团队、产品团队等密切协作,深度理解AI搜索项目的特点,积极提供有针对性的数据合成、数据评测等策略优化建议; 4、能够独立完成多语言方向数据挖掘、数据预处理、数据合成等工作,闭环验证数据在模型实验上的有效性,提升数据在联网场景能力上的可用性与价值。
构建和完善服体大模型语料库,例如通过撰写对话语料来完成对话及NLP任务,重点是产出与客户服务相关的高质量对话数据; 负责迭代和调优数据语料,提升对话数据的质量情况、流畅度和和互动性; 深入分析和研究客户服务与用户体验场景,确保对话内容的精准度和创造性; 跨部门团队协作,根据项目需求,完善对应标准和流程,完成特定数据的生产任务; 输出与带教,协助团队其他非技术向员工,提升该群体对大语言模型的了解程度、教授实际应用技巧等,以辅助团队更好完成业务目标 带领团队高效完成标注和内容生产项目同时负责管理标注团队,积极推动标注工具、组织流程及交付流程优化,提升并完善团队的交付能力
1、主要负责可灵平台推荐/搜索/内容理解等方向算法优化,帮助提升可灵平台用户留存、营收等核心指标; 2、参与大规模机器学习、深度学习领域技术研发工作,包括但不限于多模态、大模型SFT等算法研发; 3、参与搭建可灵平台在线学习策略算法系统,快速处理海量用户数据,提升算法性能,满足高并发、高时效性和可靠稳定性; 4、和产品、运营等团队合作,共同优化可灵社区生态,提供给用户更好体验,满足用户视频内容生产与消费、社交互动等多维需求。
需要有base海外工作经验,外籍也可考虑 岗位招募方向(搜推/风控/nlp/CV/AI大模型相关等): (1)搜推算法 1、负责从0到1搭建搜索/推荐排序项目及后续持续迭代优化,进行线下和线上实验评估,并对于算法策略进行持续优化; 2、深入理解包括搜索、推荐等流量分发场景的业务模式,通过数据分析和挖掘,构建产品侧和用户侧等特征,驱动搜索排序算法迭代; 3、在电商场景有人货场匹配的应用经验,针对AB实验进行效果分析和归因分析,并不断从业务角度、数据角度推进搜索排序模型优化; 4、主动诊断及发现业务问题,科学的方法和分析输出业务策略,同时能基于复杂的业务问题进行数据挖掘和模型探索,沉淀业务分析思路,产出对业务和产品有价值的方案和建议。