字节跳动搜索数据交付专家-DMC
社招全职3年以上A216860地点:北京状态:招聘
任职要求
1、计算机、统计学等相关专业本科及以上学历,有搜索相关工作经验至少3年及以上; 2、较强的分析和沟通能力,擅长从评估数据中发现有价值的产品改善建议,并能推动落地; 3、有大语言模型任务设计和标注的科研或工作经历者优先,有自然语言处理研究经历者优先; 4、会基础编程/有深度学习经验/了解模型原理或评测方案者优先; 5、具备较强的逻辑思维,富有创新精神,解决问题能力强。
工作职责
1、理解搜索业务需求,完成复杂标注任务的设计/标注/质检任务,协同技术和标注团队,推动需求顺利落地; 2、搭建具有通用性和可拓展性的搜索标注框架,与算法团队对齐标准、撰写相关培训方案; 3、依据搜索业务需求,利用大模型&工具,负责数据理想态探索、新数据生产工艺探索; 4、评估模型训练过程中各阶段数据质量,确保模型训练数据有效; 5、制定产品和项目流程机制,协调项目各个角色高效工作; 6、负责项目资源的协调与组织,并与项目各方进行良好沟通,确保项目团队各干系人协同工作。
包括英文材料
学历+
NLP+
https://www.youtube.com/watch?v=fNxaJsNG3-s&list=PLQY2H8rRoyvzDbLUZkbudP-MFQZwNmU4S
Welcome to Zero to Hero for Natural Language Processing using TensorFlow!
https://www.youtube.com/watch?v=R-AG4-qZs1A&list=PLeo1K3hjS3uuvuAXhYjV2lMEShq2UYSwX
Natural Language Processing tutorial for beginners series in Python.
https://www.youtube.com/watch?v=rmVRLeJRkl4&list=PLoROMvodv4rMFqRtEuo6SGjY4XbRIVRd4
The foundations of the effective modern methods for deep learning applied to NLP.
深度学习+
https://d2l.ai/
Interactive deep learning book with code, math, and discussions.
相关职位
社招A94465
1、联网模型迭代闭环:推动从数据定义到模型效果评估的执行,包括但不限于SFT、RM数据标注和生产、模型输出效果评测等; 2、联网模型产品运营:与算法团队、产品团队等密切协作,深度理解AI探索项目的特点,协助设计数据生产方案,提供策略优化建议; 3、联网模型数据运营:基于主流模型训练方法进行模型效果调优,通过WorkFlow、Agent自动化等手段为模型训练提供高精准数据,以提升模型表现。
更新于 2025-08-18
社招2年以上核心本地商业-美
构建和完善服体大模型语料库,例如通过撰写对话语料来完成对话及NLP任务,重点是产出与客户服务相关的高质量对话数据; 负责迭代和调优数据语料,提升对话数据的质量情况、流畅度和和互动性; 深入分析和研究客户服务与用户体验场景,确保对话内容的精准度和创造性; 跨部门团队协作,根据项目需求,完善对应标准和流程,完成特定数据的生产任务; 输出与带教,协助团队其他非技术向员工,提升该群体对大语言模型的了解程度、教授实际应用技巧等,以辅助团队更好完成业务目标 带领团队高效完成标注和内容生产项目同时负责管理标注团队,积极推动标注工具、组织流程及交付流程优化,提升并完善团队的交付能力
更新于 2025-06-22

社招5年以上技术类
1.参与搜索、推荐业务产品需求和架构设计评审,关注产品设计与架构的合理性、可测性,能快速深入理解系统架构及实现原理,有对测试需求做透彻分析的能力; 2.设计合理的测试策略,参与到具体的测试执行工作中,并进行缺陷跟踪和质量分析等,能引入比较好的思想和方法,保证产品的质量; 3.保证被测系统的质量,并通过流程推动、策略、方法和工具等创新,努力提升研发的质量和效率; 4.负责所在方向持续交付的多级流水线落地,并根据质量效率指标对整个研发流程进行改进; 5.能在工作过程中持续的进行总结与分享;
更新于 2023-12-26