字节跳动搜索数据交付组长-DMC
社招全职A183127地点:北京状态:招聘
任职要求
1、本科及以上学历,计算机、统计学等相关专业优先,有搜索相关工作经验优先; 2、较强的分析和沟通能力,擅长从评估数据中发现有价值的产品改善建议,并能推动落地; 3、有大语言模型任务设计和标注的科研或工作经历者优先,有自然语言处理研究经历者优先; 4、会基础编程/有深度学习经验/了解模型原理或评测方案者优先; 5、具备较强的逻辑思维,富有创新精神,解决问题能力强。
工作职责
1、理解搜索业务需求,完成复杂标注任务的设计/标注/质检任务,协同技术和标注团队,推动需求顺利落地; 2、搭建具有通用性和可拓展性的搜索标注框架,与算法团队对齐标准、撰写相关培训方案; 3、依据搜索业务需求,利用大模型&工具,负责数据理想态探索、新数据生产工艺探索; 4、评估模型训练过程中各阶段数据质量,确保模型训练数据有效; 5、制定产品和项目流程机制,负责项目资源的协调与组织,并与项目各方进行良好沟通,确保项目团队各干系人协同工作。
包括英文材料
学历+
NLP+
https://www.youtube.com/watch?v=fNxaJsNG3-s&list=PLQY2H8rRoyvzDbLUZkbudP-MFQZwNmU4S
Welcome to Zero to Hero for Natural Language Processing using TensorFlow!
https://www.youtube.com/watch?v=R-AG4-qZs1A&list=PLeo1K3hjS3uuvuAXhYjV2lMEShq2UYSwX
Natural Language Processing tutorial for beginners series in Python.
https://www.youtube.com/watch?v=rmVRLeJRkl4&list=PLoROMvodv4rMFqRtEuo6SGjY4XbRIVRd4
The foundations of the effective modern methods for deep learning applied to NLP.
深度学习+
https://d2l.ai/
Interactive deep learning book with code, math, and discussions.
相关职位

社招3年以上计算机网络技术类
1. 负责医疗领域相关软件研发 2. 根据需求规格说明书完成对系统需求的理解 3. 根据需求完成系统的概要、详细设计及相关文档编写 4. 根据编码规范完成系统代码的编写及单元测试工作 5. 配合项目人员完成集成测试、系统测试和系统交付支持工作 6. 每日向组长报告工作情况
更新于 2023-10-07
社招3年以上A216860
1、理解搜索业务需求,完成复杂标注任务的设计/标注/质检任务,协同技术和标注团队,推动需求顺利落地; 2、搭建具有通用性和可拓展性的搜索标注框架,与算法团队对齐标准、撰写相关培训方案; 3、依据搜索业务需求,利用大模型&工具,负责数据理想态探索、新数据生产工艺探索; 4、评估模型训练过程中各阶段数据质量,确保模型训练数据有效; 5、制定产品和项目流程机制,协调项目各个角色高效工作; 6、负责项目资源的协调与组织,并与项目各方进行良好沟通,确保项目团队各干系人协同工作。
更新于 2025-02-07
校招A214053A
团队介绍:CQC(中国内容质量与数据服务平台)归属于抖音集团,负责今日头条、抖音、西瓜等产品内容和抖音集团商业内容的安全质量与体验,支持各产品的运营和增长,以及为产品线提供AI算法算力的基础支持服务。 1、联网模型迭代闭环:推动从数据定义到模型效果评估的执行,包括但不限于SFT、RM数据标注和生产、模型输出效果评测等; 2、联网模型产品运营:与算法团队、产品团队等密切协作,深度理解AI探索项目的特点,协助设计数据生产方案,提供策略优化建议; 3、联网模型数据运营:基于主流模型训练方法进行模型效果调优,通过Workflow、Agent自动化等手段为模型训练提供高精准数据,以提升模型表现。
更新于 2025-09-08