传音大模型语言数据标注实习生(J18213)
任职要求
1.英专、汉语言、语言学、小语种、计算语言学、语言学及应用语言学、语言与言语信息处理专业等,了解过计算语言学或语料库语言学等方向课程,本科及以上学历,理论语言学基础扎实过硬,对应用语言学知识到工业界有强烈的兴趣。 2.英语水平良好,有雅思、托福成绩证书优先。 3.能够一周连续出勤至少四天优先。 4.会基础编程,能使用python进行文本处理、正则表达式优先。 5.学习过自然语言处理、机器学习、深度学习相关课程或相关经验,了解过生成式人工智能和大模型原理、评测方案和相关应用。 6.认同"Together we can",思维活跃、学习能力强、有探索精神、耐心细致、渴望挑战真实业务常见中的问题;具有良好的沟通表达能力,与团队成员有效沟通,协调解决问题,有较强的分析能力,擅长从数据、评估中发现有价值的产品改善建议,并能推动落地。
工作职责
1.学习并参与对话系统、大模型前沿方向的数据运营工作,如意图分类、实体识别、文档摘要、角色扮演、AI搜索、文生图等,重点负责模型的数据集制作和标签管理。了解业务流程和算法流程,完成复杂标注任务的设计,在此基础上对原始数据进行处理,包括数据的爬取、筛选和清洗,并制定标注标准。 2.培训海外标注团队,进行数据质检,把控标注质量,确保数据的准确性和一致性。 3.按项目要求对模型进行评测和效果分析,完成复杂的数据分析任务,及时反馈问题,根据模型效果调整数据和标注策略。
1.语料数据收集处理与标注:参与社交场景的文本对话语料收集、清洗和标注工作;协助 LLM、TTS 语音数据的处理、分类和质量评估;设计并执行语料标注规范,确保数据质量;协助寻找音源,能够使用AI工具合成音频数据。 2.模型评测与质量控制:参与大模型输出结果的人工评测和质量分析;执行语料质量检查流程,确保标注准确性;协助建立评测标准,参与模型输出质量评估。 3.数据分析与报告:记录并分析标注过程中的问题和改进点;撰写数据处理和评测报告。
日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、负责大模型工科领域相关数据的标注工作,确保标注数据的准确性和规范性,为模型训练提供高质量数据支撑; 2、参与大模型的评测任务,针对工科场景下的模型生成能力进行测试和评估,分析模型表现,提出改进建议; 3、与模型研发团队紧密互动,深入理解模型需求,设计符合工科专业场景的数据标注标准和评测方案; 4、处理多工科领域相关的数据任务,涵盖土木、力学、测绘、机械工程、计算机、能源等专业场景,保障数据的全面性和适用性; 5、运用专业知识及Python等工具,辅助进行数据处理脚本的编写、优化,提升数据处理效率。
岗位职责 1. 深入理解并严格执行既定的评测标准和流程,对英文类大模型的输出内容进行多维度的标注和评测,包括但不限于语言逻辑连贯性、编写角色指令等。 2.针对不同类型的任务(如文本生成、问答等),准确判断模型输出是否满足任务要求,详细记录评测过程中发现的问题,如错误类型、出现频率、影响程度等,并形成清晰、准确的评测报告。 3.与研发团队、产品团队紧密协作,及时反馈评测中发现的模型缺陷和优化建议,为模型的训练和改进提供有价值的参考。 4. 关注行业内大模型评测的最新方法和技术动态,参与评测标准和流程的优化工作,不断提升评测工作的效率和质量。 5. 维护评测数据的准确性和完整性,确保数据的规范存储和安全使用。