哔哩哔哩语言学实习生
任职要求
1.汉语/英语语言学、应用语言学及语言学相关专业的本科及以上学历,对各语种语法及语法理论、语音现象有深入理解与研究。普通话较好,能够准确听清中文语音发音、掌握汉语中常见的多音字、变调、韵律等规则。 2.英语口语好…
工作职责
职位描述(包括但不限于以下): 1.通过语言学知识构建词典/语料库,协助建立相关语言学规则,提升人工智能相关产品整体体验; 2.对语音音频进行校验、切分,对音频的音字、韵律、标注等进行校验; 3.负责录制相关的前期准备,如角色设定、文案整理等 4.负责算法合成效果的评估,提出优化建议 5.有机会参与数据录制
日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:Data语音团队致力于语音/音频/音乐相关的AI核心技术研发和产品创新。部门支撑音频和多模态内容从生产、编辑到消费的全流程,赋能内容创作和互动,并以中台形式支持集团多个业务,提供业界前沿的技术能力与解决方案。 1、深入参与语音大模型的构建,搭建具有通用性和扩展性的大模型标注、评测体系; 2、培训标注团队,进行数据质检,把控标注质量; 3、为字节跳动产品提供NLP技术支持,用AI技术影响数亿用户。
日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:Data语音团队致力于语音/音频/音乐相关的AI核心技术研发和产品创新。部门支撑音频和多模态内容从生产、编辑到消费的全流程,赋能内容创作和互动,并以中台形式支持集团多个业务,提供业界前沿的技术能力与解决方案。 1、参与业内前沿的同传(同声传译)大模型项目,深入了解大型语言模型的策略迭代过程,协助完成数据标注和模型评测的落地实施; 2、参与同传大模型的策略迭代:协助收集和分析市场需求,参与制定同传大模型的产品策略和迭代计划;跟进产品开发、测试进度,与算法与工程技术团队合作,确保产品功能按时高质量交付;关注各场景的用户反馈,分析线上产品模型输出效果表现,分析后提出优化迭代方案; 3、模型数据标注支持:协助制定数据标注方案,确保数据符合模型训练要求;与内部标注团队沟通,跟进标注进度,保证数据质量;协助优化数据标注流程,提高效率和质量; 4、模型评测落地:参与设计模型评测标准和评测方法,确保评测过程客观、公正、全面;组织和实施模型评测,收集评测数据和结果;分析评测结果,与技术团队讨论,推动模型优化提升。
日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:Data语音团队致力于语音/音频/音乐相关的AI核心技术研发和产品创新。部门支撑音频和多模态内容从生产、编辑到消费的全流程,赋能内容创作和互动,并以中台形式支持集团多个业务,提供业界前沿的技术能力与解决方案。 1、结合实际语音工程,调研该语种语音音系特征,完善语言规则及语音标注规范,为业务和算法提供知识技能支持; 2、配合产品对业务市场、配色方案及本地流行文化等进行调研,支持字节跳动多个国际化业务; 3、协助管理该语种的数据,负责标注数据的质量监控及验收;对语音技术效果做出评价与反馈,协助算法人员进行优化; 4、目前招收的语种方向:英语、法语、德语、印尼语、西语。
日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:Data语音团队致力于语音/音频/音乐相关的AI核心技术研发和产品创新。部门支撑音频和多模态内容从生产、编辑到消费的全流程,赋能内容创作和互动,并以中台形式支持集团多个业务,提供业界前沿的技术能力与解决方案。 1、参与业内前沿的同传(同声传译)大模型项目,深入了解大型语言模型的策略迭代过程,协助完成数据标注和模型评测的落地实施; 2、参与同传大模型的策略迭代:协助收集和分析市场需求,参与制定同传大模型的产品策略和迭代计划;跟进产品开发、测试进度,与算法与工程技术团队合作,确保产品功能按时高质量交付;关注各场景的用户反馈,分析线上产品模型输出效果表现,分析后提出优化迭代方案; 3、模型数据标注支持:协助制定数据标注方案,确保数据符合模型训练要求;与内部标注团队沟通,跟进标注进度,保证数据质量;协助优化数据标注流程,提高效率和质量; 4、模型评测落地:参与设计模型评测标准和评测方法,确保评测过程客观、公正、全面;组织和实施模型评测,收集评测数据和结果;分析评测结果,与技术团队讨论,推动模型优化提升。