字节跳动小语种语言学实习生-Data语音
任职要求
1、本科及以上学历在读,相关语言类专业优先;
2、能够对语言面貌、规则和特征进行非感性描写;
3、应具备较好的语音感知,如音素辨析力、音高和韵律感知;系统学习过语音学、音系学的申请人优先;
4、接触过言语工程相关项目者优先;
5、有编程基础者优先;
6、熟悉该语种本地流行文化者优先。
工作职责
日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:Data语音团队致力于语音/音频/音乐相关的AI核心技术研发和产品创新。部门支撑音频和多模态内容从生产、编辑到消费的全流程,赋能内容创作和互动,并以中台形式支持集团多个业务,提供业界前沿的技术能力与解决方案。 1、结合实际语音工程,调研该语种语音音系特征,完善语言规则及语音标注规范,为业务和算法提供知识技能支持; 2、配合产品对业务市场、配色方案及本地流行文化等进行调研,支持短视频/番茄小说/电商/广告等多个国际化业务; 3、协助管理该语种的数据,负责录音、标注数据的质量监控及验收,对语音技术效果做出评价与反馈,协助算法人员进行优化; 4、目前招收的语种方向:马来语、印尼语、菲律宾语、越南语、泰语、日语、韩语、阿拉伯语、土耳其语、俄语、葡萄牙语、西班牙语、意大利语、法语、德语、挪威语、瑞典语。
日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:Data语音团队致力于语音/音频/音乐相关的AI核心技术研发和产品创新。部门支撑音频和多模态内容从生产、编辑到消费的全流程,赋能内容创作和互动,并以中台形式支持集团多个业务,提供业界前沿的技术能力与解决方案。 1、参与业内前沿的同传(同声传译)大模型项目,深入了解大型语言模型的策略迭代过程,协助完成数据标注和模型评测的落地实施; 2、参与同传大模型的策略迭代:协助收集和分析市场需求,参与制定同传大模型的产品策略和迭代计划;跟进产品开发、测试进度,与算法与工程技术团队合作,确保产品功能按时高质量交付;关注各场景的用户反馈,分析线上产品模型输出效果表现,分析后提出优化迭代方案; 3、模型数据标注支持:协助制定数据标注方案,确保数据符合模型训练要求;与内部标注团队沟通,跟进标注进度,保证数据质量;协助优化数据标注流程,提高效率和质量; 4、模型评测落地:参与设计模型评测标准和评测方法,确保评测过程客观、公正、全面;组织和实施模型评测,收集评测数据和结果;分析评测结果,与技术团队讨论,推动模型优化提升。
日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:Data语音团队致力于语音/音频/音乐相关的AI核心技术研发和产品创新。部门支撑音频和多模态内容从生产、编辑到消费的全流程,赋能内容创作和互动,并以中台形式支持集团多个业务,提供业界前沿的技术能力与解决方案。 1、参与业内前沿的同传(同声传译)大模型项目,深入了解大型语言模型的策略迭代过程,协助完成数据标注和模型评测的落地实施; 2、参与同传大模型的策略迭代:协助收集和分析市场需求,参与制定同传大模型的产品策略和迭代计划;跟进产品开发、测试进度,与算法与工程技术团队合作,确保产品功能按时高质量交付;关注各场景的用户反馈,分析线上产品模型输出效果表现,分析后提出优化迭代方案; 3、模型数据标注支持:协助制定数据标注方案,确保数据符合模型训练要求;与内部标注团队沟通,跟进标注进度,保证数据质量;协助优化数据标注流程,提高效率和质量; 4、模型评测落地:参与设计模型评测标准和评测方法,确保评测过程客观、公正、全面;组织和实施模型评测,收集评测数据和结果;分析评测结果,与技术团队讨论,推动模型优化提升。

进行东南亚语种语言学和大模型研究,语言类项目管理,包括但不限于:协助搭建东南亚小语种自动化处理流程、制定和完善东南亚语项目评测、标注规范,组织文本语言质量评估、编辑、校对,中到多互译,技术报告、汇报材料撰写等工作。