logo of amap

高德地图语音数据实习生

实习兼职高德研究型实习生地点:北京状态:招聘

任职要求


1. 985/211高校本科生及以上学历,计算机、人工智能、软件、数学等相关专业,有语音、自然语言处理、多模态等背景优先;
2. 熟悉音视频创作、智能语音交…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


团队介绍:
高德语音技术部,是负责高德全栈语音技术的综合性团队。团队核心技术能力包括:自研TTS基座大模型、端侧模型、多语种、RTC流式语音、语音内容生成、语音识别、多模态模型、模型服务与推理。业务支撑面向高德全部核心场景,包括语音导航、AI领航员、IP语音定制、国际化、AI语音助手、智能外呼、内容生成等。
团队定位是通过前沿语音技术的研究和落地,赋能下一代AI产品创新。近期部分技术(https://arxiv.org/abs/2507.12197)和产品进展介绍(https://mp.weixin.qq.com/s/cCeHbNW0jbC_LNVPZlGeHg)

具体职责:
1. 协助语音大模型的数据构建,搭建高效高质的语音数据生产Pipeline 和数据标准,优化Pipeline算子,用高质量数据提升技术预研和业务落地的效果;
2. 参与语音大模型的端到端评测,搭建科学敏捷的评测Pipeline和评测标准,用全面真实的评测推动模型效果优化提升;
3. 深度理解对话交互、音视频创作的技术和产品趋势,设计与业务目标贴合的数据与评测方案;与团队协同,积极探索自动化数据生产/模型评估、数据合成等方法,提高数据标注/评测效率;
包括英文材料
学历+
NLP+
相关职位

logo of tme
实习技术类

1. 整理、制定指定音色的特色文案; 2. 跟随声优进棚,承担监棚任务,保证录音质量; 3. 根据算法工程师的要求进行实验数据的录制; 4. 进行模型训练效果的评估,并提供优化意见; 5. 对数据进行标注或者质检; 6. 承担一部分语音相关产品的工作。

更新于 2025-06-27深圳
logo of netease
实习网易伏羲

1、根据规则要求,对图片、文本和语音数据进行处理,对质量负责; 2、协助项目管理人员对平台用户提交的数据进行验收,把控项目质量; 3、协助进行一些平台用户的运营工作。

更新于 2025-08-05杭州
logo of quark
实习日常实习生

1、负责为不同角色设计人设并撰写富有表现力的文本语料,旨在为合成语音注入情感、表现力和角色特质。从声学及表演角度参与发音人筛选; 2、参与构建专业的数据生产流程,制定语言学标注标准。对录音数据进行质量检查。整理并制定发音和韵律规则; 3、参与搭建语音合成效果的主观与客观评价流程。从音质、自然度、表现力、发音准确度等维度进行专业评测并提供优化建议。

更新于 2025-12-04杭州|上海
logo of tcl
实习研发技术类

负责对语音唤醒和识别相关数据进行数据标注和分类; 能够快速理解学习标注数据的项目背景和规则,精准完成标注任务; 协助产品经理进行需求编写,行业洞察,产品路线规划等工作; 协助整理语音交互数据、统计分析、输出报告

更新于 2025-03-31深圳