logo of tencent

腾讯语音合成专家

社招全职IEG技术地点:深圳状态:招聘

任职要求


1.在语音合成领域有不错的学术或工业产出;
2.编码能力良好,熟悉业界常用语音合成技术方案;
3.熟悉大模型分布式训练,调优,调试;
4.优秀的分析问题和解决问题的能力,对解决具有挑战性的问题充满激情;
5.有较强的研究能力,在语音顶级会议/期刊上有高质量的学术成果;
6.责任心强,良好的业务意识,团队合作能力和沟通协调能力。

工作职责


1.负责面向游戏领域语音大模型的构建,包括预训练、指令微调、训练和推理加速、模型评测等;
2.探索大语音模型技术在游戏场景中的应用,为游戏创作、运营、交互体验等各环节提供更智能化的模型能力;
3.优化现有线上算法,包括对话TTS,千人千面语音,多语种TTS,音乐生成,歌声合成等方向研发工作,结合实际业务需求与数据,研发高效可靠的语音合成解决方案;
4.跟踪探索大语音模型的前沿技术与应用落地。
包括英文材料
大模型+
相关职位

logo of aligenie
社招5年以上技术类-算法

1. 负责语音合成算法能力建设和维护,提升语音合成自然度,打造优秀的产品体验; 2. 持续迭代算法能力,配合业务节奏,在个性化TTS、数字人等方向建设相关能力; 3. 分析并解决产品系统中各种badcase,总结问题共性,并落地自动化发现、自动化修复的能力; 4. 独立或带领相关同学探索新方向,引入新技术新想法,以发现商业价值或提升用户体验。

更新于 2025-09-11
logo of quark
社招3年以上技术类-算法

1、语音合成文本分析,韵律预测,注音等技术研发; 2、熟悉常见的声学模型和声码器,具有相关的开发和研究经验 3、熟悉声音转换相关算法和技术; 4、熟悉通用合成引擎搭建及优化,具备云上和端上引擎优化经验。 5、深入调研和关注音频/NLP/多模态等方向的前沿技术,持续探索语音合成技术的新能力和新应用。

更新于 2025-09-26
logo of amap
社招3年以上技术类-算法

团队介绍: 高德语音技术部,是负责高德自研全栈语音技术的综合性团队。团队核心技术能力包括:自研TTS基座大模型、端侧模型、多语种、RTC流式语音、语音识别、模型服务与推理、大规模语音IP定制服务等。业务支撑面向高德全部核心场景,包括语音导航、AI领航员、IP语音定制、国际化、AI语音助手、智能外呼、内容生成等。 团队定位是通过前沿语音技术的研究和落地,赋能下一代AI产品创新。近期部分技术(https://arxiv.org/abs/2507.12197)和产品进展介绍(https://mp.weixin.qq.com/s/A3TWtfwlqGdkC6oNHrkFaw ) 岗位职责: 1. 负责语音合成方向的技术预研和研发工作,包括但不限于前端模型,声学模型,声码器的训练和调优; 2. 跟踪业界前沿技术和方法,持续探索语音合成技术的新能力和新应用,持续提升语音合成核心能力。

更新于 2025-09-26
logo of amap
实习高德地图2026

团队介绍: 高德语音技术团队,由高德资深算法专家,原微软小冰核心对话技术负责人组建,主要负责前沿语音技术在高德丰富场景中的落地应用。团队当前聚焦在语音合成、唤醒、语音AIGC等方向,探索前沿语音大模型技术对高德丰富产品形态的赋能。 具体职责包括但不限于: 1、对语音合成、自然语言处理、音视频多模态融合和大模型等方向感兴趣,独立研究并完成指定课题; 2、通过机器学习和人工智能技术来提升甚至重新定义音频内容创作工作,产出下一代超自然语音合成技术并应用于高德出行业务场景。

更新于 2025-03-03