腾讯语音合成专家
社招全职IEG技术地点:深圳状态:招聘
任职要求
1.在语音合成领域有不错的学术或工业产出;
2.编码能力良好,熟悉业界常用语音合成技术方案;
3.熟悉大模型分布式训练,调优,调试;
4.优秀的分析问题和解决问题的能力,对解决具有挑战性的问题充满激情;
5.有较强的研究能力,在语音顶级会议/期刊上有高质量的学术成果;
6.责任心强,良好的业务意识,团队合作能力和沟通协调能力。
工作职责
1.负责面向游戏领域语音大模型的构建,包括预训练、指令微调、训练和推理加速、模型评测等; 2.探索大语音模型技术在游戏场景中的应用,为游戏创作、运营、交互体验等各环节提供更智能化的模型能力; 3.优化现有线上算法,包括对话TTS,千人千面语音,多语种TTS,音乐生成,歌声合成等方向研发工作,结合实际业务需求与数据,研发高效可靠的语音合成解决方案; 4.跟踪探索大语音模型的前沿技术与应用落地。
包括英文材料
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
相关职位

社招5年以上技术类-算法
1. 负责语音合成算法能力建设和维护,提升语音合成自然度,打造优秀的产品体验; 2. 持续迭代算法能力,配合业务节奏,在个性化TTS、数字人等方向建设相关能力; 3. 分析并解决产品系统中各种badcase,总结问题共性,并落地自动化发现、自动化修复的能力; 4. 独立或带领相关同学探索新方向,引入新技术新想法,以发现商业价值或提升用户体验。
更新于 2025-09-11
社招3年以上技术类-算法
1、语音合成文本分析,韵律预测,注音等技术研发; 2、熟悉常见的声学模型和声码器,具有相关的开发和研究经验 3、熟悉声音转换相关算法和技术; 4、熟悉通用合成引擎搭建及优化,具备云上和端上引擎优化经验。 5、深入调研和关注音频/NLP/多模态等方向的前沿技术,持续探索语音合成技术的新能力和新应用。
更新于 2025-09-26
社招3年以上技术类-算法
团队介绍: 高德语音技术部,是负责高德自研全栈语音技术的综合性团队。团队核心技术能力包括:自研TTS基座大模型、端侧模型、多语种、RTC流式语音、语音识别、模型服务与推理、大规模语音IP定制服务等。业务支撑面向高德全部核心场景,包括语音导航、AI领航员、IP语音定制、国际化、AI语音助手、智能外呼、内容生成等。 团队定位是通过前沿语音技术的研究和落地,赋能下一代AI产品创新。近期部分技术(https://arxiv.org/abs/2507.12197)和产品进展介绍(https://mp.weixin.qq.com/s/A3TWtfwlqGdkC6oNHrkFaw ) 岗位职责: 1. 负责语音合成方向的技术预研和研发工作,包括但不限于前端模型,声学模型,声码器的训练和调优; 2. 跟踪业界前沿技术和方法,持续探索语音合成技术的新能力和新应用,持续提升语音合成核心能力。
更新于 2025-09-26