阿里巴巴业务技术-TTS算法专家-直播
任职要求
1. 计算机科学、人工智能或相关专业本科及以上学历,有语音合成、数字人技术背景者优先。 2. 精通Python、C++等编程语言,对语音信号处理、深度学习有深入理解。 3. 有语音合成系统开发经验,大模型研发经验优先。 4. 具备良好的团队合作精神,优秀的沟通能力和解决问题的能力。 5. 对电商直播行业有一定了解,有数字人项目经验者优先。
工作职责
1. 负责淘宝直播数字人的语音合成系统开发,包括语音建模、情感表达、语速调节等功能的实现。 2. 优化TTS引擎,提高语音合成的自然度和流畅度,使数字人的声音更加贴近真人。 3. 研究并应用业界&学界前沿的语音合成大模型技术,提升直播互动体验。 4. 与产品、设计团队紧密合作,将TTS技术无缝集成到直播平台中,提升用户参与感。
1. 面向蚂蚁集团AGI产品研发语音相关能力,助力蚂蚁集团基于大模型的智能交互业务发展; 2. 探索并落地前沿的语音算法技术,方向包括但不限于语音识别、语音合成、语音克隆等; 3. 负责和承接蚂蚁集团数十个场景中涉及的语音识别、语音合成的算法能力建设。
团队介绍: 高德语音技术部,是负责高德自研全栈语音技术的综合性团队。团队核心技术能力包括:自研TTS基座大模型、端侧模型、多语种、RTC流式语音、语音识别、模型服务与推理、大规模语音IP定制服务等。业务支撑面向高德全部核心场景,包括语音导航、AI领航员、IP语音定制、国际化、AI语音助手、智能外呼、内容生成等。 团队定位是通过前沿语音技术的研究和落地,赋能下一代AI产品创新。近期部分技术(https://arxiv.org/abs/2507.12197)和产品进展介绍(https://mp.weixin.qq.com/s/A3TWtfwlqGdkC6oNHrkFaw ) 工作职责 1、参与输出语音技术(TTS、ASR、语音表征学习、端到端模型)的长期技术路线规划,推动团队在生成式语音大模型、多模态语音交互等领域的技术突破; 2、研究TTS大模型、端到端语音模型的前沿方向,探索语音与文本、视觉的跨模态融合,探索出行场景语音Agent的创新方向; 3、技术落地与产品化:将研究成果转化为高价值产品,解决复杂场景(如低资源语言、多语种、实时性要求高的工业级应用); 4、学术与产业影响力:发表顶会论文(如ICASSP、INTERSPEECH、NeurIPS、ICML)、申请核心专利,提升公司技术话语权。
团队介绍: 高德语音技术部,是负责高德自研全栈语音技术的综合性团队。团队核心技术能力包括:自研TTS基座大模型、端侧模型、多语种、RTC流式语音、语音识别、模型服务与推理、大规模语音IP定制服务等。业务支撑面向高德全部核心场景,包括语音导航、AI领航员、IP语音定制、国际化、AI语音助手、智能外呼、内容生成等。 团队定位是通过前沿语音技术的研究和落地,赋能下一代AI产品创新。近期部分技术(https://arxiv.org/abs/2507.12197)和产品进展介绍(https://mp.weixin.qq.com/s/A3TWtfwlqGdkC6oNHrkFaw ) 岗位职责: 1. 负责语音合成方向的技术预研和研发工作,包括但不限于前端模型,声学模型,声码器的训练和调优; 2. 跟踪业界前沿技术和方法,持续探索语音合成技术的新能力和新应用,持续提升语音合成核心能力。
团队介绍: 高德语音技术部,是负责高德自研全栈语音技术的综合性团队。团队核心技术能力包括:自研TTS基座大模型、端侧模型、多语种、RTC流式语音、语音识别、模型服务与推理、大规模语音IP定制服务等。业务支撑面向高德全部核心场景,包括语音导航、AI领航员、IP语音定制、国际化、AI语音助手、智能外呼、内容生成等。 团队定位是通过前沿语音技术的研究和落地,赋能下一代AI产品创新。近期部分技术(https://arxiv.org/abs/2507.12197)和产品进展介绍(https://mp.weixin.qq.com/s/A3TWtfwlqGdkC6oNHrkFaw ) 工作职责: 1、ASR系统搭建与优化: 主导出行场景的语音识别系统设计与实现,满足高噪声、多语种、方言等复杂场景下的语音识别需求; 针对出行场景的特殊性(如驾驶环境噪音、多用户交互等),优化提升识别准确率和实时性; 构建高可用的ASR服务框架,支持大规模数据训练、模型迭代及线上服务部署; 2、语音自监督表征与token化: 参与探索基于自监督学习(如Wav2Vec 2.0、HuBERT等)的语音表征方法,设计轻量化、高效的声学特征提取模型; 参与研究端到端语音语言模型(SpeechLM),推动语音对话系统向端到端方向演进; 3、跨部门协作与产品化: 与产品、工程团队协作,将研究成果转化为可落地的ASR解决方案。参与技术文档编写、算法效果评估及A/B测试,持续优化系统性能。