logo of quark

夸克千问C端事业群-语音合成算法专家-杭州/上海

社招全职3年以上技术类-算法地点:杭州 | 上海状态:招聘

任职要求


统和常用的数据结构,熟练使用Python/C++等至少一种编程语言,熟练使用TensorFlow/PyTorch等至少一种深度学习框架;
3、深入理解端到端语音大模型的原理和架构,熟悉常见的语音和全模态大模型,如qwen-TTS、qwen-omni、Whisper等,对语音识别、合成、对话理解等技术有扎实的理论基础…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、负责大模型TTS和大模型音频生成技术构建。为语音助手超级智能体提供音频技术支持,包括但不限于TTS、端到端语音大模型、音频AIGC等;
2、负责关键场景的语音交互大模型算法优化,构建高质量低延迟的TTS和音频生成系统,提升业务效果;
3、跟进业界前沿的语音生成大模型技术,如语音端到端大模型和全模态模型等,提升语音助手场景的智能化并落地产品。
包括英文材料
数据结构+
Python+
C+++
TensorFlow+
PyTorch+
深度学习+
还有更多 •••
相关职位

logo of quark
社招3年以上技术类-算法

1、语音合成文本分析,韵律预测,注音等技术研发; 2、熟悉常见的声学模型和声码器,具有相关的开发和研究经验 3、熟悉声音转换相关算法和技术; 4、熟悉通用合成引擎搭建及优化,具备云上和端上引擎优化经验。 5、深入调研和关注音频/NLP/多模态等方向的前沿技术,持续探索语音合成技术的新能力和新应用。

更新于 2025-12-22北京|杭州
logo of quark
社招5年以上技术类-算法

1. 负责语音合成算法能力建设和维护,提升语音合成自然度,打造优秀的产品体验; 2. 持续迭代算法能力,配合业务节奏,在个性化TTS、数字人等方向建设相关能力; 3. 分析并解决产品系统中各种badcase,总结问题共性,并落地自动化发现、自动化修复的能力; 4. 独立或带领相关同学探索新方向,引入新技术新想法,以发现商业价值或提升用户体验。

更新于 2025-12-11杭州
logo of quark
社招2年以上技术类-算法

1. 负责音频多模态生成大模型的研发,包含语音合成、音乐生成、音效生成和歌曲生成等任务的基础研究和应用落地; 2. 研发基于扩散模型(Diffusion Models)或自回归模型(AR)的音频生成算法; 3. 研究音频表征、强化学习或语音端到端等技术方向。

更新于 2025-12-26北京|杭州|上海
logo of quark
社招2年以上

1、负责语音大模型数据构建,设计各技术方案下各阶段数据方案与策略,建设专业、敏捷的流程&标准,管理高效高质的数据生产Pipeline,有效提升技术预研/业务落地效果; 2、负责端到端语音大模型评测体系建设,设计模型优化敏感、业务场景适配的评测方案与流程,建设并管理科学、敏捷的评测Pipeline,为模型效果提升提供有价值的优化方向与反馈; 3、推动跨团队合作,理解上游需求并统筹下游人力,负责项目资源的协调与组织,与算法/产品进行良好沟通,确保项目团队协同工作,推动语音方案在业务场景的落地。

更新于 2026-02-09杭州|上海