logo of quark

夸克千问C端事业群-语音合成算法专家-北京/杭州

社招全职3年以上技术类-算法地点:北京 | 杭州状态:招聘

任职要求


1、具备语音合成,自然语言处理领域互联网行业2年以上工作经验者优先;
2、名校语音合成、自然语言处理等领域的计算机及相关专业硕士学历优先;
3、熟练掌握PyTorchTensorFlow训练框架;
4…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、语音合成文本分析,韵律预测,注音等技术研发;
2、熟悉常见的声学模型和声码器,具有相关的开发和研究经验
3、熟悉声音转换相关算法和技术;
4、熟悉通用合成引擎搭建及优化,具备云上和端上引擎优化经验。
5、深入调研和关注音频/NLP/多模态等方向的前沿技术,持续探索语音合成技术的新能力和新应用。
包括英文材料
NLP+
学历+
PyTorch+
TensorFlow+
C+
还有更多 •••
相关职位

logo of quark
社招5年以上技术类-算法

1. 负责语音合成算法能力建设和维护,提升语音合成自然度,打造优秀的产品体验; 2. 持续迭代算法能力,配合业务节奏,在个性化TTS、数字人等方向建设相关能力; 3. 分析并解决产品系统中各种badcase,总结问题共性,并落地自动化发现、自动化修复的能力; 4. 独立或带领相关同学探索新方向,引入新技术新想法,以发现商业价值或提升用户体验。

更新于 2025-12-11杭州
logo of quark
社招2年以上技术类-算法

1. 负责音频多模态生成大模型的研发,包含语音合成、音乐生成、音效生成和歌曲生成等任务的基础研究和应用落地; 2. 研发基于扩散模型(Diffusion Models)或自回归模型(AR)的音频生成算法; 3. 研究音频表征、强化学习或语音端到端等技术方向。

更新于 2025-12-26北京|杭州|上海
logo of quark
社招1年以上运营-产品运营

1、负责语音大模型的数据构建,搭建高效高质的数据生产Pipeline和数据标准,用高质量数据提升算法和业务落地的效果; 2、负责语音大模型语音录制、数据寻源、音色数据筛选,搭建科学敏捷的筛选评测Pipeline,包括但不限于排期安排、资源调配以及跨部门沟通协作,确保每个项目都能高效、高质量地完成。 灵活应对录音人选状态变化,适时调整录制计划以保证声音效果。 3、深度理解模型,有敏锐的声音判断能力,设计与业务目标贴合的数据与评测方案;与产品算法团队协同,积极探索自动化数据生产/模型评估、数据合成等方法,提高数据探寻、标注效率; 4、做好数据和评测项目的人力、成本、进度等管理,协调项目资源,推动跨部门沟通合作,达成项目目标。 5、数据音色寻源判断,可自带资源

更新于 2025-12-29杭州
logo of quark
社招1年以上技术类-算法

1.负责声学前端、声学模型、语言模型、后处理、解码器等主要模块的迭代和改进; 2.负责优化双工交互系统,提高系统的鲁棒性和性能; 3.负责优化语音识别大模型、流式语音识别、音频理解大模型、语音端到端大模型等; 4.追踪业界前沿的语音技术,探索语音大模型在业务场景下的应用。

更新于 2025-12-22北京|杭州