logo of quark

夸克千问C端事业群-语音识别算法专家-杭州/北京

社招全职1年以上技术类-算法地点:北京 | 杭州状态:招聘

任职要求


1.计算机科学、电子工程、数学或相关领域的硕士及以上学位;
2.深入理解语音识别相关领域的基本概念,包括但不限于语音信号处理、自然语言处理机器学习深度学习等;
3.熟练掌握C++/C/Python/Shell等编程能力,并有实际的项目开发经验;
4.精通深度学习框架(如…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1.负责声学前端、声学模型、语言模型、后处理、解码器等主要模块的迭代和改进;
2.负责优化双工交互系统,提高系统的鲁棒性和性能;
3.负责优化语音识别大模型、流式语音识别、音频理解大模型、语音端到端大模型等;
4.追踪业界前沿的语音技术,探索语音大模型在业务场景下的应用。
包括英文材料
学历+
语音识别+
NLP+
机器学习+
深度学习+
C+++
还有更多 •••
相关职位

logo of quark
社招3年以上技术类-算法

1、负责大模型TTS和大模型音频生成技术构建。为语音助手超级智能体提供音频技术支持,包括但不限于TTS、端到端语音大模型、音频AIGC等; 2、负责关键场景的语音交互大模型算法优化,构建高质量低延迟的TTS和音频生成系统,提升业务效果; 3、跟进业界前沿的语音生成大模型技术,如语音端到端大模型和全模态模型等,提升语音助手场景的智能化并落地产品。

更新于 2026-02-02杭州|上海
logo of quark
社招2年以上技术类-算法

1. 负责音频多模态理解大模型的研发,包含语音识别、语音翻译、副语言理解、音频事件检测或音频captioning等任务的基础研究和应用落地; 2. 研究音频编码器、跨模态对齐、强化学习、多任务学习或语音端到端等技术方向; 3. 跟踪并落地领域内前沿论文,保持技术方案的领先性。

更新于 2025-12-26北京|杭州|上海
logo of quark
社招5年以上技术类-算法

1.负责端侧语音算法(本地唤醒和识别等)的算法研发、工程化验证,以及性能优化; 2.负责端侧语音交互模型(双工、端侧大模型等)的算法研发、工程化验证,以及性能优化。

更新于 2026-01-28杭州
logo of quark
社招5年以上技术类-开发

1. 建设多模态对话系统服务,跟随产品规划推进相关技术落地,保证产品功能的顺利交付; 2. 建设多模态对话系统平台,构建面向个人开发者和企业合作伙伴的软硬件的解决方案; 3. 把握行业的前瞻技术发展趋势,基于业务场景,结合新技术、新形态,推动技术创新性产品落地。

更新于 2026-01-29杭州