logo of quark

夸克千问C端事业群-语音多模态交互算法专家-杭州/北京/上海

社招全职2年以上技术类-算法地点:北京 | 杭州 | 上海状态:招聘

任职要求


1. 计算机、信号处理、数学等相关专业硕士/博士学位,3 年以上相关工作经验;
2. 在语音端到端、多模态端到端对话、语音实时同传、多模态理解与生成一体化等领域有深入研究,具备大规模数据训练经验;
3. 熟练掌握 PyTorch
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 负责研发语音端到端、语音Agent、多模态交互、语音实时同传等任务的基础研究和应用落地;
2. 负责研究语音生成与理解一体化模型架构、强化学习、统一的语音表征等技术方向;
3. 跟踪并研究实现业内顶尖成果,结合业务场景实现算法的工程化部署。
包括英文材料
学历+
PyTorch+
DeepSpeed+
Megatron+
还有更多 •••
相关职位

logo of quark
社招3年以上运营-产品运营

● 语音数据采买需求梳理和跟进 负责语音模型训练数据的需求对接,结合业务场景,定义数据采集标准,制定采集方案,跟进采集流程,确保数据按时按质量交付 ● 声音录音指导和质量把控 负责声音音源选型,深度参与寻源全流程,包括需求评估、试音选拔、录制方案定制、录音棚录制指导、数据质量验收,对数据质量负责。 ● 推动语音模型效果提升 关注语音数据模型训练效果,与算法团队合作,结合产品需求,拆解合理的算法评价指标,搭建评测体系,推动算法快速迭代

更新于 2025-12-15杭州
logo of quark
社招2年以上技术类-前端

1. 负责千问网页端、App、桌面客户端的研发,包括文生文、文生图、图生图、语音对话等多模态交互功能研发; 2. 负责推动与产品、运营、测试等团队高效协作,保证项目高质量完成; 3. 负责前端关键技术研究和前沿新技术调研及应用,提升开发效率和团队的技术能力以及追求极致的产品用户体验

更新于 2026-01-05杭州|上海
logo of quark
社招3年以上运营-产品运营

● 语音核心功能运营 负责语音功能使用率、留存、转化的数据研究、策略制定与落地(语音输入、播报、搜索、实时通话等);设计并验证增长实验(AB 测试、漏斗分析、转化优化、运营策略试点)并对结果负责;形成月度/季度运营复盘、策略与计划。 ● 用户洞察与体验优化 基于数据分析、用户访谈、行为洞察,提出产品优化策略,驱动产品迭代;能独立提出需求并推动产品和研发落地,确保体验和指标提升。 ● 语音模型效果运营与体验验证 与算法团队合作,负责 ASR、TTS、E2E、多模态模型的用户侧效果验证机制搭建; 输出可量化的模型端体验指标体系与效果反馈闭环。 ● 内部语音能力展示平台运营负责 独立负责平台定位、体验升级、内容体系与传播; 通过内部分享、活动、Demo运营,提高平台使用率和内部认知影响力。

更新于 2026-02-10杭州
logo of quark
社招3年以上技术类-开发

1. 优化多模态对话框架,建设超长程对话能力,通过长短期记忆、物理环境感知等手段增强智能度,打造行业领先的智能对话助手; 2. 建设AI穿戴硬件网关,与硬件端侧紧密协作,多种手段优化穿戴硬件在弱网、断网场景下的用户体验问题,持续提升易用性、稳定性; 3. 把握行业的前瞻技术发展趋势,基于业务场景,结合新技术、新形态,推动技术创新性产品落地.

更新于 2026-01-27杭州