logo of quark

夸克千问C端事业群-千问/夸克-语音AI产品经理-杭州/北京

社招全职3年以上产品类-用户型地点:北京 | 杭州状态:招聘

任职要求


基本要求:
1、本科及以上学历,专业不限(计算机、电子、心理学、认知科学、人机交互优先);
2、3-7年AI产品经验(有独立项目落地能力)
3、逻辑清晰、表达能力强,具备良好的跨团队沟通能力与推动力,可与产品、研发、算法高效协作,有复杂项目协同和…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


● 语音核心体验提升
负责语音基础能力在产品内的体验升级(语音输入、播报、搜索、实时通话等),定制优化策略,推动语音功能使用率、留存、转化的数据指标提升,推动产品内用户语音心智建立

● 语音交互产品功能优化
负责语音交互相关的产品功能设计和落地,深入挖掘用户需求,设计产品方案和优化策略,驱动产品迭代;能独立提出需求并推动产品和研发落地,确保体验和指标提升。

● 推动语音模型效果提升
负责 ASR、TTS、E2E、多模态模型的用户侧效果验证机制搭建,与算法团队合作,结合产品需求,拆解合理的算法评价指标,搭建评测体系,推动算法快速迭代
包括英文材料
学历+
算法+
还有更多 •••
相关职位

logo of pingantech
社招8年以上计算机网络技术类

作为C端智能客服核心产品线的测试负责人,您将全面负责“C端客服机器人万能服务”从需求到上线的全生命周期质量保障工作。您将带领一支高水平测试团队,构建智能化、体系化、可复用的测试方法论,推动AI能力在真实用户场景中的稳定落地,保障千万级用户服务体验与系统高可用。 【核心职责】 1.主导C端客服机器人-万能服务的测试策略制定与质量目标设定;设计并落地覆盖“意图识别、多轮对话、业务闭环、异常处理、多模态交互”的全链路测试体系; 2.建设AI对话质量评估标准,融合人工评审、自动化评分(BLEU、ROUGE、BERTScore等)与用户行为分析,实现质量可度量; 3.搭建并持续优化自动化测试框架(支持文本/语音/UI/接口/性能),实现高并发、高覆盖率的回归验证; 4.推动测试左移,参与需求评审、原型验证、算法模型评估,前置发现潜在风险; 5.主导重大版本发布前的端到端压测、稳定性测试、灰度发布验证与线上监控告警体系建设; 6.带领10人以上测试团队,负责人才梯队建设、绩效管理与跨团队协同(产品、研发、算法、运营、风控); 7.输出测试报告、质量洞察与改进建议,支撑管理层决策与产品迭代。

更新于 2025-11-10上海
logo of pingantech
社招8年以上计算机网络技术类

1.主导C端客服机器人-万能服务的测试策略制定与质量目标设定;设计并落地覆盖“意图识别、多轮对话、业务闭环、异常处理、多模态交互”的全链路测试体系; 2.建设AI对话质量评估标准,融合人工评审、自动化评分(BLEU、ROUGE、BERTScore等)与用户行为分析,实现质量可度量; 3.搭建并持续优化自动化测试框架(支持文本/语音/UI/接口/性能),实现高并发、高覆盖率的回归验证; 4.推动测试左移,参与需求评审、原型验证、算法模型评估,前置发现潜在风险; 5.主导重大版本发布前的端到端压测、稳定性测试、灰度发布验证与线上监控告警体系建设; 6.带领10人以上测试团队,负责人才梯队建设、绩效管理与跨团队协同(产品、研发、算法、运营、风控); 7.输出测试报告、质量洞察与改进建议,支撑管理层决策与产品迭代。

更新于 2025-11-13深圳
logo of tongyi
校招通义2026届秋

通义千问(Qwen)是由通义实验室自主研发的超大规模语言模型,具备跨语言、跨任务的理解与生成能力。Qwen系列模型,涵盖参数量从几百 M 到 T 级的基座大语言模型,并相继推出Qwen-VL、Qwen-Audio、Qwen-Omni、Qwen-Coder等系列模型。从多轮对话到代码生成,从逻辑推理到内容创作,从单一多模态到全模态统一理解生成,Qwen 正在打造全球领先的全模态模型技术体系,推动AI在企业服务、开发者生态、个人用户等领域的深度应用,引领下一代人工智能的发展。 团队致力于追逐实现 Omni 基座模型,实现多模态理解与多模态生成一体化。在此之中,语音理解与语音生成是极其重要的技术,影响着下一代 AI 的交互形式,同时通过生成语音甚至创造音乐等方式改变人类的生活与工作。团队音频组负责围绕 Qwen 基座模型展开音频处理以及与音频交互相关的基础研究及其应用,代表工作有 Qwen2.5-Omni, Qwen2-Audio, Qwen-Audio。音频组招收理解以及生成方向研究员,包括但不限于 ASR, TTS, S2TT,TTS, Zero-Shot TTS, Music/Song Generation, 同时也欢迎擅长音频交互的工程师,负责基座模型的开源与落地应用,支持开发实时交互系统。 工作职责: 1. 单人/多说话人语音识别。 2. 语音合成与高质量音频合成。 3. 音频前端与音色转换。 4. 音色克隆(Zero-Shot TTS)。 5. 音乐生成 / 歌声生成。 6. 理解指令遵循能力提升与推理,包括 SFT, GRPO 等。 7. 流式音频交互模型的推理与加速 (熟悉RTC/WebSocket等)。

更新于 2025-08-07北京|杭州|上海
logo of tongyi
校招通义2026届秋

通义千问(Qwen)是由通义实验室自主研发的超大规模语言模型,具备跨语言、跨任务的理解与生成能力。Qwen系列模型,涵盖参数量从几百 M 到 T 级的基座大语言模型,并相继推出Qwen-VL、Qwen-Audio、Qwen-Omni、Qwen-Coder、Qwen-Image等系列模型。从多轮对话到代码生成,从逻辑推理到内容创作,从单一多模态到全模态统一理解生成,Qwen 正在打造全球领先的全模态模型技术体系,推动AI在企业服务、开发者生态、个人用户等领域的深度应用,引领下一代人工智能的发展。 通义千问(Qwen)全模态统一理解生成前沿技术研究,团队在多个方向上进行探索(具体如下罗列),若你对以下一个或者多个课题感兴趣均欢迎投递: 1. 模型架构与学习机制探索 (1)预训练与后训练技术:持续提升模型的理解力、推理力与泛化能力。 (2)探索下一代学习范式,如自监督学习、动态训练策略、知识蒸馏等。 2. 多模态与多智能体感知交互系统 (1)打造 Omni 基座模型,实现文本、语音、视觉等多模态一体化理解与生成,推动世界模型的发展。 (2)开发超智能的 Coding Agent,打通语言与代码之间的桥梁,连接 AI 与数字世界。 (3)构建下一代 AI 交互系统,在 GUI Agent、视频理解等前沿场景,探索 AI 自主执行、扩展、进化的可能性。 3. 数据建设与性能优化 (1)数据工程:设计高效的数据处理管线,持续提升自然语言、代码、多模态等数据质量与规模。 (2)推理优化:探索模型高并发服务下,算法及系统框架侧技术创新与优化,包括但不限于训练推理协同优化、模型推理新范式。 4. 评测与安全体系 (1)构建下一代大模型评估系统,覆盖推理、生成、可控性等多个维度。 (2)关注模型内生安全,追求 AI 对人类有益且可控,参与对抗攻击检测、伦理约束建模等工作。

更新于 2025-08-18北京|杭州|上海