夸克千问C端事业群-语音多模态交互算法专家-杭州/北京/上海
社招全职2年以上技术类-算法地点:北京 | 杭州 | 上海状态:招聘
任职要求
1. 计算机、信号处理、数学等相关专业硕士/博士学位,3 年以上相关工作经验; 2. 在语音端到端、多模态端到端对话、语音实时同传、多模态理解与生成一体化等领域有深入研究,具备大规模数据训练经验; 3. 熟练掌握 PyTorch…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
1. 负责研发语音端到端、语音Agent、多模态交互、语音实时同传等任务的基础研究和应用落地; 2. 负责研究语音生成与理解一体化模型架构、强化学习、统一的语音表征等技术方向; 3. 跟踪并研究实现业内顶尖成果,结合业务场景实现算法的工程化部署。
包括英文材料
学历+
PyTorch+
https://datawhalechina.github.io/thorough-pytorch/
PyTorch是利用深度学习进行数据科学研究的重要工具,在灵活性、可读性和性能上都具备相当的优势,近年来已成为学术界实现深度学习算法最常用的框架。
https://www.youtube.com/watch?v=V_xro1bcAuA
Learn PyTorch for deep learning in this comprehensive course for beginners. PyTorch is a machine learning framework written in Python.
DeepSpeed+
https://www.youtube.com/watch?v=pDGI668pNg0
Megatron+
https://www.youtube.com/watch?v=hc0u4avAkuM
还有更多 •••
相关职位
社招3年以上运营-产品运营
● 语音数据采买需求梳理和跟进 负责语音模型训练数据的需求对接,结合业务场景,定义数据采集标准,制定采集方案,跟进采集流程,确保数据按时按质量交付 ● 声音录音指导和质量把控 负责声音音源选型,深度参与寻源全流程,包括需求评估、试音选拔、录制方案定制、录音棚录制指导、数据质量验收,对数据质量负责。 ● 推动语音模型效果提升 关注语音数据模型训练效果,与算法团队合作,结合产品需求,拆解合理的算法评价指标,搭建评测体系,推动算法快速迭代
更新于 2025-12-15杭州
社招2年以上技术类-前端
1. 负责千问网页端、App、桌面客户端的研发,包括文生文、文生图、图生图、语音对话等多模态交互功能研发; 2. 负责推动与产品、运营、测试等团队高效协作,保证项目高质量完成; 3. 负责前端关键技术研究和前沿新技术调研及应用,提升开发效率和团队的技术能力以及追求极致的产品用户体验
更新于 2026-01-05杭州|上海
社招3年以上运营-产品运营
● 语音核心功能运营 负责语音功能使用率、留存、转化的数据研究、策略制定与落地(语音输入、播报、搜索、实时通话等);设计并验证增长实验(AB 测试、漏斗分析、转化优化、运营策略试点)并对结果负责;形成月度/季度运营复盘、策略与计划。 ● 用户洞察与体验优化 基于数据分析、用户访谈、行为洞察,提出产品优化策略,驱动产品迭代;能独立提出需求并推动产品和研发落地,确保体验和指标提升。 ● 语音模型效果运营与体验验证 与算法团队合作,负责 ASR、TTS、E2E、多模态模型的用户侧效果验证机制搭建; 输出可量化的模型端体验指标体系与效果反馈闭环。 ● 内部语音能力展示平台运营负责 独立负责平台定位、体验升级、内容体系与传播; 通过内部分享、活动、Demo运营,提高平台使用率和内部认知影响力。
更新于 2026-02-10杭州