夸克千问C端事业群-语音大模型数据工程师-杭州
社招全职1年以上技术类-数据地点:杭州状态:招聘
任职要求
1、本科以上学位,语言学、语音学、计算语言学、语用学、心理学、汉语言等相关专业优先;
2、2-3年以上语音数据相关工作经验,熟悉音视频创作、智能语音交互场景,有大语言模型相关的科研项目或工作经历…登录查看完整任职要求
微信扫码,1秒登录
工作职责
1、负责语音大模型的数据构建,搭建高效高质的数据生产Pipeline和数据标准,用高质量数据提升算法和业务落地的效果; 2、负责语音大模型语音录制、数据寻源、音色数据筛选,搭建科学敏捷的筛选评测Pipeline,包括但不限于排期安排、资源调配以及跨部门沟通协作,确保每个项目都能高效、高质量地完成。 灵活应对录音人选状态变化,适时调整录制计划以保证声音效果。 3、深度理解模型,有敏锐的声音判断能力,设计与业务目标贴合的数据与评测方案;与产品算法团队协同,积极探索自动化数据生产/模型评估、数据合成等方法,提高数据探寻、标注效率; 4、做好数据和评测项目的人力、成本、进度等管理,协调项目资源,推动跨部门沟通合作,达成项目目标。 5、数据音色寻源判断,可自带资源
包括英文材料
学历+
Prompt+
https://cloud.google.com/vertex-ai/generative-ai/docs/learn/prompts/introduction-prompt-design
A prompt is a natural language request submitted to a language model to receive a response back.
https://learn.microsoft.com/en-us/azure/ai-foundry/openai/concepts/prompt-engineering
These techniques aren't recommended for reasoning models like gpt-5 and o-series models.
https://www.youtube.com/watch?v=LWiMwhDZ9as
Learn and master the fundamentals of Prompt Engineering and LLMs with this 5-HOUR Prompt Engineering Crash Course!
相关职位
社招3年以上技术类-开发
1、参与设计并实现高性能、可扩展、分布式大数据处理平台,通过数据驱动模型训练,支撑夸克智能语音相关业务算法生产与高效迭代; 2、与算法工程师密切配合,理解深度学习模型研发流程,负责/参与前沿模型研究中数据解决方案的设计、开发和维护; 3、通过AI能力来赋能数据建设,持续提升平台数据生产效率、易用性、降低算法使用成本
更新于 2025-12-09杭州|北京
社招3年以上产品类-用户型
● 语音核心体验提升 负责语音基础能力在产品内的体验升级(语音输入、播报、搜索、实时通话等),定制优化策略,推动语音功能使用率、留存、转化的数据指标提升,推动产品内用户语音心智建立 ● 语音交互产品功能优化 负责语音交互相关的产品功能设计和落地,深入挖掘用户需求,设计产品方案和优化策略,驱动产品迭代;能独立提出需求并推动产品和研发落地,确保体验和指标提升。 ● 推动语音模型效果提升 负责 ASR、TTS、E2E、多模态模型的用户侧效果验证机制搭建,与算法团队合作,结合产品需求,拆解合理的算法评价指标,搭建评测体系,推动算法快速迭代
更新于 2025-12-11北京|杭州
社招1年以上技术类-算法
1.负责声学前端、声学模型、语言模型、后处理、解码器等主要模块的迭代和改进; 2.负责优化双工交互系统,提高系统的鲁棒性和性能; 3.负责优化语音识别大模型、流式语音识别、音频理解大模型、语音端到端大模型等; 4.追踪业界前沿的语音技术,探索语音大模型在业务场景下的应用。
更新于 2025-12-09北京|杭州