腾讯元宝-智能语音理解算法研究员
任职要求
1.硕士或以上学历,信号处理、计算机、电子信息、自动化、模式识别等相关专业; 2.3年以上语音识别相关工作经验,扎实的语音信号处理,机器学习,模式识别,深度学习理论功底,对大模型语音理解技术有深入的了解和上线实践; 3.具备LLM理论基…
工作职责
1.本职位承接元宝2c和2b场景各类实时和离线语音内容理解工作。进一步提升内容识别和理解质量,包括但不限于结合降噪的语音识别,富语言信息识别,多语种内容识别等; 2.从长度和内容的丰富度上,研发超长音频,超长上下文,多说话人,多语种,多方言,多轮,连续语流场景下,全面理解音视频内容的大模型方案; 3.从可利用的信息上,充分利用各类多模态输入信息,提升元宝各类产品语音理解内容理解的质量和效率; 4.研发和工程优化模型小型化,边缘计算,完赛模型的PaaS能力,赋能司内各类元宝生态下的音频理解基础能力。
1.负责腾讯元宝的视觉与动效设计,构建符合AI助手特性的情感化设计语言,通过动态视觉提升用户认知效率与交互愉悦感; 2.主导产品动效体系设计,包括智能反馈动效(如语音对话动态交互、AI生成状态、多模态交互响应)、微交互设计、界面过渡动画等,强化AI产品的自然交互体验; 3.与AI算法团队协作,将技术能力(如生成式AI、实时交互)转化为可视化的动态设计表达,平衡创意表现与系统性能; 4.建立元宝产品的动态设计规范,推动动效组件化落地,确保多端(Web/App/小程序)体验一致性; 5.通过用户研究验证动效设计的有效性,持续优化AI助手的人格化表达与功能引导性。
1.负责腾讯元宝的视觉与动效设计,构建符合AI助手特性的情感化设计语言,通过动态视觉提升用户认知效率与交互愉悦感; 2.主导产品动效体系设计,包括智能反馈动效(如语音对话动态交互、AI生成状态、多模态交互响应)、微交互设计、界面过渡动画等,强化AI产品的自然交互体验; 3.与AI算法团队协作,将技术能力(如生成式AI、实时交互)转化为可视化的动态设计表达,平衡创意表现与系统性能; 4.建立元宝产品的动态设计规范,推动动效组件化落地,确保多端(Web/App/小程序)体验一致性; 5.通过用户研究验证动效设计的有效性,持续优化AI助手的人格化表达与功能引导性。
1.自动评估体系建设:设计并搭建大模型自动评估体系,覆盖通用能力及专项能力(如推理、写作、语音、VLM 等);构建评测指标体系与自动化评测流程,推动评测体系标准化、模块化、可扩展化; 2.Benchmark 研究与落地:跟踪国内外前沿大模型评测方法与 Benchmark,研究其评测维度与自动化机制;复现与改造高质量评测集,结合业务场景定制评测任务,确保评测的真实性与可复现性; 3.模型效果分析与策略优化:定期对不同版本模型进行系统评测与对比,输出详细分析报告,识别模型优势与薄弱点;针对记忆、写作、语音、多模态(VLM)等专项能力,设计细粒度评测指标与分析策略,支撑模型迭代方向; 4.用户数据分析与体验优化:持续监测与分析真实用户交互数据,挖掘模型表现的 badcase 与典型问题;与算法及产品团队协作,将用户侧问题转化为可量化的评测指标与优化方案;建立用户体验反馈与评测体系联动机制,推动模型效果持续提升与体验闭环优化; 5.跨团队协作与产品规划:与算法、工程、产品团队紧密配合,定义评测需求与指标体系,推动自动评测体系在实际业务与模型研发中的落地,形成评测 → 分析 → 优化的完整闭环。
1.自动评估体系建设:设计并搭建大模型自动评估体系,覆盖通用能力及专项能力(如推理、写作、语音、VLM 等);构建评测指标体系与自动化评测流程,推动评测体系标准化、模块化、可扩展化; 2.Benchmark 研究与落地:跟踪国内外前沿大模型评测方法与 Benchmark,研究其评测维度与自动化机制;复现与改造高质量评测集,结合业务场景定制评测任务,确保评测的真实性与可复现性; 3.模型效果分析与策略优化:定期对不同版本模型进行系统评测与对比,输出详细分析报告,识别模型优势与薄弱点;针对记忆、写作、语音、多模态(VLM)等专项能力,设计细粒度评测指标与分析策略,支撑模型迭代方向; 4.用户数据分析与体验优化:持续监测与分析真实用户交互数据,挖掘模型表现的 badcase 与典型问题;与算法及产品团队协作,将用户侧问题转化为可量化的评测指标与优化方案;建立用户体验反馈与评测体系联动机制,推动模型效果持续提升与体验闭环优化; 5.跨团队协作与产品规划:与算法、工程、产品团队紧密配合,定义评测需求与指标体系,推动自动评测体系在实际业务与模型研发中的落地,形成评测 → 分析 → 优化的完整闭环。