logo of tcl

TCLAI语音算法工程师

社招全职研发技术类地点:深圳状态:招聘

任职要求


1.计算机、信号处理、通信、数学、自动化等相关领域本科及以上学历;
2.熟悉语言信号处理者优先,特征提取和预处理,语音增强;
3.熟悉主流语音识别框架,端到…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1.负责语音前端算法开发和优化;
2.负责语音识别算法训练;
3.支持语音识别场景的产品化;
包括英文材料
学历+
语音识别+
还有更多 •••
相关职位

logo of baidu
社招ACG

-负责语音信号处理算法的研究、设计、开发和优化,包括但不限于特征提取、降噪、回声消除等 -参与语音识别算法的研发,提高识别准确率和识别速度 -负责语音合成算法的开发,优化语音生成的音质和流畅度 -跟踪语音技术领域的最新动态,研究新技术和新算法,为公司技术储备提供支持 -与其他技术栈紧密合作,确保语音算法在公司产品中的有效应用 -编写相关技术文档,包括算法设计文档、测试报告、使用说明等

更新于 2025-04-21上海
logo of baidu
社招ACG

-负责语音信号处理算法的研究、设计、开发和优化,包括但不限于特征提取、降噪、回声消除等 -参与语音识别算法的研发,提高识别准确率和识别速度 -负责语音合成算法的开发,优化语音生成的音质和流畅度 -跟踪语音技术领域的最新动态,研究新技术和新算法,为公司技术储备提供支持 -与其他技术栈紧密合作,确保语音算法在公司产品中的有效应用 -编写相关技术文档,包括算法设计文档、测试报告、使用说明等

更新于 2025-04-17上海
logo of amap
社招3年以上技术类-算法

团队介绍: 高德语音技术部,是负责高德全栈语音技术的综合性团队。团队核心技术能力包括:自研TTS基座大模型、端侧模型、多语种、RTC流式语音、语音内容生成、语音识别、跨模态模型、模型服务与推理。业务支撑面向高德全部核心场景,包括语音导航、AI领航员、IP语音定制、国际化、AI语音助手、智能外呼、内容生成等。 团队定位是通过前沿语音技术的研究和落地,赋能下一代AI产品创新。近期部分技术(https://arxiv.org/abs/2507.12197)和产品进展介绍(https://mp.weixin.qq.com/s/cCeHbNW0jbC_LNVPZlGeHg) 具体职责包括但不限于: 1、语音识别、唤醒、语音与大模型融合等语音模块的研发,独立研究并完成业务落地; 2、结合高德出行导航、语音交互等业务场景,不断完善提升复杂业务场景下的语音理解能力。 3、与产品、工程架构团队一起完成技术方案的部署上线与性能优化,实现价值闭环。 4、持续追踪跟进业界前沿先进语音技术,结合业务需求开展技术创新与预研。

更新于 2025-09-09北京
logo of aligenie
社招1年以上技术类-算法

团队介绍: 高德语音技术部,是负责高德全栈语音技术的综合性团队。团队核心技术能力包括:自研TTS基座大模型、端侧模型、多语种、RTC流式语音、语音内容生成、语音识别、多模态模型、模型服务与推理。业务支撑面向高德全部核心场景,包括语音导航、AI领航员、IP语音定制、国际化、AI语音助手、智能外呼、内容生成等。 团队定位是通过前沿语音技术的研究和落地,赋能下一代AI产品创新。 具体职责: 围绕voice agent/speech language model的研究工作,包括但不限于如下事项: 1. 为满足AGI时代"活人感"语音交互的需求,致力于完成包括但不限于以下目标:复杂声学+时空信息的声学理解、通过图灵测试水平的交互节奏 / 交流内容 / 语音输出,并完成所需的技术创新; 2. 多模态对话大模型的研发、语音对话pipeline方案以及端到端方案的交互能力搭建、全双工交互能力搭建,落地到高德多项agent应用场景; 3. 跟进最领先的语音理解/语音生成/语音交互技术,包括但不限于提出新的技术框架、改进现有的算法、持续提升相关技术及业务指标,鼓励撰写论文及申请专利; 4. 探索前沿方向,如更加高效且合理的模型架构、跨模态(文字/语音/视觉)混合训练的最佳实践、基于speech language model的后训练技术、COT Reasoning in streaming full-duplex、proactive interaction,等等。结合全链路各个agent,持续提升voice agent的交互体验; 5. 海量的语音数据的处理构建:定性分析、定量评估、参与设计自动评估框架,研发 scalable 的改进方案,持续提升数据质量。

更新于 2026-03-31北京