logo of aligenie

智能互联智能互联-端侧语音交互算法专家-杭州

社招全职3年以上技术类-算法地点:杭州状态:招聘

任职要求


1.数学、计算机、声学及其相关专业,具备扎实的数学功底和编程能力,熟悉常用的端侧语音相关算法,有端侧唤醒、识别等项目的落地经验;
2.具有一定的计算机架构基础,熟悉常见的芯片架构,拥有ARM/X86等平台开发经验;
3.拥有数字信号处理、音频算法开发、神经网络相关开发经验者优先;
4.具备较强的学习和问题分析能力,工作积极主动,团队协作意识强。

工作职责


1.负责端侧语音算法(本地唤醒和识别等)的算法研发、工程化验证,以及性能优化;
2.负责端侧语音交互模型(双工、端侧大模型等)的算法研发、工程化验证,以及性能优化。
包括英文材料
算法+
相关职位

logo of antgroup
社招5年以上技术类-算法

1、负责端侧语音交互模型(语音+语义双工)算法研发、协同工程团队落地和性能优化。 2、负责AI产品的语音识别、语音合成算法的应用和落地,提升识别准确率语与语音合成流畅度,及根据业务场景调优音色和综合的用户体验。 3、跟踪前沿语音AI技术和大语言模型在语音领域的结合应用,跟踪业界端到端的语音大模型能力,评估适配方案并推动技术落地。 4、与产品、后端研发团队协作,推动语音AI技术的快速迭代和业务落地。

更新于 2025-09-12
logo of amap
社招3年以上技术类-算法

团队介绍: 高德语音技术部,是负责高德自研全栈语音技术的综合性团队。团队核心技术能力包括:自研TTS基座大模型、端侧模型、多语种、RTC流式语音、语音识别、模型服务与推理、大规模语音IP定制服务等。业务支撑面向高德全部核心场景,包括语音导航、AI领航员、IP语音定制、国际化、AI语音助手、智能外呼、内容生成等。 团队定位是通过前沿语音技术的研究和落地,赋能下一代AI产品创新。近期部分技术(https://arxiv.org/abs/2507.12197)和产品进展介绍(https://mp.weixin.qq.com/s/A3TWtfwlqGdkC6oNHrkFaw ) 工作职责 1、参与输出语音技术(TTS、ASR、语音表征学习、端到端模型)的长期技术路线规划,推动团队在生成式语音大模型、多模态语音交互等领域的技术突破; 2、研究TTS大模型、端到端语音模型的前沿方向,探索语音与文本、视觉的跨模态融合,探索出行场景语音Agent的创新方向; 3、技术落地与产品化:将研究成果转化为高价值产品,解决复杂场景(如低资源语言、多语种、实时性要求高的工业级应用); 4、学术与产业影响力:发表顶会论文(如ICASSP、INTERSPEECH、NeurIPS、ICML)、申请核心专利,提升公司技术话语权。

更新于 2025-09-16
logo of xpeng
社招

1、评审机器人麦克风阵列及声学硬件方案,提供软件接口与优化建议; 2、参与语音前端模块优化,例如多通道噪声抑制、回声消除和自动增益等算法的优化和设计; 3、参与开发并优化端侧语音唤醒与声源定位模块; 4、调优 ASR 声学模型与解码器参数,提升识别准确率与鲁棒性; 5、与硬件、嵌入式、测试及产品团队协作,推动语音软件方案落地。

更新于 2025-07-07
logo of hello
社招5年以上技术

1. 负责智能座舱核心算法设计与开发,包括但不限于多模态交互(语音、视觉、手势等)、场景感知、用户行为预测等方向。 2. 主导算法技术方案制定和落地。通过大小模型组合,端云协同打造ai指令等实现用户交互。 3. 跟踪行业前沿算法技术(如大模型在座舱的应用、多传感器融合等),结合业务需求进行技术预研与创新。 4. 搭建算法性能评估体系,优化算法精度、效率及实时性,保障座舱交互体验。

更新于 2025-08-28