logo of aligenie

智能互联智能互联-端侧语音交互算法专家-杭州

社招全职5年以上技术类-算法地点:杭州状态:招聘

任职要求


1.数学、计算机、声学及其相关专业,具备扎实的数学功底和编程能力,熟悉常用的端侧语音相关算法,有端侧唤醒、识别等项目的落地经验;
2.具有一定的计算机架构基础,熟悉常见…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1.负责端侧语音算法(本地唤醒和识别等)的算法研发、工程化验证,以及性能优化;
2.负责端侧语音交互模型(双工、端侧大模型等)的算法研发、工程化验证,以及性能优化。
包括英文材料
算法+
大模型+
相关职位

logo of aligenie
社招3年以上技术类-算法

1.负责端侧语音算法(本地唤醒和识别等)的算法研发、工程化验证,以及性能优化; 2.负责端侧语音交互模型(双工、端侧大模型等)的算法研发、工程化验证,以及性能优化。

更新于 2025-08-22杭州
logo of antgroup
社招5年以上技术类-算法

1、负责端侧语音交互模型(语音+语义双工)算法研发、协同工程团队落地和性能优化。 2、负责AI产品的语音识别、语音合成算法的应用和落地,提升识别准确率语与语音合成流畅度,及根据业务场景调优音色和综合的用户体验。 3、跟踪前沿语音AI技术和大语言模型在语音领域的结合应用,跟踪业界端到端的语音大模型能力,评估适配方案并推动技术落地。 4、与产品、后端研发团队协作,推动语音AI技术的快速迭代和业务落地。

更新于 2025-09-12杭州
logo of tongyi
社招5年以上技术类-算法

1. 负责面向AI手机、智能座舱等ToB场景的多模态交互模型研发,包括语音基础模型、视觉-语言模型(VLM)、全模态大模型的后训练(CPT/SFT/RL)与推理优化。 2. 研发基于神经网络、扩散模型或大模型的端侧音频信号处理算法(如语音增强、降噪、去混响),提升复杂声学环境下的语音交互质量。 3. 构建支持自然打断、精准判停、上下文感知的实时双工交互模型,实现低延迟、高鲁棒性的流式对话体验。 4. 针对端侧资源约束,开展模型压缩、量化、蒸馏及高效部署,确保算法在DSP/NPU等嵌入式平台稳定运行。 5. 与系统、产品团队紧密协作,推动算法从原型验证到大规模商用落地。

更新于 2025-11-22北京|上海
logo of tongyi
社招5年以上技术类-开发

1. 主导面向ToB场景的Android端多模态交互系统架构设计与核心模块开发,包括语音采集/播放、摄像头控制、传感器融合、UI响应、状态管理等。 2. 与AI算法团队紧密协作,高效集成语音识别(ASR)、语音合成(TTS)、视觉理解(CV)、大语言模型(LLM)等端侧推理模块,优化模型加载、推理调度与资源协同策略。 3. 设计并实现低延迟、高并发的双工对话通道,支持实时打断、动态判停、上下文感知等高级交互能力在端侧的稳定运行。 4. 构建可扩展、可配置的SDK或中间件,支持多行业客户(如车企、手机厂商、IoT设备商)的快速接入与定制化需求。 5. 参与端云协同架构设计,在保障本地交互流畅性的同时,确保数据传输、存储与处理符合GDPR、CCPA、中国《个人信息保护法》等国内外隐私合规要求。 6. 深度集成系统级安全能力,包括应用权限管控、敏感操作审计、安全启动验证、密钥管理及安全OTA升级机制,提升端侧整体安全水位。

更新于 2025-11-23北京|杭州