logo of insta360

影石语音算法实习生

实习兼职地点:深圳状态:招聘

任职要求


1、计算机、自动化、应用数学、信号处理等相关专业硕士及以上学历;
2、具备扎实的数学和算法基础、信号处理基础等,在语音降噪、语音识别、语音唤醒、声纹识别等一个或多个方向上有丰富的理论基础和落地经验;
3、具备优秀的coding能力,熟悉C/C++Python开发语言,扎实的数据结构算法功底;
4、有WeNet、K2等流行框架使用/开发经验者优先,有业务落地经验者优先;
5、具有良好的沟通能力、良好的团队合作精神和高度的责任心

工作职责


1、负责语音降噪、语音唤醒、语音识别等前沿语音算法的研发;
2、负责算法模型在业务场景数据集上的优化,导出部署在端侧或云端平台;
3、跟进行业最新算法动态,复现和优化前沿算法,保持算法在工业界和学术界的领先
包括英文材料
学历+
算法+
语音识别+
C+
C+++
Python+
数据结构+
相关职位

logo of ztgame
实习实习生

1、参与多模态语音理解+生成(speech、audio、music)领域的科研,效果优秀后推动在视频、游戏业务场景下的算法研发、落地,包括但不限于数据处理、模型训练、效果调优; 2、紧跟前沿技术、参与关键技术创新、突破与积累,撰写论文。

更新于 2025-08-13
logo of baidu
实习TPG

-跟踪识别前沿相关技术 -负责大数据合成等技术研发和业务支持 -负责视频AEC技术的研发和业务支持 -负责说话人技术的研发和业务支持

更新于 2024-09-23
logo of baidu
实习TPG

-实验最新语音合成、理解方案,并对其中的模块进行解耦和分析。 -结合大模型范式,参与研发语音Encodec、Decoder、多模态对齐等模块,构建LLM based TTS和端到端Speech2Speech系统。 -参与到具体的语言合成业务落地工作 -参与语音大模型的评测及优化。

更新于 2025-04-11
logo of baidu
实习TPG

-实验最新语音合成、理解方案,并对其中的模块进行解耦和分析。 -结合大模型范式,参与研发语音Encodec、Decoder、多模态对齐等模块,构建LLM based TTS和端到端Speech2Speech系统。 -参与到具体的语言合成业务落地工作 -参与语音大模型的评测及优化。

更新于 2025-04-11