logo of dji

大疆机器学习算法工程师(语音识别-深圳)

校招全职算法地点:深圳状态:招聘

任职要求


1. 本科及以上学历,电子信息、声学、计算机、自动化、信号处理、机器学习等专业;
2. 至少熟悉音频信号处理、语音识别、语音合成其中之一;
3. 熟悉PythonCC++等编程语言,熟悉音频的软硬件体系者优先;
4. 有做过asr/唤醒/降噪项目实践或实习经历的优先;
5. 对多语种语音特性有认知,有小语种语音识别经验更佳;
6. 在Interspeech,ICASSP等主流语音学术会议与期刊上发表论文者优先;
7. 对算法落地产品有强烈的热情,善于用技术解决产品问题。

工作职责


1. 参与语音识别算法研发,涉及数据处理分析、论文复现、模型优化验证等工作;
2. ​开展多语种语音识别模型研发,解决小语种技术难题;
3. 负责语音识别前沿问题的探索,结合人机语音交互的实际需求,提供专业的技术解决方案。
包括英文材料
学历+
机器学习+
语音识别+
Python+
C+
C+++
算法+
相关职位

logo of dji
校招算法

1. 负责音频信号处理算法的研究与产品开发调试工作,涉及录音效果/播放效果/性能优化等; 2. 负责音频深度学习算法的研究与产品开发调试工作,涉及数据处理/论文复现/模型优化/工程部署等; 3. 跟踪国内外音频技术信号处理和深度学习技术的发展,保持技术先进性; 4. 负责音频算法相关技术文档的编写和整理。

更新于 2025-07-02
logo of bytedance
校招A210902A

团队介绍:Data-抖音团队,负责抖音APP的推荐算法、内容算法、对话算法及大数据工作,对接各场景业务(短视频,直播,图文,电商,社交,生态,投稿,消息,同城,生活服务,音乐,评论,内容理解&安全、智能对话等)。我们的工作涉及大规模推荐算法的优化、复杂约束的优化问题的解决、内容理解、LLM应用以及新业务方向探索、CV/NLP等多个学术领域的算法改进工作、对多种场景的推荐架构的设计和实现和对产品数据的复杂深入的分析工作。在这里,你可以深入钻研机器学习算法的改进和优化,探索工业界领先的推荐系统架构和推荐大模型算法、可以通过使用最新的大模型等技术支持抖音的数字人、智能客服、AI工具等创新探索;可以通过对产品的深度理解和思考,将算法应用到业务中去;也可以通过对产品和内容生态的深度分析,影响产品未来的发展方向。 1、承担抖音内多元语音交互场景中的语音模型需求,涵盖抖音AI分身音视频对话、客服热线、VOIP场景下的相关音频算法研发工作;包括对语音识别、合成、对话理解等模型展开针对性训练与优化,全力提升对话效果及语音合成稳定性和表现力; 2、深入探索端到端语音大模型的落地与优化举措,致力于降低语音交互延时,显著提升语音对话品质;同时,专注于语音合成/音频AI生成相关算法模型的研发与精进,跟进语音领域前沿技术研究,负责音频表征模型、Seq2Seq底膜的研发优化; 3、紧密跟踪研发业界先进的音频技术进展,积极探索语音/音频领域最新技术,并推动其成功落地于抖音产品之中。

更新于 2025-07-25
logo of vivo
校招

vivo AI研究院致力于研发业界领先的人工智能技术,通过AI技术创新持续为全球5亿+vivo用户带来无处不在的惊喜和激动人心的智慧体验。 1、核心算法设计与优化:参与语音增强算法的全流程设计与开发,深度钻研回声消除、降噪、声源分离、定向拾音等核心技术,持续优化算法性能,提升语音信号质量与清晰度,推动算法在复杂环境下的适应性与稳定性达到行业领先水平; 2、前沿技术追踪与创新:紧跟国际语音增强领域前沿算法进展,深入研究算法演进路线,针对实际应用中的痛点与难点问题,提出创新性改进方案,将前沿技术成果转化为实际生产力,保持公司在语音增强技术上的竞争力与创新性; 3、跨领域协同优化:密切关注语音识别算法的最新动态,深入分析语音识别与语音增强的技术关联性,通过算法融合与创新设计,构建能够显著提升语音识别精度的增强算法体系,为语音交互系统的高效运行提供坚实技术支撑; 4、科研成果产出:积极开展学术研究与技术创新,主导或参与语音增强领域的专利申报与学术论文撰写工作,在高水平学术期刊与会议上发表具有影响力的研究成果,提升公司在行业内的学术地位与技术话语权; 5、AIGC 融合探索:深度关注 AIGC 大模型领域的最新突破与发展趋势,探索语音增强算法在人机对话场景下的创新应用,开展算法适配与优化设计工作,推动语音增强技术在不同产品场景中的落地与升级,拓展技术应用边界。

更新于 2025-07-02
logo of tencent
社招CSIG技术

1.优化大规模商用语音识别系统,提高系统的鲁棒性和性能; 2.负责声学前端、声学模型、语言模型、后处理、解码器等主要模块的迭代和改进; 3.追踪业界前沿的语音技术,探索语音大模型在业务场景下的应用。

更新于 2025-04-24