logo of mihoyo

米哈游【日常实习】语音理解算法实习生

实习兼职程序&技术类地点:上海状态:招聘

任职要求


1、硕士及以上学历,计算机相关专业;具备良好的学习能力、逻辑思维能力、自驱力,沟通协作能力
2、较强的动手能力,熟悉Python/C++/C/Java一种或多种,熟练使用pytorch/tensorflow等深度学习框架
3、有语音…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、负责语音识别,声纹,情绪及副语言理解等相关模型的开发和调优
2、协助large-scale 的语音数据处理pipeline开发和优化
3、协助评估和分析语音理解模型的效果
4、与算法团队、数据infra团队紧密协作,共同推动语音算法和语音数据链路优化
包括英文材料
学历+
Python+
C+++
C+
Java+
PyTorch+
还有更多 •••
相关职位

logo of bytedance
实习A193103A

日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:Data AML是字节跳动公司的机器学习中台,为抖音/今日头条/西瓜视频等业务提供推荐/广告/CV/语音/NLP的训练和推理系统。为公司内业务部门提供强大的机器学习算力,并在这些业务的问题上研究一些具有通用性和创新性的算法。同时,也通过火山引擎将一些机器学习/推荐系统的核心能力提供给外部企业客户。此外,AML还在AI for Science,科学计算等领域做一些前沿研究。 1、从事多模态和推荐广告结合研究,提升短视频/图文的理解能力; 2、参与抖音、今日头条等多个应用内的多模态内容理解的算法迭代与持续优化; 3、深入调研多模态前沿技术,与工程团队密切配合,探索在大算力场景下实现新算法的效果突破。

更新于 2023-12-14北京
logo of dingtalk
实习钉钉日常项目实习

1. 参与音频信号信号增强,声纹识别&分离,情感识别,ASR,TTS,声音内容理解等等方向的研究。 2. 深入调研和研究音频/多模态/全模态等方向的前沿技术,持续探索语音技术的新能力和新应用。

更新于 2026-01-19杭州
logo of quark
实习日常实习生

1、参与音频生成、音频理解和端到端语音交互大模型算法的基础研究和应用落地,支持千问APP、夸克APP和AI智能硬件等; 2、深入调研和研究音频/NLP/多模态/全模态等方向的前沿技术,持续探索语音技术的新能力和新应用。

更新于 2025-12-25北京|杭州|上海
logo of bytedance
实习A217191

日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:Data语音团队致力于语音/音频/音乐相关的AI核心技术研发和产品创新。部门支撑音频和多模态内容从生产、编辑到消费的全流程,赋能内容创作和互动,并以中台形式支持集团多个业务,提供业界前沿的技术能力与解决方案。 1、参与研发多模态模型等下一代人工智能核心技术; 2、关注和推进技术在业务场景中的广泛应用,包括但不限于语言、音乐、语音、音频的生成与理解等; 3、深入调研和关注音频/NLP/多模态等方向的前沿技术。

更新于 2023-07-06深圳