logo of kuaishou

快手音频音乐算法实习生

实习兼职D2861地点:北京状态:招聘

任职要求


1、硕士及以上学历机器学习模式识别、信号处理等计算机相关专业;
2、了解NLP、diffusion、信号处理一项或者多项;
3、相关顶会或期刊上发表论文者优先(ICASSP,Interspeech,ACL,ICMLNIPS等);
4、有多模态、音频、TTS大模型技术研发经验者优先;
5、保证实习4个月以上,每周出勤4-5天。

工作职责


1、探索语音、音频和音乐相关算法的研究与开发;
2、探索、跟进行业前沿技术发展趋势,跟踪国际最新技术发展方向;
3、探索语音/音频/音乐技术落地新玩法,在音频AI理解和生成等方向进行业务创新。
包括英文材料
学历+
机器学习+
模式识别+
NLP+
ICML+
大模型+
NeurIPS+
相关职位

logo of xiaohongshu
实习AIGC算法

工作职责 1. 负责音乐音频相关业务的数据处理、音频指纹流程优化工作; 2. 参与音乐相关大模型的研发,如音乐生成、音乐预训练、音乐多模态模型等; 3. 参与相关算法和系统的持续迭代和进化; 同时能够根据小红书发布业务场景,结合实际需求进行技术落地和创新;

更新于 2025-08-28
logo of bytedance
实习A153899A

ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:Data语音团队致力于语音/音频/音乐相关的AI核心技术研发和产品创新。部门支撑音频和多模态内容从生产、编辑到消费的全流程,赋能内容创作和互动,并以中台形式支持集团多个业务,提供业界前沿的技术能力与解决方案。 1、支持端到端语音交互技术在业务场景落地,探索语音端到端的业务应用前沿问题; 2、支持语音识别技术在字节跳动公司内外丰富的业务场景落地,解决落地过程中的前沿问题,持续优化语音识别核心技术效果; 3、搭建音频理解核心技术体系,专注音频理解的前沿技术和算法效果,追求和探索业界最前沿算法。

更新于 2025-02-13
logo of bytedance
实习A132940A

ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:Data语音团队致力于语音/音频/音乐相关的AI核心技术研发和产品创新。部门支撑音频和多模态内容从生产、编辑到消费的全流程,赋能内容创作和互动,并以中台形式支持集团多个业务,提供业界前沿的技术能力与解决方案。 1、参与研发多模态模型等下一代人工智能核心技术; 2、关注和推进技术在业务场景中的广泛应用,包括但不限于语言、音乐、语音、音频的生成与理解等; 3、深入调研和关注音频/NLP/多模态等方向的前沿技术。

更新于 2025-02-13
logo of bytedance
实习A217191

日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。 团队介绍:Data语音团队致力于语音/音频/音乐相关的AI核心技术研发和产品创新。部门支撑音频和多模态内容从生产、编辑到消费的全流程,赋能内容创作和互动,并以中台形式支持集团多个业务,提供业界前沿的技术能力与解决方案。 1、参与研发多模态模型等下一代人工智能核心技术; 2、关注和推进技术在业务场景中的广泛应用,包括但不限于语言、音乐、语音、音频的生成与理解等; 3、深入调研和关注音频/NLP/多模态等方向的前沿技术。

更新于 2023-07-06