logo of mi

小米音乐生成算法工程师实习生

实习兼职地点:北京状态:招聘

任职要求


1. 在校生: 计算机、AI、电子工程、音乐科技等相关专业高年级本科生或研究生。每周至少实习3天,持续3个月以上。
2. 编程能力: 熟练Python,扎实的算法数据结构功底,熟悉至少一种深度学习框架(PyTorch优先)。
3. 深度学习理论与实践:
深入理解Transformer架构及其变体。
熟悉Diffusion Model原理,有DiT等模型实践经验者优先。
…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 参与音乐生成模型开发: 协助设计、训练和评估基于深度学习(如Transformer, Diffusion Model)的音乐生成模型。
2. 数据处理与分析: 负责音乐数据集的收集、清洗与预处理,并对生成结果进行分析和优化。
3. 原型与工具开发: 参与音乐生成相关功能模块或小型工具的原型实现和代码维护。
4. 前沿技术探索: 学习并复现音乐AI领域最新论文和技术,并尝试在项目中应用。
包括英文材料
Python+
算法+
数据结构+
深度学习+
还有更多 •••
相关职位

logo of alibaba
实习淘天集团2026

如果你,期望参与淘天集团语音多模态大模型技术研发,推动数字人AI智能对话、语音自然交互等技术在淘宝Vision和手机淘宝等亿级用户场景的产品化落地; 如果你,期望突破语音模态与语言模型的融合边界,构建新一代Speech-to-Speech多模态基座模型,持续跟踪大模型领域国际前沿技术,通过产学研合作打造行业领先的对话交互系统; 如果你,期待与顶尖算法团队并肩作战,在开放创新的技术氛围中与自驱力强、专业过硬、追求极致的技术伙伴共同开拓多模态交互新范式; 那还在等待什么,赶紧加入我们吧!

更新于 2025-05-07杭州
logo of kuaishou
实习J1010

1、负责AI音频/音乐生成大模型关键算法研发和优化,包含但不局限于T2A、V2A和AI歌曲生成等方向; 2、负责跟进行业前沿技术发展趋势,跟踪国际最新技术发展方向; 3、推动音频/音乐AIGC技术在快手各业务场景中的落地,探索音频/音乐生成技术在业务中的新玩法和业务创新。

更新于 2025-08-04北京
logo of bytedance
社招A198106

团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限。团队研究方向涵盖 LLM、语音、视觉、世界模型、基础架构、AI Infra、下一代 AI 交互等,在中国、新加坡、美国等地设有实验室和岗位。 Seed 团队在 AI 领域拥有长期愿景与决心,坚持深耕基础,期望成为世界一流的 AI 研究团队,为科技和社会发展作出贡献。目前团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、扣子、即梦等超过 50 个应用场景。 1、参与研发多模态模型等下一代人工智能核心技术; 2、关注和推进技术在业务场景中的广泛应用,包括但不限于语言、音乐、语音、音频的生成与理解等; 3、深入调研和关注音频/NLP/多模态等方向的前沿技术。

更新于 2024-05-11上海
logo of kuaishou
实习J1010

1、负责AI音频/音乐生成大模型关键算法研发和优化,包含但不局限于T2A、V2A和AI歌曲生成等方向; 2、负责跟进行业前沿技术发展趋势,跟踪国际最新技术发展方向; 3、推动音频/音乐AIGC技术在快手各业务场景中的落地,探索音频/音乐生成技术在业务中的新玩法和业务创新。

更新于 2025-05-08北京