小米音乐生成高级算法工程师
社招全职4年以上A105118地点:北京状态:招聘
任职要求
- 计算机科学、人工智能、信号处理、音乐技术等相关专业本科及以上学历。 - 熟悉Pytorch等深度学习框架,具备4年以上序列建模或多模态生成经验。 - 熟悉音乐理论(和声/调式/节奏)或具备数字音频处理(DSP)基础,能解读乐谱/MIDI。 - 主导过1个以上音乐AI项目(如旋律生成、歌声合成、风格迁移等)的完整生命周期。 加分项: - 发表过ICLR/NeurIPS/ISMIR等顶会论文,或拥有音乐生成相关专利。 - 精通音频信号处理(STFT、CQT、声码器如HiFi-GAN、NSF)。 - 熟悉音乐制作工具(Ableton Live、Logic Pro)或DAW插件开发(VST/AU)。 - 参与过开源音乐AI项目(如Magenta、Jukebox、MusicLM)。
工作职责
1. 算法研发: - 设计并优化基于深度学习(如Transformer、Diffusion、GAN、VAE等)的音乐生成模型,涵盖旋律、和声、节奏、音色等多维度生成任务。 - 探索多模态音乐生成(如文本/图像/视频驱动音乐创作、哼唱转谱等)。 - 研究音乐符号(MIDI/乐谱)与音频(波形/频谱)的联合建模技术。 2. 工程落地: - 将算法部署到生产环境,优化推理效率(模型压缩、蒸馏、边缘端适配)。 - 构建高质量音乐数据集,设计数据清洗、标注与评估流程。 3. 跨领域协作: - 与音乐制作人合作调试生成结果的艺术性,平衡“可控性”与“创造性”。 - 参与产品需求定义,将技术转化为用户可感知的音乐创作工具。
包括英文材料
学历+
PyTorch+
https://datawhalechina.github.io/thorough-pytorch/
PyTorch是利用深度学习进行数据科学研究的重要工具,在灵活性、可读性和性能上都具备相当的优势,近年来已成为学术界实现深度学习算法最常用的框架。
https://www.youtube.com/watch?v=V_xro1bcAuA
Learn PyTorch for deep learning in this comprehensive course for beginners. PyTorch is a machine learning framework written in Python.
深度学习+
https://d2l.ai/
Interactive deep learning book with code, math, and discussions.
ICLR+
https://iclr.cc/
NeurIPS+
https://neurips.cc/
相关职位
社招5年以上A240643
1.主导语音合成大模型关键技术:模型结构优化、预训练(ICL)、微调(SFT)、语音后训练等 2.研究音频生成新范式(语音/音效/音乐/歌唱)及跨模态大模型技术,推动技术产品化落地 3.结合强化学习、对抗学习、扩散模型等技术提升生成效果,探索语音多模态联合建模
更新于 2025-03-03
校招研发类
1、负责语音领域算法能力构建,包括不限于语音识别、声学模型、语言模型、热词技术、语音合成、音频鉴伪等; 2、负责语音领域算法压缩量化、推理加速、小型化部署; 3、参与智慧语音领域的技术规划,面向智慧语音的潜在应用场景,规划技术项目。
更新于 2025-08-07
社招3-5年网易云音乐
1、负责追踪前沿推荐算法,探索落地创新算法技术,持续提高团队的技术水平和创新能力; 2、通过多场景多目标建模、序列建模、LLM4REC、生成式推荐建模等算法模型的优化,持续提升团队技术积累; 3、与业务团队紧密合作,根据业务场景,快速迭代算法模型,解决业务上的痛点和挑战,实现卓越的用户体验。
更新于 2025-09-17