logo of mi

小米音乐生成高级算法工程师

社招全职4年以上A105118地点:北京状态:招聘

任职要求


- 计算机科学、人工智能、信号处理、音乐技术等相关专业本科及以上学历。
- 熟悉Pytorch深度学习框架,具备4年以上序列建模或多模态生成经验。
- 熟悉音乐理论(和声/调式/节奏)或具备数字音频处理(DSP)基础,能解读乐谱/MIDI。
- 主导过1个以上音乐AI项目(如旋律生成、歌声合成、风格迁移等)的完整生命周期。
加分项:
- 发表过ICLR/NeurIPS/ISMIR等顶会论文,或拥有音乐生成相关专利。
- 精通音频信号处理(STFT、CQT、声码器如HiFi-GAN、NSF)。
- 熟悉音乐制作工具(Ableton Live、Logic Pro)或DAW插件开发(VST/AU)。
- 参与过开源音乐AI项目(如Magenta、Jukebox、MusicLM)。

工作职责


1. 算法研发:
  - 设计并优化基于深度学习(如Transformer、Diffusion、GAN、VAE等)的音乐生成模型,涵盖旋律、和声、节奏、音色等多维度生成任务。
  - 探索多模态音乐生成(如文本/图像/视频驱动音乐创作、哼唱转谱等)。
  - 研究音乐符号(MIDI/乐谱)与音频(波形/频谱)的联合建模技术。
2. 工程落地:
  - 将算法部署到生产环境,优化推理效率(模型压缩、蒸馏、边缘端适配)。
  - 构建高质量音乐数据集,设计数据清洗、标注与评估流程。
3. 跨领域协作:
  - 与音乐制作人合作调试生成结果的艺术性,平衡“可控性”与“创造性”。
  - 参与产品需求定义,将技术转化为用户可感知的音乐创作工具。
包括英文材料
学历+
PyTorch+
深度学习+
NeurIPS+
相关职位

logo of mi
社招5年以上A240643

1.主导语音合成大模型关键技术:模型结构优化、预训练(ICL)、微调(SFT)、语音后训练等 2.研究音频生成新范式(语音/音效/音乐/歌唱)及跨模态大模型技术,推动技术产品化落地 3.结合强化学习、对抗学习、扩散模型等技术提升生成效果,探索语音多模态联合建模

更新于 2025-03-03
logo of honor
校招研发类

1、负责语音领域算法能力构建,包括不限于语音识别、声学模型、语言模型、热词技术、语音合成、音频鉴伪等; 2、负责语音领域算法压缩量化、推理加速、小型化部署; 3、参与智慧语音领域的技术规划,面向智慧语音的潜在应用场景,规划技术项目。

更新于 2025-08-07
logo of netease
社招3-5年网易云音乐

1、负责追踪前沿推荐算法,探索落地创新算法技术,持续提高团队的技术水平和创新能力; 2、通过多场景多目标建模、序列建模、LLM4REC、生成式推荐建模等算法模型的优化,持续提升团队技术积累; 3、与业务团队紧密合作,根据业务场景,快速迭代算法模型,解决业务上的痛点和挑战,实现卓越的用户体验。

更新于 2025-09-17
logo of netease
社招3-5年网易云音乐

1. 负责云音乐AI研发平台、AI SDK等的研发工作; 2. 负责AIGC赋能业务的工作; 3. 根据需求完成系统设计、编码、测试以及文档编写等工作; 4. 通过技术创新优化系统,不断提升服务质量和性能。

更新于 2025-09-02