logo of xiaohongshu

小红书AI音乐大模型算法实习生

实习兼职大模型地点:北京 | 上海状态:招聘

任职要求


任职资格&岗位要求:
1) 硕士及以上在校生,计算机科学、AI相关专业
2) 有扎实的深度学习基础、算法实现能力和模型调优经验
3) 有音频大模型开发/研究经验,对常见的音频编解码器、语言模型框架有深刻的认知,对音频大模型领域有广泛的了解,能追踪前沿技术;有AI音乐相关经验者优先
4) 熟悉Linux操作系…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


职位描述:
1) 探究、复现AI音乐生成方向的前沿技术
2) 训练AI音乐大模型的相关模块(如音频编解码器、LLM等)、模型调优
3)需要线下实习,base北京或者上海均可
包括英文材料
深度学习+
算法+
大模型+
还有更多 •••
相关职位

logo of xiaohongshu
实习AIGC算法

工作职责 1. 负责音乐音频相关业务的数据处理、音频指纹流程优化工作; 2. 参与音乐相关大模型的研发,如音乐生成、音乐预训练、音乐多模态模型等; 3. 参与相关算法和系统的持续迭代和进化; 同时能够根据小红书发布业务场景,结合实际需求进行技术落地和创新;

更新于 2025-08-28北京|上海
logo of xiaohongshu
实习多媒体算法

1. 在业务场景下围绕音乐理解及生成技术,支持小红书音乐推荐/音乐生产/版权监测等多项业务,结合实际需求进行技术落地和创新; 2. 参与音乐相关大模型研发,包括音乐理解/音乐生成/音乐预训练/音乐多模态等。

更新于 2025-12-01上海|北京
logo of bytedance
实习A239481

团队介绍:负责影像业务剪映、醒图等创作工具的增长、内容分发和商业化的算法,以及数据科学相关工作,致力于激发用户创作灵感、优化创作效率和提高所创作内容的价值,并完成增长与商业化变现。 课题介绍:剪映CapCut创作工具需要更自动化的扩大模版与素材的供给,降低创作过程的难度,本课题旨在通过AIGC根据当前热点,推荐,搜索等分发线索自动生成模版、素材、音乐,大规模补充模版与素材供给,为用户提供更多创作灵感,以及根据用户上传素材,AIGC辅助自动成片。 1、基于多模态大模型(LLM/视觉/音频)技术,研发自动化内容生成系统,通过分析热点、搜索趋势及用户行为数据,构建动态生成模型,实现视频模板、风格化素材、场景适配音乐的规模化生产,提升创作工具的内容供给多样性; 2、研究用户意图深度理解模型,通过用户上传的原始素材(图片、视频片段、文字描述)分析创作目标,构建端到端的自动成片Pipeline,实现镜头分割、转场特效生成、字幕匹配、音乐适配的全流程AI化; 3、设计跨模态对齐算法,解决图文/视频/音乐的多维度语义匹配问题。

更新于 2025-03-06北京
logo of bytedance
实习A194753

团队介绍:Data-抖音团队,负责抖音APP的推荐算法、内容算法、对话算法及大数据工作,对接各场景业务(短视频,直播,图文,电商,社交,生态,投稿,消息,同城,生活服务,音乐,评论,内容理解&安全、智能对话等)。我们的工作涉及大规模推荐算法的优化、复杂约束的优化问题的解决、内容理解、LLM应用以及新业务方向探索、CV/NLP等多个学术领域的算法改进工作、对多种场景的推荐架构的设计和实现和对产品数据的复杂深入的分析工作。在这里,你可以深入钻研机器学习算法的改进和优化,探索工业界最领先的推荐系统架构和推荐大模型算法、可以通过使用最新的大模型等技术支持抖音的数字人、智能客服、AI工具等创新探索;可以通过对产品的深度理解和思考,将算法应用到业务中去;也可以通过对产品和内容生态的深度分析,影响产品未来的发展方向。 课题介绍: 自然语言领域LLM的出现,效果在众多垂直任务上都好于sota模型,从推荐领域看过去工业级推荐系统在较长的时间没有大幅的变化过。本项目旨在探索推荐领域下的大模型方案,改变现在持续了较长时间的推荐模型结构和Infra的基本范式,且效果大幅好于现在的模型,在抖音短视频/直播等多个业务场景上得到应用。但是怎么做好推荐领域的大模型也是一个比较有挑战的事情,推荐对工程效率的要求更高,且用户的推荐体验上是个性化的,以及如何短视频、直播等体裁上做号内容的表征也是需要被解决的问题,这里会从模型参数scaling up、内容和用户的表征学习、内容理解多模态、超长序列建模、生成式推荐模型等多个方向来做深入的研究,对推荐场景的模型做系统性的升级。 研究方向: 跨模态的对齐和统一表征学习(推荐、内容多模态、自然语言); 推荐模型参数和算力scaling up; 超长序列建模; 生成式推荐模型。

更新于 2025-03-05上海