logo of kuaishou

快手AIGC音乐多模态算法实习生

实习兼职D2861地点:北京状态:招聘

任职要求


1、有强烈的自驱力与独立解决问题的能力;
2、有计算机、人工智能、音乐工程等相关专业硕士及以上学历;
3、具备良好的编程能力,熟练使用 Python,熟悉 PyTorch 等主流深度学习框架和Linux 开发环境;
4、具备良好的英文文献阅读和撰写能力,能够主动学习和跟进前沿技术动态;
5、熟悉深度学习、信号处理等相关理论知识,具备音频处理、音乐生成、语音合成等相关项目/研究经验者优先;熟悉音频 Codec(如 VQ、RVQ、Encodec、DAC 等)、LLM(如 LLaMA、Qwen 等开源模型)、Diffusion/Flow Matching(如 Sta…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1、研发行业领先且实用的音乐多模态算法,包括但不限于文生音乐、视频音乐生成、音乐编辑、基于歌词/发音人 prompt/哼唱等条件的歌曲生成、交互式音乐内容创作、音乐信息检索等方向;
2、跟进并调研国内外前沿的音乐多模态生成与编辑技术,协助团队完成相关算法的设计、实现与优化;
3、协助完成数据处理、模型训练、效果评估等实验工作,并产出高质量的技术报告或顶会文章;
4、积极参与团队讨论,配合工程同事推动算法落地;
5、参与开源项目、技术论文撰写、专利申请等工作,持续打造业界的技术口碑及影响力。
包括英文材料
学历+
Python+
PyTorch+
深度学习+
Linux+
大模型+
Llama+
算法+
还有更多 •••
相关职位

logo of bytedance
实习A239481

团队介绍:负责影像业务剪映、醒图等创作工具的增长、内容分发和商业化的算法,以及数据科学相关工作,致力于激发用户创作灵感、优化创作效率和提高所创作内容的价值,并完成增长与商业化变现。 课题介绍:剪映CapCut创作工具需要更自动化的扩大模版与素材的供给,降低创作过程的难度,本课题旨在通过AIGC根据当前热点,推荐,搜索等分发线索自动生成模版、素材、音乐,大规模补充模版与素材供给,为用户提供更多创作灵感,以及根据用户上传素材,AIGC辅助自动成片。 1、基于多模态大模型(LLM/视觉/音频)技术,研发自动化内容生成系统,通过分析热点、搜索趋势及用户行为数据,构建动态生成模型,实现视频模板、风格化素材、场景适配音乐的规模化生产,提升创作工具的内容供给多样性; 2、研究用户意图深度理解模型,通过用户上传的原始素材(图片、视频片段、文字描述)分析创作目标,构建端到端的自动成片Pipeline,实现镜头分割、转场特效生成、字幕匹配、音乐适配的全流程AI化; 3、设计跨模态对齐算法,解决图文/视频/音乐的多维度语义匹配问题。

更新于 2025-03-06北京
logo of bytedance
实习A66776

ByteIntern:面向2027届毕业生(2026年9月-2027年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:抖音研发部门负责多款大型产品的研发,包括但不限于抖音、西瓜视频、汽水音乐。加入我们,你将有机会参与亿级用户场景的开发与架构工作,使用前沿的技术助力业务一起不断成长。 1、参与构建新一代多模态大模型评测体系,覆盖3D生成、动态3D(4D)、数字人、世界模型等AIGC方向,驱动模型效果持续优化与业务规模增长; 2、基于计算机视觉(CV)、音频理解、多模态大模型(MLLM)、多模态Agent、强化学习(RLVR)等技术,构建Score Model、Reward Model等自动化评测能力,将人类感知与偏好有效建模,并融入评测闭环,提升生成模型评估与优化效率; 3、参与构建行业领先的多模态评测体系,融合元评估等方法,持续迭代评测标准与数据集构建范式,提升评测结果的可靠性、细粒度与可解释性,系统刻画模型能力边界; 4、作为算法角色,与工程和质量团队协作,将评测能力落地到实际业务场景,支撑模型训练、调优与上线决策。

更新于 2026-04-28北京
logo of netease
实习网易云音乐

我们是网易云音乐算法团队,专注于行业领先的搜索或者推荐算法,我们致力于通过技术赋能云音乐各项业务,通过社区广场推荐,提升用户体验,产生商业化价值。 在这里你可以: 1、参与云音乐各场景相关的AIGC算法应用,使用NLP、多模态、LLM等技术,优化包括多模态内容理解、大模型交互式对话、大模型AI创作生成等业务应用的效果提升; 2、参与云音乐创新业务相关的算法优化,使用业界领先的深度学习、强化学习、图模型等,优化推荐、直播、声音、社交等业务的算法; 3、参与前沿的基础算法模型建设,包括继续预训练、视频生成微调,音乐生成训练等垂类基座模型的构建和应; 4、接触到亿级别海量、真实的用户数据,使用深度学习、强化学习、图模型等算法,发挥推荐的价值; 5、使用行业领先的大规模分布式机器学习平台,例如tensorflow等开源的工具,实现并不断优化推荐、搜索等算法。

更新于 2025-06-30杭州
logo of bytedance
实习A133288

ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:Data-抖音团队,负责抖音APP的推荐算法、内容算法、对话算法及大数据工作,对接各场景业务(短视频,直播,图文,电商,社交,生态,投稿,消息,同城,生活服务,音乐,评论,内容理解&安全、智能对话等)。我们的工作涉及大规模推荐算法的优化、复杂约束的优化问题的解决、内容理解、LLM应用以及新业务方向探索、CV/NLP等多个学术领域的算法改进工作、对多种场景的推荐架构的设计和实现和对产品数据的复杂深入的分析工作。在这里,你可以深入钻研机器学习算法的改进和优化,探索工业界最领先的推荐系统架构和推荐大模型算法、可以通过使用最新的大模型等技术支持抖音的数字人、智能客服、AI工具等创新探索;可以通过对产品的深度理解和思考,将算法应用到业务中去;也可以通过对产品和内容生态的深度分析,影响产品未来的发展方向。 1、负责抖音业务推荐算法工作,和产品、运营等团队紧密合作,深度理解抖音社交业务的发展,共同制定长短期的业务目标; 2、深入参与到核心机器学习技术研究中,在解决具体问题的同时形成完整系统的方法论,持续提升用户体验; 3、研究方向包含且不局限于:深度学习、图神经网络、多任务学习、模型压缩和加速、多模态技术等,善于结合业务的实际问题来做好技术的探索和研究; 4、组织推进组内以及跨部门合作项目,加速团队的建设和业务的发展。

更新于 2025-03-24深圳