
喜马拉雅全景声内容运营实习生

1、辅助全景声精品内容合作宣发策划、方案落地,深度参与品牌IP内容联动; 2、负责喜马拉雅车载端、手机端全景声内容的日常运营和数据分析,在持续钻研和验证中懂得用户; 3、与声音AI创作团队协作,跟进制作的落地上线,配置包装内容,提供选品建议,一起孵化精品全景声内容。

【职位描述】 视个人能力,承接部分喜马拉雅站内,中长尾、或精品头部专辑的全景声音频制作。 【基本要求】 1. 大学本科(含)及以上学历,声音设计、音乐制作、录音混音等相关艺术专业。了解常用的音频插件和概念,如:均衡EQ、压限Comp/Limiter、混响Reverb等 2. 沟通表达能力强,有较强的业务理解能力,有较强的学习能力和兴趣。 3. 每周实习到岗 4 天(含,最好全勤)及以上,实习期 3个月及以上。 4. 简历请附上全景声音频作品ADM文件网盘链接(影视,广播剧均可,音乐也可) 【加分项】 1. 大三 \ 研二 \ 已上岸同学优先(相对稳定),可长期稳定实习优先 2. 熟悉广播剧制作流程和制作标准者优先 3. 对使用Logic Pro制作全景声内容有经验者优先 5. 熟悉 AI 相关领域知识,熟悉基本linux命令行,具备编程能力优先。
近期,随着OpenAI发布第一个文生视频大模型Sora,其能够生成包含复杂场景、生动角色表情及复杂镜头运动的长视频,进一步引起了业界的广泛关注。目前,现有的视频转音频技术[9-11] 通常采用联合训练方式,利用预训练的跨模态基础模型[12-13] 或扩散模型来解决这一问题。然而,这些方法未能全面挖掘音视频多模态信息之间的精确对应关系(比如: 时间、节奏、远近、材质、内容、方向、速度、等等),仅能得到宽泛的音视频对应关系, 离实际应用(比如真正的短视频以及电影配音)尚有很大差距。并且后续精确的配音可以向全景声以及立体环绕声方向发展,和VR以及 AR 以及娱乐产业结合。 本研究题目拟解决基于内容理解的视频到音频的精确生成问题。