字节跳动智能视频云国际产品实习生-音视频技术
任职要求
1、2027届本科及以上学历在读,计算机科学、数字媒体技术、人工智能、软件工程、产品设计等相关专业优先; 2、有互联网及音视频产品、运营实习经验优先,对音视频、大语言模型、计算机视觉等前沿技术及其应用有强烈兴趣和一定的认知; 3、具备良好…
工作职责
ByteIntern:面向2027届毕业生(2026年9月-2027年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:视频与边缘部门承载了字节跳动的媒体内容分发基建及技术中台,支持了字节全系产品,如抖音、今日头条、番茄小说、西瓜视频等APP的点播、直播、实时通信、图片等多媒体业务发展,同时将业务发展过程中沉淀下来的技术能力和工具,通过火山引擎对外输出,面向各行各业用户提供视频云产品和服务,愿景是为内外部业务伙伴提供最低成本、最优画质、最低延时、最安全可靠的富媒体内容分发解决方案,助力业务伙伴降本提效实现持续增长。 1、负责音视频相关的产品功能及体验的设计和优化; 2、参与市场趋势、用户需求、音视频及AI技术发展的调研工作,收集和整理相关信息,挖掘产品优化点,为产品决策规划提供支持; 3、完成需求分析、产品设计工作,确保功能与体验符合市场需求,并具有竞争力的领先性; 4、协助制定项目计划,跟踪项目进度,参与跨部门沟通协调工作,协助推进项目高效迭代。
ByteIntern:面向2027届毕业生(2026年9月-2027年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:视频与边缘部门承载了字节跳动的媒体内容分发基建及技术中台,支持了字节全系产品,如抖音、今日头条、番茄小说、西瓜视频等APP的点播、直播、实时通信、图片等多媒体业务发展,同时将业务发展过程中沉淀下来的技术能力和工具,通过火山引擎对外输出,面向各行各业用户提供视频云产品和服务,愿景是为内外部业务伙伴提供最低成本、最优画质、最低延时、最安全可靠的富媒体内容分发解决方案,助力业务伙伴降本提效实现持续增长。 1、经营管理与专项驱动:参与业务商业目标的拆解与过程管理;通过专项机制识别并解决经营风险,确保业务指标按期达成; 2、数据基建与分析:迭代业务经营分析体系,完善数据基建;通过数据洞察业务健康度,为资源规划与关键经营决策提供支撑; 3、商业化流程支持:优化To B商业化落地全流程,协助制定重点产品的Go-To-Market策略,协同销售与产品研发团队提升流转效率; 4、运营驱动增长:利用数字化手段对从线索到转化的全链路进行精细化管理,提升转化效率,协助挖掘新的业务增长空间。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:火山引擎是字节跳动旗下的云服务平台,将字节跳动快速发展过程中积累的增长方法、技术能力和工具开放给外部企业,提供云基础、视频与内容分发、大数据、人工智能、开发与运维等服务,帮助企业在数字化升级中实现持续增长。 1、协助团队跟进产品建设功能,与相关业务团队合作,推进产品功能落地; 2、协助团队对业务运营相关的各种流程,文档,资料等的整理和优化; 3、协助团队进行客户数据整理与分析等工作,可输出分析报告,推进策略落地实施。
ByteIntern:面向2026届毕业生(2025年9月-2026年8月期间毕业),为符合岗位要求的同学提供转正机会。 团队介绍:视频与边缘部门承载了字节跳动的媒体内容分发基建及技术中台,支持了字节全系产品的点播、直播、实时通信、图片等多媒体业务发展,同时将业务发展过程中沉淀下来的技术能力和工具,通过火山引擎对外输出,面向各行各业用户提供视频云产品和服务,愿景是为内外部业务伙伴提供最低成本、最优画质、最低延时、最安全可靠的富媒体内容分发解决方案,助力业务伙伴降本提效实现持续增长。 1、研究和实现部门自研的下一代沉浸智能音频理解和处理算法系统; 2、跟进并参与国内和国际音频标准,撰写高质量的标准技术提案,推动国内和国际沉浸智能音频标准工作; 3、实现并优化沉浸智能音频编解码和处理系统,负责在短视频点播,直播,VR/MR等业务场景的应用迭代。
团队介绍:视频与边缘部门承载了字节跳动的媒体内容分发基建及技术中台,支持了字节全系产品的点播、直播、实时通信、图片等多媒体业务发展,同时将业务发展过程中沉淀下来的技术能力和工具,通过火山引擎对外输出,面向各行各业用户提供视频云产品和服务,愿景是为内外部业务伙伴提供最低成本、最优画质、最低延时、最安全可靠的富媒体内容分发解决方案,助力业务伙伴降本提效实现持续增长。 课题介绍:随着4K、HDR等技术成为主流标准,消费者对视频画质的要求日益提升。然而,视频在拍摄、传输和压缩过程中,画质往往受损,影响观看体验。多模态大模型的出现为视频分析、理解、画质评估、及画质增强提供了新的可能性,因此希望能够探索多模态大模型在多媒体场景的应用可行性,发掘基座大模型在大规模业务视频内容应用的潜力,建立业内领先的多媒体场景的多模态大模型解决方案。 画质分析以及人眼感知:利用多模态大模型,深入分析视频内容及画质退化问题,研究人眼对色彩、帧率、清晰度等画质维度的感知能力,从而使得画质评估更为准确,画质增强对退化的处理更为智能,增强的结果更符合人眼主观。生成式画质增强:利用生成式大模型的先验信息,大幅提升画质增强的效果天花板,并且解决生成伪像、生成保真度、生成稳定性等当前生成式算法存在的问题。视频时域任务:研究画质理解和增强在视频上的拓展,包括时域信息表征建模,时域退化理解,时域画质增强连续性,时域推理加速等。用户视角的验证:在大规模用户环境中,从用户的实际观看体验出发,验证画质增强算法的有效性和用户满意度。 1、支持研发基于大模型的多媒体算法,包括但是不限于视频理解,质量评价、视频处理和增强以及视频压缩; 2、支持多模态大模型相关算法的性能优化以及加速; 3、支持多模态大模型的算法在多媒体业务中落地,在图文、点播、直播等业务中发掘应用场景; 4、支持多模态大模型相关的前沿学术研究,在国际顶级会议与期刊中发表成果。