小红书图像增强算法实习生
任职要求
1、电子、计算机、通信或数学等相关专业本科及以上在读学生。 2、对图像、视频传统算法,深度学习、机器学习等人工智能领域有一定了解,具备一定的图像处理算法基础和数学功底。 3、对图像超分辨、图像修复、图像去噪、无参考质量评价等领域有初步认识,对跟踪最前沿的学术界和工业界的人工智能技术有兴趣。 4、了解视频降…
工作职责
1、协助团队改善短视频、直播、RTC 等场景的视频画质体验并节省带宽,参与音视频系统的构建工作。 2、参与视频图像前、后处理增强算法的研究与实践,接触超分、降噪、色彩增强、去抖动、去模糊、插帧、暗光增强、人像修复等方向。 3、协助进行视频画质分析和质量评估算法的研究和落地,包括噪声估计、色彩 / 曝光 / 对比度 / 清晰度评价、美学 / 构图评价等工作。 4、参与视频场景分类和分析,为改善视频编码效率和传输效率提供支持,包括 ROI 检测、场景分类、复杂度分析、带宽预测等。
职位描述: 1. 负责视频/图片前处理修复增强算法的研究与落地,包括但不限于超分、降噪、去模糊、人像修复等; 2. 负责在视频/图片画质还原领域探索diffusion生成式模型的应用与落地;
1、负责研发基于diffusion的low-level视频处理算法,专注于提升算法性能,包括但不限于网络架构设计(VAE和DIT)、算法优化、大规模数据处理以及Diffusion模型保真性提升; 2、负责研发基于diffusion的视频压缩和生成框架,致力于突破视频生成极限,涉及图像/视频压缩算法的创新设计和优化; 3、负责跟进和探索业界前沿视频修复技术,并根据业务需求进行创新和性能提升。
职位描述 1. 参与影像画质增强算法预研工作,包括但不限于降噪、去模糊、超分辨率、插帧 等任务 ; 2. 参与图像编辑类算法预研工作,包括但不限于上色、去炫光、去反光、美颜等任务; 3. 参与图像配准类算法预研工作。
团队介绍:视频与边缘部门承载了字节跳动的媒体内容分发基建及技术中台,支持了字节全系产品的点播、直播、实时通信、图片等多媒体业务发展,同时将业务发展过程中沉淀下来的技术能力和工具,通过火山引擎对外输出,面向各行各业用户提供视频云产品和服务,愿景是为内外部业务伙伴提供最低成本、最优画质、最低延时、最安全可靠的富媒体内容分发解决方案,助力业务伙伴降本提效实现持续增长。 课题介绍:随着4K、HDR等技术成为主流标准,消费者对视频画质的要求日益提升。然而,视频在拍摄、传输和压缩过程中,画质往往受损,影响观看体验。多模态大模型的出现为视频分析、理解、画质评估、及画质增强提供了新的可能性,因此希望能够探索多模态大模型在多媒体场景的应用可行性,发掘基座大模型在大规模业务视频内容应用的潜力,建立业内领先的多媒体场景的多模态大模型解决方案。 画质分析以及人眼感知:利用多模态大模型,深入分析视频内容及画质退化问题,研究人眼对色彩、帧率、清晰度等画质维度的感知能力,从而使得画质评估更为准确,画质增强对退化的处理更为智能,增强的结果更符合人眼主观。生成式画质增强:利用生成式大模型的先验信息,大幅提升画质增强的效果天花板,并且解决生成伪像、生成保真度、生成稳定性等当前生成式算法存在的问题。视频时域任务:研究画质理解和增强在视频上的拓展,包括时域信息表征建模,时域退化理解,时域画质增强连续性,时域推理加速等。用户视角的验证:在大规模用户环境中,从用户的实际观看体验出发,验证画质增强算法的有效性和用户满意度。 1、支持研发基于大模型的多媒体算法,包括但是不限于视频理解,质量评价、视频处理和增强以及视频压缩; 2、支持多模态大模型相关算法的性能优化以及加速; 3、支持多模态大模型的算法在多媒体业务中落地,在图文、点播、直播等业务中发掘应用场景; 4、支持多模态大模型相关的前沿学术研究,在国际顶级会议与期刊中发表成果。