大疆多媒体算法工程师(北京)
任职要求
1. 本科及以上学历,计算机、电子工程、自动化、图像处理、计算摄影、模式识别、通信/信号处理等相关专业; 2. 具备扎实的图像处理算法基础,有良好的数学功底; 3. 良好的编程基础,熟练掌握Python/C/C++等编程开发技术和常用的数据结构、算法、熟练使用业界常用的算法模型训练工具; 4. 项目经验加分项: ① 有手机端,PC 端视频处理算法研发落地经验,包括Mac,iOS,Andoid 、Windows; ② 有并行优化经验,熟悉Opengl 、Metal, CUDA等并行处理器编程语言; ③ 有计算摄影和成像相关项目经验,如图像增强…
工作职责
加入我们,重塑影像创作的未来! 我们的独特战场——两类产品,双重创造力引擎 作为硬件旗舰的“智慧搭档”,将为无人机/手持设备注入创作全链路的智慧基因:从拍摄后的素材智能归集、AI辅助剪辑,到一键分享的极致流畅体验; 挑战点:重构创作效率——让用户从繁琐操作中解放,专注创意本身。 作为软件驱动的“颠覆者”,将以画质增强算法、视频的拼接算法、AI场景智能识别、影像叙事引擎为核心武器,打造“人无我有”的竞争力壁垒。 突破点:让普通设备输出专业级影像——通过算法突破硬件物理限制,重新定义画质天花板。 1. 负责DJI 产品视频智能成片,视频画质提升,图像匹配对齐相关算法开发和优化工作; 2. 负责参与上述功能在产品侧的落地; 3. 持续跟踪国内外视频理解和处理技术相关进展,并根据业务需要进行创新和落地。
1、 在音视频技术、人工智能、视频图像处理和生成等领域开展前沿技术研究,保持算法在工业界和学术界的领先; 2、 探索前沿技术在视频图像质量评估、视频图像分析及处理、智能编码、智能抽帧等技术方向上落地。
如果你热爱追剧、看电影,并对内容与品质有着极致的追求; 如果你既有深厚的理论功底,又能快速付诸实践; 那么,欢迎加入优酷多媒体算法团队! 在这里,你可以上班时间看大片,寻找灵感、激发创意; 在这里,你将与行业顶尖专家并肩,共同定义高清体验的新标准; 在这里,你将有机会探索AI技术在视频产业超高清化浪潮中的无限潜能,为亿万用户带来前所未有的视觉盛宴。 在这里,你将负责研发视频处理算法,设计视频处理方案,端到端提升平台视频播放体验。具体包括: 1、支持画质增强相关算法研究和落地,包括但不限于去噪、去模糊、修复、HDR、插帧等; 2、支持视频端到端全链路体验问题分析、定义与优化; 3、深入理解视频技术底层原理,持续跟踪国内外图像和视频技术相关进展,基于业务场景进行创新与落地。
团队介绍:视频与边缘部门承载了字节跳动的媒体内容分发基建及技术中台,支持了字节全系产品,如抖音、今日头条、番茄小说、西瓜视频等APP的点播、直播、实时通信、图片等多媒体业务发展,同时将业务发展过程中沉淀下来的技术能力和工具,通过火山引擎对外输出,面向各行各业用户提供视频云产品和服务,愿景是为内外部业务伙伴提供最低成本、最优画质、最低延时、最安全可靠的富媒体内容分发解决方案,助力业务伙伴降本提效实现持续增长。 课题介绍:随着4K、HDR等技术成为主流标准,消费者对视频画质的要求日益提升。然而,视频在拍摄、传输和压缩过程中,画质往往受损,影响观看体验。多模态大模型的出现为视频分析、理解、画质评估、及画质增强提供了新的可能性,因此希望能够探索多模态大模型在多媒体场景的应用可行性,发掘基座大模型在大规模业务视频内容应用的潜力,建立业内领先的多媒体场景的多模态大模型解决方案。 画质分析以及人眼感知:利用多模态大模型,深入分析视频内容及画质退化问题,研究人眼对色彩、帧率、清晰度等画质维度的感知能力,从而使得画质评估更为准确,画质增强对退化的处理更为智能,增强的结果更符合人眼主观。生成式画质增强:利用生成式大模型的先验信息,大幅提升画质增强的效果天花板,并且解决生成伪像、生成保真度、生成稳定性等当前生成式算法存在的问题。视频时域任务:研究画质理解和增强在视频上的拓展,包括时域信息表征建模,时域退化理解,时域画质增强连续性,时域推理加速等。用户视角的验证:在大规模用户环境中,从用户的实际观看体验出发,验证画质增强算法的有效性和用户满意度。 1、支持研发基于大模型的多媒体算法,包括但是不限于视频理解,质量评价、视频处理和增强以及视频压缩; 2、支持多模态大模型相关算法的性能优化以及加速; 3、支持多模态大模型的算法在多媒体业务中落地,在图文、点播、直播等业务中发掘应用场景; 4、支持多模态大模型相关的前沿学术研究,在国际顶级会议与期刊中发表成果。