阿里巴巴音视频技术-媒体智创平台高级技术专家-杭州
任职要求
1. 具备国内外头部互联网公司业务系统研发经验,有多媒体、AI应用相关的服务端从业研发经验优先。
2. 具备良好的业务敏感度与洞察力,有一定的技术前瞻能力,在产品能力或者技术架构演进方面有成功案例。
3. 具备较好的技术热情与主观能动…工作职责
1. 负责媒体智能创作系统的研发工作,与产品、运营、技术等相关同学合作,持续推进淘天集团电商业务的内容化和体验升级相关工作,支持关联业务中直播、短视频、图像内容的创作&处理等相关产品能力演进。 2. 负责跟进业界前沿的媒体创作&媒体处理方向的技术发展和产品形态,持续推进媒体智创系统及相关基建组件的架构升级与能力迭代,提升系统能力,帮助各关联业务降低生产成本,提高生产效率,优化内容效果。 3. 负责主导团队工程技术的难题攻关,把控智创系统相关项目的整体技术方案和项目进展,保障团队项目的准时按质交付。 4. 负责指导和培养团队中新人工程师,提升团队的整体技术能力,保障团队的工作氛围和士气。
1. 负责淘天音视频媒体智创系统的设计和研发工作,参与技术架构升级和改造。 2. 负责业务需求的技术评审和分析,并主导完成编码工作,确保项目的进度和质量。 3. 负责定位和解决系统在业务中遇到的问题,做好业务的日常支持工作。 4. 负责技术预研和技术难点攻关,保障系统可用性、稳定性和可扩展性。
团队介绍:视频与边缘部门承载了字节跳动的媒体内容分发基建及技术中台,支持了字节全系产品,如抖音、今日头条、番茄小说、西瓜视频等APP的点播、直播、实时通信、图片等多媒体业务发展,同时将业务发展过程中沉淀下来的技术能力和工具,通过火山引擎对外输出,面向各行各业用户提供视频云产品和服务,愿景是为内外部业务伙伴提供最低成本、最优画质、最低延时、最安全可靠的富媒体内容分发解决方案,助力业务伙伴降本提效实现持续增长。 1、设计和开发用于多种视频格式的商用图像和视频编解码器,包括平面视频、立体视频、多视点视频、360度全景视频、点云视频、光场视频等; 2、设计和开发软件编码和解码系统框架,优化不同应用场景下的编码和解码算法; 3、研究和开发面向主观视觉质量优化的视频编码和视频处理算法; 4、撰写编码器和解码器接口文档; 5、设计和实现自研的音视频网络传输协议。
团队介绍:视频与边缘部门承载了字节跳动的媒体内容分发基建及技术中台,支持了字节全系产品,如抖音、今日头条、番茄小说、西瓜视频等APP的点播、直播、实时通信、图片等多媒体业务发展,同时将业务发展过程中沉淀下来的技术能力和工具,通过火山引擎对外输出,面向各行各业用户提供视频云产品和服务,愿景是为内外部业务伙伴提供最低成本、最优画质、最低延时、最安全可靠的富媒体内容分发解决方案,助力业务伙伴降本提效实现持续增长。 1、参与RTC SDK的核心功能开发、解决方案建设,支撑抖音的玩法创新和产品功能迭代; 2、持续优化RTC SDK的性能和质量,提升抖音在直播连麦、IM通话等场景的用户体验。
团队介绍:视频与边缘部门承载了字节跳动的媒体内容分发基建及技术中台,支持了字节全系产品,如抖音、今日头条、番茄小说、西瓜视频等APP的点播、直播、实时通信、图片等多媒体业务发展,同时将业务发展过程中沉淀下来的技术能力和工具,通过火山引擎对外输出,面向各行各业用户提供视频云产品和服务,愿景是为内外部业务伙伴提供最低成本、最优画质、最低延时、最安全可靠的富媒体内容分发解决方案,助力业务伙伴降本提效实现持续增长。 课题介绍:随着4K、HDR等技术成为主流标准,消费者对视频画质的要求日益提升。然而,视频在拍摄、传输和压缩过程中,画质往往受损,影响观看体验。多模态大模型的出现为视频分析、理解、画质评估、及画质增强提供了新的可能性,因此希望能够探索多模态大模型在多媒体场景的应用可行性,发掘基座大模型在大规模业务视频内容应用的潜力,建立业内领先的多媒体场景的多模态大模型解决方案。 画质分析以及人眼感知:利用多模态大模型,深入分析视频内容及画质退化问题,研究人眼对色彩、帧率、清晰度等画质维度的感知能力,从而使得画质评估更为准确,画质增强对退化的处理更为智能,增强的结果更符合人眼主观。生成式画质增强:利用生成式大模型的先验信息,大幅提升画质增强的效果天花板,并且解决生成伪像、生成保真度、生成稳定性等当前生成式算法存在的问题。视频时域任务:研究画质理解和增强在视频上的拓展,包括时域信息表征建模,时域退化理解,时域画质增强连续性,时域推理加速等。用户视角的验证:在大规模用户环境中,从用户的实际观看体验出发,验证画质增强算法的有效性和用户满意度。 1、支持研发基于大模型的多媒体算法,包括但是不限于视频理解,质量评价、视频处理和增强以及视频压缩; 2、支持多模态大模型相关算法的性能优化以及加速; 3、支持多模态大模型的算法在多媒体业务中落地,在图文、点播、直播等业务中发掘应用场景; 4、支持多模态大模型相关的前沿学术研究,在国际顶级会议与期刊中发表成果。