阿里云算法工程师-视频编码与处理
任职要求
1、有视频或图像编码和处理研究背景,在相关领域国际顶级会议、期刊发表论文者优先,比如IEEE CVPR,ICCV,ECCV,NeurIPS,T-IP,T-PAMI,T-CSVT; 2、精通C++、C、Python编程,熟练掌握Tensorflow、Pytorch等深度学习框架;有使用开源软件或标准参考软件的经验,如OpenCV,X264,openH264,X265,VVENC, VTM,HPM,libAOM,JEM,HM,SHM,JM和JSVM优先考虑; 3、有参与视频编码标准,如 ISO/IEC, ITU-T 系列的AVC,HEVC,VVC, JPEG, AOM以及AVS尤其是有被接受的标准提案这等优先考虑; 4、有国际大赛参赛经验且获得较好名次者优先,比如MSU编解码比赛,CVPR NTIRE, CVPR CLIC比赛等; 5、有出色的分析研究及创新能力。
工作职责
阿里云持续推进AI 技术深化战略布局, 围绕AI 和云计算的基础设施建设、AI基础模型平台、企业级AI应用方向构建核心场景。为此,我们正积极招募优秀人才: 具体职责包括但不限于: 1、视频编码(包括但不限于HEVC/VVC)优化:通过对主流视频编码标准的最优化实现满足不同业务场景对压缩效率,编码速度,编解码延时的需求。相关优化算法包括编码器快速算法,智能编码,码率控制,场景编码,ROI,JND编码等; 2、视频处理算法在直播和短视频等场景的研究和落地:包括但不限于视频去压缩伪影、视频去噪、视频去抖、视频去模糊、纹理效果提升、超分辨率、视频插帧等。以及针对直播成像侧的拍摄质量增强,探索提升主观体验的方法; 3、视频质量评价(VQA)优化:包括但不限于传统和AI的视频质量主客观评价方法的改进和优化,搭建多维度端和云侧视频质量评估框架,联合编码和处理实现最优的画质体验; 4、超低带宽的视频压缩与增强:针对超低带宽场景下,探索针对信号处理和语义的信息论极限; 5、视频编码与处理联合优化:在标准编码框架的基础上,借助AI领域的新技术成果来研究视频信号的表征、编码与处理,将视频前后处理与编码联合优化,提升端到端压缩效果; 6、面向人眼视觉模型的编解码和视频增强技术研究:将视频编码增强与质量评价相结合,提升人眼主观体验; 7、H.266/VVC之后的下一代视频编码标准,包括智能编码相关算法研究; 8、为VR/AR等新兴应用设计和实施新颖的视频处理、编码和质量评估算法,以推动端到端系统体验优化。
研发视频处理系统,从事视频转码、剪辑、检测、视频增强、老片修复等系统的开发。 1.负责阿里大文娱媒体处理服务的系统架构设计与算法功能开发; 2.负责阿里大文娱超高清内容生产,画质增强,老片修复等各种业务系统设计与开发; 3.负责视频的点播转码,直播转码,视频剪辑,视频检测等系统的开发,维护系统稳定性; 4.负责阿里大文娱计算集群的资源调度以及成本优化; 5.关注视频处理行业前沿技术,优化媒体生产服务,引领行业技术。
研发视频处理系统,从事视频转码、剪辑、检测、视频增强、老片修复等系统的开发。 1.负责阿里大文娱媒体处理服务的系统架构设计与算法功能开发 2.负责阿里大文娱超高清内容生产,画质增强,老片修复等各种业务系统设计与开发 3.负责视频的点播转码,直播转码,视频剪辑,视频检测等系统的开发,维护系统稳定性 4.负责阿里大文娱计算集群的资源调度以及成本优化 5.关注视频处理行业前沿技术,优化媒体生产服务,引领行业技术
在这里,你将参与JVET / VVC的下一代视频编码标准设计和算法研究; 在这里,你将参与视频编码(包括但不限于VVC/AV1/AVS3)优化:通过信号处理和机器学习的快速编码决策、数据结构、并行框架设计,优化编码速度,同时在有竞争力的视频编码内核基础上,探索基于语义的内容自适应编码优化; 在这里,你将参与超低带宽的视频压缩:针对超低带宽场景下,探索针对信号处理和语义的信息论极限; 在这里,你将参与视频编码与处理联合优化:在标准编码框架的基础上,借助AI领域的新技术成果来研究视频信号的表征、编码与处理,将视频前后处理与编码联合优化,提升端到端压缩效果; 在这里,你将进行面向人眼视觉模型编解码技术研究:将视频编码与质量评价相结合,提升人眼压缩体验; 在这里,你将参与为VR/ AR等新兴应用设计和实施新颖的视频处理、编码和质量评估算法,以推动端到端系统体验优化。 加入我们,迎接未来的视频洪流的挑战,同时为用户提供无处不在的沉浸式高品质视频服务,布局下一代多媒体标准开发和沉浸式多媒体体验创新(如虚拟现实、增强现实、沉浸式音视频等)。来吧,我们等你加入!
T-Star计划是阿里巴巴淘天集团顶尖人才招聘和培养项目,继承“阿里星〞的使命与愿景,面向全球招募顶尖技术人才。首次开设实习生专项招聘,面向2025年10月后毕业的校优秀技术同学。期待你们在淘天,通过极具挑战的前沿课题与亿级规模的海量数据、应用场景,探索和实践最前沿的Al技术,在有价值的业务场景落地技术成果。 在这里,你将参与贡献大型电商场景下与音视频体验和成本相关的一系列研发工作; 在这里,你将参与视频编码(包括但不限于HEVC/VVC)优化:通过基于信号处理和机器学习的快速编码决策、数据结构、并行框架设计,优化编码速度,同时在有竞争力的视频编码内核基础上,探索基于语义的内容感知编码优化,深度学习编码,AIGC编码等前沿课题,在保障画质体验的前提下,尽可能节省带宽; 在这里,你将参与海量图像和视频的增强修复工作:运用前沿技术,包括但不限于模型结构优化、数据仿真和增强策略优化、知识蒸馏以及模型压缩,在限定带宽环境对任意失真的视频进行高效处理,力求最好的画质。同时,跟踪业界最新进展和技术趋势(包括AIGC)并融入特定的场景,提出创新方案,帮助平台提供逼近广电级别的视频画质; 在这里,你将参与视频编码与处理联合优化:在标准编码框架的基础上,借助AI领域的新技术成果来研究视频信号的表征、编码与处理,将视频前后处理与编码联合优化,提升端到端压缩效果; 在这里,你将参与美颜等视频美化技术的研究工作,包括人脸检测、关键点、肤色美白、面部塑形、化妆效果模拟等。这些技术将应用于直播和短视频等多样化场景,并确保其在真实视频场景的有效整合。你还将专注于基于3D人脸建模和AI算法的智能美颜技术,推动这些技术的大规模落地; 在这里,你将参与UGC视频生产剪辑依赖的多类当下最前沿的图像视频生成与编辑,包括图像风格化,人像分割与实例分割,人脸属性,图像可控生成,图像视频化等,为视频剪辑提供更丰富的素材和更多的玩法; 在这里,你将有机会参与最前沿的音视频质量评价算法工作,包括无参考的视频质量评价,人脸美学评价,音频质量评价,为多媒体算法的迭代和平台音画质的体验提供基础工具; 在这里,你将帮助淘宝直播等大型的视频传输场景设计QoS算法,追求超低延时、极速播放等用户体验,并支持各种弱网环境下的最优的视频流畅度和优雅的画质降级。 T-Star实习可以带给你什么? ꔷ ①加入前沿技术探索队伍,参与顶级课题研究,有机会实现工业界项目落地。②跟企业大牛导师/学术界名导一起做有价值的课题。③丰富的技术资源、海量的数据与优秀的团队助力发paper ꔷ 投递T-Star实习生,提前解锁淘天顶级技术岗位,实习与T-Star正式批/应届秋招投递不冲突。拿到T-Star意向书的同时,将获得直通正式批次终面的机会;参与T-Star实习且表现优秀的同学,提供T-Star转正Offer。