logo of alibaba

阿里巴巴算法工程师-视频增强与AI处理

实习兼职淘天集团2026届春季实习生招聘地点:杭州状态:招聘

任职要求


【必备项】 
1、本科及以上学历,有较好的工程实现能力,精通C/C++Python等至少一门编程语言;
2、良好的数据基础、较强的逻辑分析能力;
3、学习能力强,对AI有充满热情,对新事物保有好奇心,并能快速适应新环境;
4、良好的沟通能力和团队协同能力;能与他人合作,共同完成目标;对所在领域有热情,善于独立思考并反思总结。

【加分项】
1、有相关岗位实习及项目开发经历;
2、有实际成果并发表在国际顶级会议、期刊;或相关权威比赛中获奖。

工作职责


在这里,你将参与淘宝直播及短视频等丰富的内容业务场景,围绕“更清晰、更好看、更好玩”,和其他优秀的同学一起,为用户提供极致的体验;
在这里,你将负责为用户提供最优的画质,负责视频增强相关算法研发,包括但不限于视频去压缩伪影、视频去噪、色彩增强、视频去抖、视频去模糊、超分辨率、视频插帧等算法;
在这里,你将负责人脸美化相关算法研发,包括但不限于检测、关键点、生成、分割等算法;
在这里,你将负责特效互动相关算法研发,包括但不限于人脸、人体、人手、物体相关2D和3D等算法;
在这里,你将会持续关注相关领域的前沿算法,并针对实际场景进行优化,把算法落地应用到实际项目中。

加入我们,你将会面对新的内容场景,通过技术深耕,致力于行业领先的音视频技术创新和应用,帮助创造极致的消费者体验。你的工作将服务于改善全世界数十亿人的购物、娱乐和交互的体验。探索未知,挑战未来,来吧,我们等你加入!
包括英文材料
学历+
C+
C+++
Python+
相关职位

logo of aliyun
实习阿里云2026届

阿里云持续推进AI 技术深化战略布局, 围绕AI 和云计算的基础设施建设、AI基础模型平台、企业级AI应用方向构建核心场景。为此,我们正积极招募优秀人才: 具体职责包括但不限于: 1、视频编码(包括但不限于HEVC/VVC)优化:通过对主流视频编码标准的最优化实现满足不同业务场景对压缩效率,编码速度,编解码延时的需求。相关优化算法包括编码器快速算法,智能编码,码率控制,场景编码,ROI,JND编码等; 2、视频处理算法在直播和短视频等场景的研究和落地:包括但不限于视频去压缩伪影、视频去噪、视频去抖、视频去模糊、纹理效果提升、超分辨率、视频插帧等。以及针对直播成像侧的拍摄质量增强,探索提升主观体验的方法; 3、视频质量评价(VQA)优化:包括但不限于传统和AI的视频质量主客观评价方法的改进和优化,搭建多维度端和云侧视频质量评估框架,联合编码和处理实现最优的画质体验; 4、超低带宽的视频压缩与增强:针对超低带宽场景下,探索针对信号处理和语义的信息论极限; 5、视频编码与处理联合优化:在标准编码框架的基础上,借助AI领域的新技术成果来研究视频信号的表征、编码与处理,将视频前后处理与编码联合优化,提升端到端压缩效果; 6、面向人眼视觉模型的编解码和视频增强技术研究:将视频编码增强与质量评价相结合,提升人眼主观体验; 7、H.266/VVC之后的下一代视频编码标准,包括智能编码相关算法研究; 8、为VR/AR等新兴应用设计和实施新颖的视频处理、编码和质量评估算法,以推动端到端系统体验优化。

更新于 2025-04-23
logo of tencent
社招CSIG技术

1.负责研究视频领域的前沿AI算法模型,包括视频增强与处理、LLM多模态,aigc等方向; 2.深入研究机器学习、深度学习等领域的前沿技术,结合视频业务需求进行技术创新,模型加速和应用开发; 3.跟踪并分析国内外最新的人工智能科研进展,引导团队的研究方向。

更新于 2025-06-19
logo of mi
校招

1. 参与视频AI Deblur算法的设计、训练与优化; 2. 构建大规模模糊视频数据集,完成数据标注与预处理; 3. 跟踪领域前沿技术(如Transformer、扩散模型),探索创新方案; 4. 协助模型在手机端部署与性能调优; 5. 撰写技术文档与论文,推动成果落地至小米核心产品线。 【课题名称】 视频AI Deblur 【课题内容】 研究并开发基于深度学习的视频去模糊算法,解决动态模糊、运动模糊等视频质量退化问题,提升视频清晰度与用户体验。技术方向包括但不限于:时空特征融合、多帧对齐与重建、轻量化模型部署、端到端优化等,目标为实现行业领先的实时视频修复能力。

更新于 2025-06-25
logo of alibaba
实习淘天集团2026

T-Star计划是阿里巴巴淘天集团顶尖人才招聘和培养项目,继承“阿里星〞的使命与愿景,面向全球招募顶尖技术人才。首次开设实习生专项招聘,面向2025年10月后毕业的校优秀技术同学。期待你们在淘天,通过极具挑战的前沿课题与亿级规模的海量数据、应用场景,探索和实践最前沿的Al技术,在有价值的业务场景落地技术成果。 在这里,你将参与贡献大型电商场景下与音视频体验和成本相关的一系列研发工作;

 在这里,你将参与视频编码(包括但不限于HEVC/VVC)优化:通过基于信号处理和机器学习的快速编码决策、数据结构、并行框架设计,优化编码速度,同时在有竞争力的视频编码内核基础上,探索基于语义的内容感知编码优化,深度学习编码,AIGC编码等前沿课题,在保障画质体验的前提下,尽可能节省带宽;

 在这里,你将参与海量图像和视频的增强修复工作:运用前沿技术,包括但不限于模型结构优化、数据仿真和增强策略优化、知识蒸馏以及模型压缩,在限定带宽环境对任意失真的视频进行高效处理,力求最好的画质。同时,跟踪业界最新进展和技术趋势(包括AIGC)并融入特定的场景,提出创新方案,帮助平台提供逼近广电级别的视频画质;

 在这里,你将参与视频编码与处理联合优化:在标准编码框架的基础上,借助AI领域的新技术成果来研究视频信号的表征、编码与处理,将视频前后处理与编码联合优化,提升端到端压缩效果; 在这里,你将参与美颜等视频美化技术的研究工作,包括人脸检测、关键点、肤色美白、面部塑形、化妆效果模拟等。这些技术将应用于直播和短视频等多样化场景,并确保其在真实视频场景的有效整合。你还将专注于基于3D人脸建模和AI算法的智能美颜技术,推动这些技术的大规模落地; 在这里,你将参与UGC视频生产剪辑依赖的多类当下最前沿的图像视频生成与编辑,包括图像风格化,人像分割与实例分割,人脸属性,图像可控生成,图像视频化等,为视频剪辑提供更丰富的素材和更多的玩法;

 在这里,你将有机会参与最前沿的音视频质量评价算法工作,包括无参考的视频质量评价,人脸美学评价,音频质量评价,为多媒体算法的迭代和平台音画质的体验提供基础工具;
 在这里,你将帮助淘宝直播等大型的视频传输场景设计QoS算法,追求超低延时、极速播放等用户体验,并支持各种弱网环境下的最优的视频流畅度和优雅的画质降级。 T-Star实习可以带给你什么? ꔷ ①加入前沿技术探索队伍,参与顶级课题研究,有机会实现工业界项目落地。②跟企业大牛导师/学术界名导一起做有价值的课题。③丰富的技术资源、海量的数据与优秀的团队助力发paper ꔷ 投递T-Star实习生,提前解锁淘天顶级技术岗位,实习与T-Star正式批/应届秋招投递不冲突。拿到T-Star意向书的同时,将获得直通正式批次终面的机会;参与T-Star实习且表现优秀的同学,提供T-Star转正Offer。

更新于 2025-05-07