小米顶尖应届-视频编解码算法工程师-生态链
任职要求
1. 博士学历,计算机、电子信息、自动化、软件工程、数学等相关专业,数字媒体技术、计算机视觉、信号处理等相关方向; 2. 熟悉FFmpeg/GStreamer/x265框架,了解OpenCL/Vulkan; 3. 具备优秀的编程能力,精通C/C++、汇编,操作系统; 4. 精通HEVC,VVC,AV1等主流编码原理; 5. 在ICIP /ICASSP/ CVPR / PCS / ISSCC / TCSVT/JVET等顶会发表过视频编解码方向高水平论文,或以主力身份参加相关领域主流算法竞赛且取得优秀成绩者,优先; 6. 与主流SoC厂商有落地项目的优先; 7. 具备良好的团队合作精神。
工作职责
1. 面向4K、6K超清视频的H.266/VVC编码算法研究(低码、高质); 2. H.266在IoT设备上的轻量化部署研究(H.266+SoC); 3. H.266在异构网络环境下高效率传输的研究; 4. H.266落地网络摄像机全流程业务的研究。 【课题名称】 面向IoT设备的下一代视频编码技术研究 【课题内容】 围绕低码率高清视频压缩(如 H.266/VVC 及新兴开源编码标准)、异构网络环境下的码流自适应传输(结合边缘节点缓存与 AI 动态码率控制),以及轻量化编解码模块在低功耗 IoT 设备中的部署优化,突破带宽受限与算力约束下的视频传输效率瓶颈。
T-Star计划是阿里巴巴淘天集团顶尖人才招聘和培养项目,继承“阿里星〞的使命与愿景,面向全球招募顶尖技术人才。首次开设实习生专项招聘,面向2025年10月后毕业的校优秀技术同学。期待你们在淘天,通过极具挑战的前沿课题与亿级规模的海量数据、应用场景,探索和实践最前沿的Al技术,在有价值的业务场景落地技术成果。 在这里,你将参与贡献大型电商场景下与音视频体验和成本相关的一系列研发工作; 在这里,你将参与视频编码(包括但不限于HEVC/VVC)优化:通过基于信号处理和机器学习的快速编码决策、数据结构、并行框架设计,优化编码速度,同时在有竞争力的视频编码内核基础上,探索基于语义的内容感知编码优化,深度学习编码,AIGC编码等前沿课题,在保障画质体验的前提下,尽可能节省带宽; 在这里,你将参与海量图像和视频的增强修复工作:运用前沿技术,包括但不限于模型结构优化、数据仿真和增强策略优化、知识蒸馏以及模型压缩,在限定带宽环境对任意失真的视频进行高效处理,力求最好的画质。同时,跟踪业界最新进展和技术趋势(包括AIGC)并融入特定的场景,提出创新方案,帮助平台提供逼近广电级别的视频画质; 在这里,你将参与视频编码与处理联合优化:在标准编码框架的基础上,借助AI领域的新技术成果来研究视频信号的表征、编码与处理,将视频前后处理与编码联合优化,提升端到端压缩效果; 在这里,你将参与美颜等视频美化技术的研究工作,包括人脸检测、关键点、肤色美白、面部塑形、化妆效果模拟等。这些技术将应用于直播和短视频等多样化场景,并确保其在真实视频场景的有效整合。你还将专注于基于3D人脸建模和AI算法的智能美颜技术,推动这些技术的大规模落地; 在这里,你将参与UGC视频生产剪辑依赖的多类当下最前沿的图像视频生成与编辑,包括图像风格化,人像分割与实例分割,人脸属性,图像可控生成,图像视频化等,为视频剪辑提供更丰富的素材和更多的玩法; 在这里,你将有机会参与最前沿的音视频质量评价算法工作,包括无参考的视频质量评价,人脸美学评价,音频质量评价,为多媒体算法的迭代和平台音画质的体验提供基础工具; 在这里,你将帮助淘宝直播等大型的视频传输场景设计QoS算法,追求超低延时、极速播放等用户体验,并支持各种弱网环境下的最优的视频流畅度和优雅的画质降级。 T-Star实习可以带给你什么? ꔷ ①加入前沿技术探索队伍,参与顶级课题研究,有机会实现工业界项目落地。②跟企业大牛导师/学术界名导一起做有价值的课题。③丰富的技术资源、海量的数据与优秀的团队助力发paper ꔷ 投递T-Star实习生,提前解锁淘天顶级技术岗位,实习与T-Star正式批/应届秋招投递不冲突。拿到T-Star意向书的同时,将获得直通正式批次终面的机会;参与T-Star实习且表现优秀的同学,提供T-Star转正Offer。
1.负责研究和设计为自动驾驶场景打造的专用操作系统基础软件; 2.研究和攻克Linux内核优化、高性能通信、确定性调度、视频编解码、AI推理加速、故障诊断与恢复等方向的技术难点; 3.分析和优化自动驾驶系统集成过程中各种复杂的稳定性和性能问题,推动业务算法模块代码优化; 【课题名称】 自动驾驶操作系统的设计与研发 【课题内容】 探索和研发为自动驾驶场景打造的专用操作系统,提供实时性、确定性和安全性保障。
1、参与中美欧专利技术评审,专利申请文件的撰写,审查意见的答复等专利相关业务,与全球领先的专利事务所合作交流,成为知识产权业内顶尖人才; 2、参与中美欧知识产权分析、无效诉讼、专利运营、许可谈判和诉讼等项目,与全球一流的律师事务所交流与合作,用实战缔造最先进的判例,感受世界一流知识产权的风采; 3、管控研发、市场活动中的专利风险,与研发工程师共同挖掘优秀的技术方案,打造高价值专利包,为技术赋予法律内涵,发挥商业价值。
1. 参与视频AI Deblur算法的设计、训练与优化; 2. 构建大规模模糊视频数据集,完成数据标注与预处理; 3. 跟踪领域前沿技术(如Transformer、扩散模型),探索创新方案; 4. 协助模型在手机端部署与性能调优; 5. 撰写技术文档与论文,推动成果落地至小米核心产品线。 【课题名称】 视频AI Deblur 【课题内容】 研究并开发基于深度学习的视频去模糊算法,解决动态模糊、运动模糊等视频质量退化问题,提升视频清晰度与用户体验。技术方向包括但不限于:时空特征融合、多帧对齐与重建、轻量化模型部署、端到端优化等,目标为实现行业领先的实时视频修复能力。