小米顶尖应届-图像算法工程师(视频增强方向)-相机
任职要求
1. 计算机科学、电子信息、人工智能等相关专业博士应届生; 2. 熟悉Python及PyTorch/TensorF…
工作职责
1. 参与视频AI Deblur算法的设计、训练与优化; 2. 构建大规模模糊视频数据集,完成数据标注与预处理; 3. 跟踪领域前沿技术(如Transformer、扩散模型),探索创新方案; 4. 协助模型在手机端部署与性能调优; 5. 撰写技术文档与论文,推动成果落地至小米核心产品线。 【课题名称】 视频AI Deblur 【课题内容】 研究并开发基于深度学习的视频去模糊算法,解决动态模糊、运动模糊等视频质量退化问题,提升视频清晰度与用户体验。技术方向包括但不限于:时空特征融合、多帧对齐与重建、轻量化模型部署、端到端优化等,目标为实现行业领先的实时视频修复能力。
1. 参与相机影像画质增强领域的深度学习或传统算法研发工作,包括但不限于HDR视频增强、颜色复原、影调优化、肤色矫正等任务; 2、结合产品需求,参与算法在芯片上的设计、开发和优化,解决算法产品化过程中的各种技术难题; 3、跟进特定领域的行业进展,并结合产品对算法进行优化,使相关产品效果达到业界领先水平。 【课题名称】 芯片影像画质增强算法研究 【课题内容】 芯片ISP影像画质增强方向,包括但不限于HDR视频增强、颜色复原、影调优化、肤色矫正等任务,探索算法在移动端低功耗的落地方案,以及核心算子硬化、AI和ISP联合设计等关键技术。
1. 参与相机影像应用领域的算法研发工作,包括但不限于HDR视频增强、颜色复原、影调优 化、肤色矫正等方向,参与和主导上述模型在自研芯片平台上的设计、开发与优化。 2. 与产品深度沟通,参与新一代手机影像应用类产品的方案设计,并为算法产品化过程中 出现的各类技术难题出谋划策。 3. 跟进对应领域最新行业进展,结合产品规划对算法进行探索与预研。
团队介绍: 高德地图机器学习研发部是公司AI核心技术引擎,聚焦多模态大模型、视频生成与理解、图像编辑与生成等前沿领域。团队深耕人工智能技术落地,支撑亿级用户产品,同时长期投入前沿探索,在NeurIPS/ICLR/CVPR/ACL等顶会发表多篇论文,多项成果入选“最有影响力论文”榜单。我们拥有海量数据与算力资源,鼓励创新突破,诚邀你与顶尖算法专家并肩,共同定义AI的未来!如果你渴望挑战多模态与生成式AI的技术巅峰,在视频、图像、大模型的交叉领域实现突破,欢迎加入我们!团队的github页面是:https://github.com/AMAP-ML/ 我们提供 • 参与亿级用户产品的AI核心算法研发,见证技术直接赋能业务; • 与学术大牛和工业界专家共事,持续提升技术视野; • 顶配算力资源+开放创新氛围,支持前沿探索与顶会论文发表。 具体职责包括但不限于: 1. 视频生成:负责视频生成技术的前沿技术的研究,对AIGC的diffusion和auto-regressive技术有深入了解,在T2I/AIGCT2V/I2V上面有一定的研究,图文对齐,长视频生成等有一定的研究,做好视频生成在高德业务(广告,POI详情页等)中的进行落地。 2. 视频理解:能够使用和优化多模态大模型对用户上传的视频进行质量理解,标签,densecaption,视频summary等生成,作用到视频的搜索,广告,推荐等业务的落地。 3. 世界模型: 参与世界模型的构建,能够使用最新的视频生成技术,3D技术等构建符合人类物理规律的统一的世界模型,在高德的业务进行落地。 4. 紧跟技术前沿和技术沉淀,形成顶会论文和专利。