logo of mi

小米顶尖应届-图像算法工程师(视频防抖方向)-相机

校招全职地点:上海状态:招聘

任职要求


1. 基础能力:计算机科学、电子信息、人工智能等相关专业博士应届生,熟悉PythonC++PyTorch/TensorFlow框架,具备三维重建或视频生成项目经验;
2. 技术加分项:掌握3DGS、NeRF、SLAM或三维渲染技术者优先,有CVPR/ICCV论文或AI竞赛获奖(如CVPR视频生成挑战赛)者优先;
3. 软技能:良好的跨团队协作能力,能适应技术迭代与工程落地需求;对前沿技术敏感,具备独立分析与解决问题的能力。

工作职责


1. 优化现有方案:改进传统五轴防抖算法,融合深度学习模型(如Vid2Vid、ST-GAN),提升旋转+平移抖动的修正精度;分析抖动模式与用户运镜意图,设计动态路径平滑策略;
2. 3D场景渲染与新视角生成:基于3DGS/NeRF技术构建视频序列的三维场景表示;开发视角合成模块,实现防抖路径下的新视角渲染与抖动补偿;优化多视角一致性与渲染效率,降低几何畸变与模糊残留;
3. 实时部署与软硬融合:设计轻量化3DGS网络架构,适配移动端算力;联合硬件团队优化算法在ISP/DSP的协同计算,降低功耗与延迟;推动技术落地至小米旗舰手机与智能汽车车载相机系统。

【课题名称】
视频AI防抖(基于3D场景重建的智能运镜防抖技术研究)
【课题内容】
研究并开发结合三维场景还原(如3DGS、NeRF)与专业运镜路径规划的视频防抖系统。
1. 利用3D高斯溅射(3DGS)等技术实现动态场景的三维空间重建;
2. 设计新视角生成算法,提升防抖路径平滑度与空间连续性;
3. 探索算法在手机端及车载设备的实时部署能力,支持专业运镜模式下的抖动补偿。
包括英文材料
Python+
C+++
PyTorch+
TensorFlow+
SLAM+
CVPR+
ICCV+
相关职位

logo of mi
校招

1. 参与视频AI Deblur算法的设计、训练与优化; 2. 构建大规模模糊视频数据集,完成数据标注与预处理; 3. 跟踪领域前沿技术(如Transformer、扩散模型),探索创新方案; 4. 协助模型在手机端部署与性能调优; 5. 撰写技术文档与论文,推动成果落地至小米核心产品线。 【课题名称】 视频AI Deblur 【课题内容】 研究并开发基于深度学习的视频去模糊算法,解决动态模糊、运动模糊等视频质量退化问题,提升视频清晰度与用户体验。技术方向包括但不限于:时空特征融合、多帧对齐与重建、轻量化模型部署、端到端优化等,目标为实现行业领先的实时视频修复能力。

更新于 2025-06-25
logo of mi
校招

1. 参与相机影像画质增强领域的深度学习或传统算法研发工作,包括但不限于HDR视频增强、颜色复原、影调优化、肤色矫正等任务; 2、结合产品需求,参与算法在芯片上的设计、开发和优化,解决算法产品化过程中的各种技术难题; 3、跟进特定领域的行业进展,并结合产品对算法进行优化,使相关产品效果达到业界领先水平。 【课题名称】 芯片影像画质增强算法研究 【课题内容】 芯片ISP影像画质增强方向,包括但不限于HDR视频增强、颜色复原、影调优化、肤色矫正等任务,探索算法在移动端低功耗的落地方案,以及核心算子硬化、AI和ISP联合设计等关键技术。

更新于 2025-06-26
logo of mi
校招

1. 参与相机影像应用领域的算法研发工作,包括但不限于HDR视频增强、颜色复原、影调优 化、肤色矫正等方向,参与和主导上述模型在自研芯片平台上的设计、开发与优化。 2. 与产品深度沟通,参与新一代手机影像应用类产品的方案设计,并为算法产品化过程中 出现的各类技术难题出谋划策。 3. 跟进对应领域最新行业进展,结合产品规划对算法进行探索与预研。

更新于 2025-07-17
logo of mi
校招

1. 参与相机影像应用领域的算法研发工作,包括但不限于AIGC、大模型、世界模型等方向 ,参与和主导上述模型在自研芯片平台上的设计、开发与优化。 2. 与产品深度沟通,参与新一代手机影像应用类产品的方案设计,并为算法产品化过程中 出现的各类技术难题出谋划策。 3. 跟进对应领域最新行业进展,结合产品规划对算法进行探索与预研。

更新于 2025-07-17