小米顶尖应届-图像算法工程师(视频防抖方向)-相机
校招全职地点:上海状态:招聘
任职要求
1. 基础能力:计算机科学、电子信息、人工智能等相关专业博士应届生,熟悉Python、C++及PyTorch/TensorFlow框架,具备三维重建或视频生成项目经验; 2. 技术加分项:掌握3DGS、NeRF、SLAM或三维渲染技术者优先,有CVPR/ICCV论文或AI竞赛获奖(如CVPR视频生成挑战赛)者优先; 3. 软技能:良好的跨团队协作能力,能适应技术迭代与工程落地需求;对前沿技术敏感,具备独立分析与解决问题的能力。
工作职责
1. 优化现有方案:改进传统五轴防抖算法,融合深度学习模型(如Vid2Vid、ST-GAN),提升旋转+平移抖动的修正精度;分析抖动模式与用户运镜意图,设计动态路径平滑策略; 2. 3D场景渲染与新视角生成:基于3DGS/NeRF技术构建视频序列的三维场景表示;开发视角合成模块,实现防抖路径下的新视角渲染与抖动补偿;优化多视角一致性与渲染效率,降低几何畸变与模糊残留; 3. 实时部署与软硬融合:设计轻量化3DGS网络架构,适配移动端算力;联合硬件团队优化算法在ISP/DSP的协同计算,降低功耗与延迟;推动技术落地至小米旗舰手机与智能汽车车载相机系统。 【课题名称】 视频AI防抖(基于3D场景重建的智能运镜防抖技术研究) 【课题内容】 研究并开发结合三维场景还原(如3DGS、NeRF)与专业运镜路径规划的视频防抖系统。 1. 利用3D高斯溅射(3DGS)等技术实现动态场景的三维空间重建; 2. 设计新视角生成算法,提升防抖路径平滑度与空间连续性; 3. 探索算法在手机端及车载设备的实时部署能力,支持专业运镜模式下的抖动补偿。
包括英文材料
Python+
https://liaoxuefeng.com/books/python/introduction/index.html
中文,免费,零起点,完整示例,基于最新的Python 3版本。
https://www.learnpython.org/
a free interactive Python tutorial for people who want to learn Python, fast.
https://www.youtube.com/watch?v=K5KVEU3aaeQ
Master Python from scratch 🚀 No fluff—just clear, practical coding skills to kickstart your journey!
https://www.youtube.com/watch?v=rfscVS0vtbw
This course will give you a full introduction into all of the core concepts in python.
C+++
https://www.learncpp.com/
LearnCpp.com is a free website devoted to teaching you how to program in modern C++.
https://www.youtube.com/watch?v=ZzaPdXTrSb8
PyTorch+
https://datawhalechina.github.io/thorough-pytorch/
PyTorch是利用深度学习进行数据科学研究的重要工具,在灵活性、可读性和性能上都具备相当的优势,近年来已成为学术界实现深度学习算法最常用的框架。
https://www.youtube.com/watch?v=V_xro1bcAuA
Learn PyTorch for deep learning in this comprehensive course for beginners. PyTorch is a machine learning framework written in Python.
TensorFlow+
https://www.youtube.com/watch?v=tpCFfeUEGs8
Ready to learn the fundamentals of TensorFlow and deep learning with Python? Well, you’ve come to the right place.
https://www.youtube.com/watch?v=ZUKz4125WNI
This part continues right where part one left off so get that Google Colab window open and get ready to write plenty more TensorFlow code.
SLAM+
https://docs.mrpt.org/reference/latest/tutorial-slam-for-beginners-the-basics.html
[英文] SLAM for Dummies
https://dspace.mit.edu/bitstream/handle/1721.1/119149/16-412j-spring-2005/contents/projects/1aslam_blas_repo.pdf
A Tutorial Approach to Simultaneous Localization and Mapping
https://ouster.com/insights/blog/introduction-to-slam-simultaneous-localization-and-mapping
SLAM is an essential piece in robotics that helps robots to estimate their pose – the position and orientation – on the map while creating the map of the environment to carry out autonomous activities.
[英文] What Is SLAM?
https://www.mathworks.com/discovery/slam.html
How it works, types of SLAM algorithms, and getting started
CVPR+
https://cvpr.thecvf.com/
ICCV+
https://iccv.thecvf.com/
ICCV is the premier international computer vision event comprising the main conference and several co-located workshops and tutorials.
相关职位
校招
1. 参与视频AI Deblur算法的设计、训练与优化; 2. 构建大规模模糊视频数据集,完成数据标注与预处理; 3. 跟踪领域前沿技术(如Transformer、扩散模型),探索创新方案; 4. 协助模型在手机端部署与性能调优; 5. 撰写技术文档与论文,推动成果落地至小米核心产品线。 【课题名称】 视频AI Deblur 【课题内容】 研究并开发基于深度学习的视频去模糊算法,解决动态模糊、运动模糊等视频质量退化问题,提升视频清晰度与用户体验。技术方向包括但不限于:时空特征融合、多帧对齐与重建、轻量化模型部署、端到端优化等,目标为实现行业领先的实时视频修复能力。
更新于 2025-06-25
校招
1. 参与相机影像画质增强领域的深度学习或传统算法研发工作,包括但不限于HDR视频增强、颜色复原、影调优化、肤色矫正等任务; 2、结合产品需求,参与算法在芯片上的设计、开发和优化,解决算法产品化过程中的各种技术难题; 3、跟进特定领域的行业进展,并结合产品对算法进行优化,使相关产品效果达到业界领先水平。 【课题名称】 芯片影像画质增强算法研究 【课题内容】 芯片ISP影像画质增强方向,包括但不限于HDR视频增强、颜色复原、影调优化、肤色矫正等任务,探索算法在移动端低功耗的落地方案,以及核心算子硬化、AI和ISP联合设计等关键技术。
更新于 2025-06-26
校招
1. 参与相机影像应用领域的算法研发工作,包括但不限于HDR视频增强、颜色复原、影调优 化、肤色矫正等方向,参与和主导上述模型在自研芯片平台上的设计、开发与优化。 2. 与产品深度沟通,参与新一代手机影像应用类产品的方案设计,并为算法产品化过程中 出现的各类技术难题出谋划策。 3. 跟进对应领域最新行业进展,结合产品规划对算法进行探索与预研。
更新于 2025-07-17