小米新业务部-多媒体AI算法工程师
社招全职2年以上P0751地点:北京 | 上海状态:招聘
任职要求
1. 从事图像处理、计算机视觉、深度学习、AI芯片等两个或以上相关领域工作经验,有2年或以上的工作经验,主导或者作为主要参与者; 2. 精通Tensorflow,Pytorch,MXNet,Caffe等框架之一,对神经网络结构自搜索及压缩、性能优化、训练和调参等有丰富开发调试经验; 3. 有多媒体芯片开发背景或系统方案开发经验者优先; 4. 参加过完整算法特性的设计和商用落地者优先
工作职责
1. 基于深度学习的Low Level算法(如降噪、Demosaic、超分辨率、插帧等)、High Level算法(如目标检测、语义分割、显著性检测、深度估计等)、大模型技术(LLM、AIGC、多模态等)的研发与探索 2. 上述方向的模型优化工作,包括但不限于模型量化、剪枝、稀疏化、结构搜索(NAS) 3. 负责效果,功能原型设计,并支撑算法在各应用场景的商用落地; 4. 与系统架构,软件,IC设计/验证,调试工程师共同完成相应多媒体IP 实现方案的开发工作;
包括英文材料
图像处理+
https://opencv.org/blog/computer-vision-and-image-processing/
This fascinating journey involves two key fields: Computer Vision and Image Processing.
https://www.geeksforgeeks.org/python/image-processing-in-python/
Image processing involves analyzing and modifying digital images using computer algorithms.
https://www.youtube.com/watch?v=kSqxn6zGE0c
In this Introduction to Image Processing with Python, kaggle grandmaster Rob Mulla shows how to work with image data in python!
OpenCV+
https://learnopencv.com/getting-started-with-opencv/
At LearnOpenCV we are on a mission to educate the global workforce in computer vision and AI.
https://opencv.org/university/free-opencv-course/
This free OpenCV course will teach you how to manipulate images and videos, and detect objects and faces, among other exciting topics in just about 3 hours.
深度学习+
https://d2l.ai/
Interactive deep learning book with code, math, and discussions.
TensorFlow+
https://www.youtube.com/watch?v=tpCFfeUEGs8
Ready to learn the fundamentals of TensorFlow and deep learning with Python? Well, you’ve come to the right place.
https://www.youtube.com/watch?v=ZUKz4125WNI
This part continues right where part one left off so get that Google Colab window open and get ready to write plenty more TensorFlow code.
PyTorch+
https://datawhalechina.github.io/thorough-pytorch/
PyTorch是利用深度学习进行数据科学研究的重要工具,在灵活性、可读性和性能上都具备相当的优势,近年来已成为学术界实现深度学习算法最常用的框架。
https://www.youtube.com/watch?v=V_xro1bcAuA
Learn PyTorch for deep learning in this comprehensive course for beginners. PyTorch is a machine learning framework written in Python.
算法+
https://roadmap.sh/datastructures-and-algorithms
Step by step guide to learn Data Structures and Algorithms in 2025
https://www.hellointerview.com/learn/code
A visual guide to the most important patterns and approaches for the coding interview.
https://www.w3schools.com/dsa/
相关职位
社招2年以上P5658
1)负责其中一门多媒体(AI,ISP/CV/AR,显示,音频,编解码或SensorHub)数字信号处理 IP 设计工作;2)结合算法,系统架构,SOC和IC验证工程部的需求,完成相应多媒体IP 的集成和验证工作;3)参与研发性能和功耗分析及优化工作。
更新于 2023-01-31
社招6年以上S9331
1.负责多媒体在手机、平板、车机中的场景分析与架构设计 (1)熟悉并参与多媒体领域的架构设计(ISP/AI/Display/Video Codec/Audio/CV等) (2)负责多媒体跨领域IP间的的架构规划及讨论 2.多媒体系统性能及低功耗方向 (1)评估并拉通多媒体各领域IP及多媒体子系统的带宽,频率、电压 (2)评估并拉通多媒体子系统内部总线、以及与SoC间的总线接口 3.多媒体芯片安全架构方向 (1)熟悉手机安全业务,包括安全启动、人脸识别、指纹识别、版权码流播放等;了解trustzone,TEE等概念 (2)熟悉多媒体IP(ISP/NPU/VCodec/Display)在安全模式下的架构需求以及数据流需求 (3)熟悉手机SoC的整体安全架构、鉴权体系 (4)有虚拟化设计,包括硬隔离、半虚拟化等方案经验更优 (5)有车规安全的IP设计规范的方案经验更优
更新于 2023-01-31
社招3年以上T1667
主要工作内容: 1. 基于LLVM框架进行自研NPU ISA后端开发与性能优化; 2. 针对自研NPU算子编程语言进行编译后端开发与优化; 3. 协同DDK和硬件团队进行用例联调; 4. 负责LLVM编译器及相关工具链开发;
更新于 2023-09-14