logo of mi

小米多模态算法工程师实习生

实习兼职地点:北京状态:招聘

任职要求


1、计算机相关专业,计算机视觉/机器学习/人工智能相关专业优先;
2、具有良好的计算机视觉机器学习理论基础,熟悉深度学习网络,在计算机视觉某个领域有较深入的研究,包括但不限于图像分割、目标检测、跟踪、视觉大模型、多模态大模型等技术方向,有工业视觉场景相关项目经历优先(例如缺陷检测等);
3、实践动手能力强,有网络设计和优化能力,良好的英文阅读能力,能直接阅读顶会/顶刊文献并实现其中的算法;
4、研究和探索最新的图像算法和技术,不断优化视觉检测算法,提高检测的准确性和效率,完善内部算法平台;

工作职责


1、负责视觉大模型,多模态大模型、缺陷检测、目标检测、图像分割、相关算法的研发和实现,以及在工业场景的落地;
2、负责图像识别核心能力沉淀和产品化建设,多方协同,快速落地;利用计算机视觉和人工智能新技术,改进提升产品性能;
3、负责算法的优化和集成工作,包括边缘设备和云端;
包括英文材料
OpenCV+
机器学习+
深度学习+
大模型+
算法+
相关职位

logo of mi
实习

1、深入调研多模态、计算机视觉和自然语言处理等方向的前沿技术 2、推进视觉信息语义分割与编码的研究,设计自监督学习任务,在大数据上训练较大参数规模模型; 3、探索视觉与语言的语义对齐方法,和多模态多任务联合训练

更新于 2025-03-18
logo of mi
实习

1、负责图像、视频的多模态内容生成工作,应用Transformer、Stable Diffusion等技术赋能核心业务; 2、利用前沿深度学习算法,对图像、视频进行编码、压缩、重建或生成; 3、探索图像和视频的前沿技术,负责算法模型迭代升级。

更新于 2025-04-24
logo of mi
实习

1. 研究语音多模态大模型前沿技术 2. 负责语音多模态模型算法方案研发、迭代与落地应用

更新于 2024-11-14
logo of mi
实习

1、研究语音多模态大模型前沿技术 2、负责语音多模态模型算法方案研发、迭代和落地应用

更新于 2025-07-04