logo of mi

小米多模态算法工程师实习生

实习兼职地点:北京状态:招聘

任职要求


1、对深度学习算法有一定的理解,包括不限于图像/视频理解、检测、分割、生成等:
2、熟悉常见的机器学习深度学习算法,代码基础扎实,熟练Pytorch框架:
3、对学术前沿有浓厚兴趣,时刻跟进技术前沿,并善于利用各类技术解决复杂的实际问题,有良好的沟通表达能力;

工作职责


1、负责图像、视频的多模态内容生成工作,应用Transformer、Stable Diffusion等技术赋能核心业务;
2、利用前沿深度学习算法,对图像、视频进行编码、压缩、重建或生成;
3、探索图像和视频的前沿技术,负责算法模型迭代升级。
包括英文材料
深度学习+
算法+
机器学习+
PyTorch+
相关职位

logo of mi
实习

1、负责视觉大模型,多模态大模型、缺陷检测、目标检测、图像分割、相关算法的研发和实现,以及在工业场景的落地; 2、负责图像识别核心能力沉淀和产品化建设,多方协同,快速落地;利用计算机视觉和人工智能新技术,改进提升产品性能; 3、负责算法的优化和集成工作,包括边缘设备和云端;

更新于 2025-06-12
logo of mi
实习

1、深入调研多模态、计算机视觉和自然语言处理等方向的前沿技术 2、推进视觉信息语义分割与编码的研究,设计自监督学习任务,在大数据上训练较大参数规模模型; 3、探索视觉与语言的语义对齐方法,和多模态多任务联合训练

更新于 2025-03-18
logo of mi
实习

1. 研究语音多模态大模型前沿技术 2. 负责语音多模态模型算法方案研发、迭代与落地应用

更新于 2024-11-14
logo of mi
实习

1、研究语音多模态大模型前沿技术 2、负责语音多模态模型算法方案研发、迭代和落地应用

更新于 2025-07-04