logo of mi

小米多模态算法工程师实习生

实习兼职地点:北京状态:招聘

任职要求


1、硕士及以上学历,计算机、人工智能及机器学习等相关专业;
2、有自然语言处理计算机视觉、视频理解等技术背景者优先;
3、有大模型预训练、指令微调或强化学习等项目经验者优先;
4、掌握机器学习深度学习基础知识,熟悉PytorchTensorflow等至少一种深度学习框架,熟悉常用的CV主流网络模型
5、精通PythonC/C++程序设计;
6、有相关方向知名国际会议文章、相关竞赛获奖者优先;

工作职责


1、深入调研多模态、计算机视觉和自然语言处理等方向的前沿技术
2、推进视觉信息语义分割与编码的研究,设计自监督学习任务,在大数据上训练较大参数规模模型;
3、探索视觉与语言的语义对齐方法,和多模态多任务联合训练
包括英文材料
学历+
机器学习+
NLP+
OpenCV+
大模型+
强化学习+
深度学习+
PyTorch+
TensorFlow+
Python+
C+
C+++
相关职位

logo of mi
实习

1、负责视觉大模型,多模态大模型、缺陷检测、目标检测、图像分割、相关算法的研发和实现,以及在工业场景的落地; 2、负责图像识别核心能力沉淀和产品化建设,多方协同,快速落地;利用计算机视觉和人工智能新技术,改进提升产品性能; 3、负责算法的优化和集成工作,包括边缘设备和云端;

更新于 2025-06-12
logo of mi
实习

1、负责图像、视频的多模态内容生成工作,应用Transformer、Stable Diffusion等技术赋能核心业务; 2、利用前沿深度学习算法,对图像、视频进行编码、压缩、重建或生成; 3、探索图像和视频的前沿技术,负责算法模型迭代升级。

更新于 2025-04-24
logo of mi
实习

1. 研究语音多模态大模型前沿技术 2. 负责语音多模态模型算法方案研发、迭代与落地应用

更新于 2024-11-14
logo of mi
实习

1、研究语音多模态大模型前沿技术 2、负责语音多模态模型算法方案研发、迭代和落地应用

更新于 2025-07-04