小米多模态算法工程师实习生

实习兼职2025-03-18地点：北京状态：招聘

扫码手机上打开

1、硕士及以上学历，计算机、人工智能及机器学习等相关专业；
2、有自然语言处理、计算机视觉、视频理解等技术背景者优先；
3、有大模型预训练、指令微调或强化学习等项目经验者优先；
4、掌握机器学习和深度…

微信扫码，1秒登录

1、深入调研多模态、计算机视觉和自然语言处理等方向的前沿技术
2、推进视觉信息语义分割与编码的研究，设计自监督学习任务，在大数据上训练较大参数规模模型；
3、探索视觉与语言的语义对齐方法，和多模态多任务联合训练

难度：

包括英文材料

学历+

机器学习+

NLP+

OpenCV+

大模型+

强化学习+

还有更多 •••

相关职位

实习

1、负责视觉大模型，多模态大模型、缺陷检测、目标检测、图像分割、相关算法的研发和实现，以及在工业场景的落地； 2、负责图像识别核心能力沉淀和产品化建设，多方协同，快速落地；利用计算机视觉和人工智能新技术，改进提升产品性能； 3、负责算法的优化和集成工作，包括边缘设备和云端；

更新于 2025-06-12北京

实习

1、负责图像、视频的多模态内容生成工作，应用Transformer、Stable Diffusion等技术赋能核心业务; 2、利用前沿深度学习算法，对图像、视频进行编码、压缩、重建或生成; 3、探索图像和视频的前沿技术，负责算法模型迭代升级。

更新于 2025-04-24北京

实习

1. 支持组里视频理解业务。 2. 有机会参与顶会论文发表，产出有影响的成果。

更新于 2025-12-22北京

实习

1. 研究语音多模态大模型前沿技术 2. 负责语音多模态模型算法方案研发、迭代与落地应用

更新于 2024-11-14北京