小米多模态模型算法工程师实习生

实习兼职2025-12-29地点：北京状态：招聘

扫码手机上打开

任职要求

1、熟练掌握深度学习基础知识，对视觉感知算法/多模态大模型等方向有相关研究背景；
2、熟悉常见多模态模型框架，包括但不限于Qwen-VL系列、LLAVA系列等，熟悉多模态模型预训练与后训练；
3、能够熟练使用pyt…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1、调研多模态大模型等领域的前沿算法，并进行评测，给出研究报告和知识体系建设；
2、完成多模态大模型的基模预训练与后训练等工作
3、辅助完成数据采集/数据（自动）标注/模型训练评测等相关工作和流程搭建；
4、完成多模态大模型相关领域的论文，并在计算机视觉类的会议投递发表。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

深度学习+

算法+

大模型+

还有更多 •••

登录查看完整学习资料

相关职位

语音多模态算法工程师实习生

实习

1. 研究语音多模态大模型前沿技术 2. 负责语音多模态模型算法方案研发、迭代与落地应用

更新于 2024-11-14北京

语音多模态算法工程师实习生

实习

1、研究语音多模态大模型前沿技术 2、负责语音多模态模型算法方案研发、迭代和落地应用

更新于 2025-07-04北京

自动驾驶大模型算法工程师实习生

实习

该职位专注于自动驾驶场景下多模态大模型（VLA：Vision-Language-Action）的工程化落地，你将有机会在千万级数据上实车验证关于自动驾驶VLA的最新想法：多模态模型工程化部署：结合视觉、语言与行为动作的联合建模机制，优化多模态模型的推理效率，支持自动驾驶系统的实时应用；实车测试与性能验证：参与自动驾驶场景中的模型测试与性能评估，设计测试案例，分析模型在实际驾驶环境中的响应能力与行为决策效果；数据采集与处理：负责多模态数据（视觉、语言、行为）的采集、标注与处理，构建高质量数据 pipeline，优化数据流的实时性与稳定性；模型优化与轻量化：探索模型蒸馏、小样本泛化等技术，提升模型在自动驾驶复杂场景中的部署效率与资源利用率；系统集成与技术支持：协助完成多模态模型与自动驾驶系统的集成测试，解决工程化落地过程中的技术问题；技术文档与成果转化：撰写工程化技术文档，总结实车测试经验，参与技术报告、专利申请或产品转化工作。

更新于 2025-08-18北京

自动驾驶大模型算法工程师实习生

实习

更新于 2025-08-25北京