小米计算机视觉/多模态大模型算法工程师实习生

实习兼职2025-11-11地点：北京状态：招聘

扫码手机上打开

任职要求

1.在CVPR、ICCV、ECCV、NeurIPS、ICML、ICLR等人工智能会议上发表论文者优先。
2.硕士及以上学历（优秀本科生亦可），计算机、电子工程、人工智能等相关专业；
3.具备扎实的机器学习/深…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1.岗位的主要工作内容为跟踪领域前沿研究，将研究成果投稿到机器学习/计算机视觉顶会顶刊。
2.参与多模态大模型（VLM/VLA）的研发与优化，探索图像、文本、语音等跨模态信息的融合方法，以及在自动驾驶领域的应用。
3.研究并实现前沿的技术（如WorldModel,DiffusionModel等），推动项目落地。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

CVPR+

ICCV+

ECCV+

NeurIPS+

ICML+

还有更多 •••

登录查看完整学习资料

相关职位

中/高级计算机视觉算法工程师（多模态大模型）

社招3年以上算法

1. 负责多模态大模型算法研发，针对手持影像开展大模型理解、生成、规划等相关算法系统的设计与研发 2. 负责设计和构建多模态大模型的能力建设关键环节，包括数据生成、自动标注、自动迭代等模块的设计和算法实现 3. 开展跨模块沟通，主导相关多模态大模型的AI功能系统方案的设计、研发与交付。

更新于 2026-05-31深圳|上海

计算机视觉及多模态算法实习生（J94318）

实习ACG

-参与计算机视觉、文档处理分析相关技术研发，包括但不限于OCR文字识别、文档结构化、LLM训推等任务 -参与多模态大模型的算法方案调研、日常训练、微调与效果优化，确保模型训练的稳定性和效果 -支持大模型在各种实际业务中的落地，包括但不限于信息抽取、审查、图表解析等，确保其在真实场景中的有效应用 -参与大模型的日常评估和开发工作，推动其持续改进和性能提升，提高训练和推理效率 -与团队成员紧密合作，协同解决开发过程中遇到的问题和技术挑战

更新于 2025-09-29成都

蚂蚁数字科技-计算机视觉及多模态算法工程师

校招日常实习

一句话描述：参与CV、及多模态核心算法研发，涉及视觉对抗、多模态智能体的深度创新和产品应用。团队成员皆来源于国内外知名高校和企业，并在CVPR、ICCV、ACM MM等顶级会议发表多篇学术论文，鼓励发表前沿学术论文和工程落地，具有业界一流的实习生待遇； 1. 负责多模态大语言模型（MLLM）图文对齐，富文本图像理解，视觉问答（VQA)等领域的前沿研究； 2. 深入金融等垂类行业，在具体业务场景探索多模态大模型（MLLM）与智能体（Agent）前沿应用如GUI Agent、Chart/DocVQA、OCR-free与OCR融合理解； 3. 在导师指导下发表前沿学术论文，撰写专利。

杭州

计算机视觉高级工程师（多模态）

社招3-5年

* 针对物流垂域场景进行深入的视觉研发，主要是面向小样本/零样本场景目标的检测 * 负责将大模型能力蒸馏到轻量化学生模型（YOLO 系），落地在边缘端，达成精度-延迟-功耗平衡 * 搭建检测训练与评估流水线：数据清洗/去重、标注规范、数据集版本化，指标包含 mAP、召回率 * 构建半监督/弱监督训练链路，并与业务无标数据结合，提升域内泛化

更新于 2026-03-31深圳