理想汽车视觉大模型算法实习生

实习兼职算法地点：北京状态：招聘

扫码手机上打开

任职要求

1. 硕士及以上学历，计算机、人工智能或电子信息相关专业，博士优先；
2. 对计算机视觉中异常检测、目标检测及语义/实例分割等方向有深入研究；
3. 熟悉多模态/视觉预训练模型，如CLIP、BLIP、DINO等，有预训练或下游任务微调经验者优先；
4. 对vllm领域前沿模型有一定了解，包括但不限于QwenVL、Deepsee…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

1. 负责工业视觉垂域下视觉大模型的模型研发工作，包括但不限于多模态或视觉预训练模型的下游任务微调、异常检测算法研究、目标检测/分割算法研究等；
2. 负责视觉语言大模型（vllm）在工业视觉领域应用的探索，包括但不限于大模型sft、强化学习微调算法研究等；
3. 跟进计算机视觉及多模态领域前沿工作，协助整理形成高质量论文。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

OpenCV+

vLLM+

PyTorch+

还有更多 •••

登录查看完整学习资料

相关职位

多模态大模型算法实习生

实习

1.参与视觉大语言模型(VLM)算法的研究和落地，提升手机汽车等设备的多模态交互体验。 2.参与UIAgent、屏幕理解场景下的数据合成与质量提升，探索数据配比的前沿技术。

更新于 2025-02-19北京

多模态大模型算法实习生

实习

更新于 2025-08-21北京

大模型算法实习生-视觉

实习算法

1. 负责工业视觉垂域下视觉大模型的模型研发工作，包括但不限于多模态或视觉预训练模型的下游任务微调、异常检测算法研究、目标检测/分割算法研究等； 2. 负责视觉语言大模型（VLM）在工业视觉领域应用的探索，包括但不限于大模型sft、强化学习微调算法研究等； 3. 跟进计算机视觉及多模态领域前沿工作，协助整理形成高质量论文。

北京

大模型算法实习生

实习核心本地商业-基

参与语言大模型、视觉大模型、语音大模型、多模态大模型的评测与研究工作，具体工作内容包括但不限于： 1、从大模型应用视角出发，建设科学、全面的大模型评测体系，制定并实施评测标准与评测方案。 2、开发算法对数据进行处理、理解，建设高质量数据pipeline，并基于科学、全面的评估体系构建数据集，系统评估模型能力，产出评测报告，指引大模型相应能力的提升。 3、开发算法，利用大模型辅助、替代人工标注，准确、高效的进行半自动化、自动化的模型评测，降低评测成本、提升评测效率。 4、对模型评测中发现的模型能力短板、模型能力变化、不符合认知的异常进行研究分析，产出研究分析结论，指引大模型相应能力的提升。具体研究项包括不限于数据、模型结构、训练方式对各类模型能力的影响，以数据相关研究为例，包括不限于研究不同数据类型、不同数据配比、不同数据加入时机、不同数据规模等变量对各类模型能力的影响。 5、紧密关注大模型方向的前沿技术进展，积极主动地学习和探索新数据分析、模型训练以及模型评测方法。 6、紧密关注大模型应用落地的行业最新进展，结合行业进展思考大模型评测、训练的发展趋势，对模型评测体系、机制进行迭代。

更新于 2025-03-18上海