logo of liauto

理想汽车视觉大模型算法实习生

实习兼职算法地点:北京状态:招聘

任职要求


1. 硕士及以上学历,计算机、人工智能或电子信息相关专业,博士优先;
2. 对计算机视觉中异常检测、目标检测及语义/实例分割等方向有深入研究;
3. 熟悉多模态/视觉预训练模型,如CLIP、BLIP、DINO等,有预训练或下游任务微调经验者优先;
4. 对vllm领域前沿模型有一定了解,包括但不限于QwenVL、Deepsee…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


1. 负责工业视觉垂域下视觉大模型的模型研发工作,包括但不限于多模态或视觉预训练模型的下游任务微调、异常检测算法研究、目标检测/分割算法研究等;
2. 负责视觉语言大模型(vllm)在工业视觉领域应用的探索,包括但不限于大模型sft、强化学习微调算法研究等;
3. 跟进计算机视觉及多模态领域前沿工作,协助整理形成高质量论文。
包括英文材料
学历+
OpenCV+
vLLM+
PyTorch+
还有更多 •••
相关职位

logo of mi
实习

1.参与视觉大语言模型(VLM)算法的研究和落地,提升手机汽车等设备的多模态交互体验。 2.参与UIAgent、屏幕理解场景下的数据合成与质量提升,探索数据配比的前沿技术。

更新于 2025-02-19北京
logo of mi
实习

1.参与视觉大语言模型(VLM)算法的研究和落地,提升手机汽车等设备的多模态交互体验。 2.参与UIAgent、屏幕理解场景下的数据合成与质量提升,探索数据配比的前沿技术。

更新于 2025-08-21北京
logo of liauto
实习算法

1. 负责工业视觉垂域下视觉大模型的模型研发工作,包括但不限于多模态或视觉预训练模型的下游任务微调、异常检测算法研究、目标检测/分割算法研究等; 2. 负责视觉语言大模型(VLM)在工业视觉领域应用的探索,包括但不限于大模型sft、强化学习微调算法研究等; 3. 跟进计算机视觉及多模态领域前沿工作,协助整理形成高质量论文。

北京
logo of meituan
实习核心本地商业-基

参与语言大模型、视觉大模型、语音大模型、多模态大模型的评测与研究工作,具体工作内容包括但不限于: 1、从大模型应用视角出发,建设科学、全面的大模型评测体系,制定并实施评测标准与评测方案。 2、开发算法对数据进行处理、理解,建设高质量数据pipeline,并基于科学、全面的评估体系构建数据集,系统评估模型能力,产出评测报告,指引大模型相应能力的提升。 3、开发算法,利用大模型辅助、替代人工标注,准确、高效的进行半自动化、自动化的模型评测,降低评测成本、提升评测效率。 4、对模型评测中发现的模型能力短板、模型能力变化、不符合认知的异常进行研究分析,产出研究分析结论,指引大模型相应能力的提升。具体研究项包括不限于数据、模型结构、训练方式对各类模型能力的影响,以数据相关研究为例,包括不限于研究不同数据类型、不同数据配比、不同数据加入时机、不同数据规模等变量对各类模型能力的影响。 5、紧密关注大模型方向的前沿技术进展,积极主动地学习和探索新数据分析、模型训练以及模型评测方法。 6、紧密关注大模型应用落地的行业最新进展,结合行业进展思考大模型评测、训练的发展趋势,对模型评测体系、机制进行迭代。

更新于 2025-03-18上海