美团【基座大模型北斗实习】多模态大模型技术研究
实习兼职核心本地商业-基础研发平台地点:北京 | 上海 | 深圳状态:招聘
任职要求
1、具备视觉多模态大模型的预训练或后训练研究经历; 2、熟悉PyTorch,有充分的动手实践经验。 加分项: 1、社区影响力:在多模态大模…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
简介:参与多模态大模型方向的前沿研究,可根据个人背景和研究兴趣选择以下方向之一深入推进: 1、多模态预训练与后训练技术创新,提升模型在 OCR、文档图表解析、Visual Grounding、细粒度感知、视觉问答等核心任务上的能力上限。 2、多模态强化学习方案设计,实现视觉感知与多模态理解场景下的高性能可信输出与幻觉抑制。 3、视觉推理能力增强研究(Visual CoT、PRM 等),提升模型在复杂视觉任务上的推理深度。 4、工具调用与 Agent 能力构建,探索多模态模型在规划决策场景中的综合表现。 5、长上下文视觉理解与 GUI 能力研究,提升模型在长程复杂任务上的综合能力。 6、其他你坚信路线正确的多模态大模型前沿方向。
包括英文材料
大模型+
https://www.youtube.com/watch?v=xZDB1naRUlk
You will build projects with LLMs that will enable you to create dynamic interfaces, interact with vast amounts of text data, and even empower LLMs with the capability to browse the internet for research papers.
https://www.youtube.com/watch?v=zjkBMFhNj_g
PyTorch+
https://datawhalechina.github.io/thorough-pytorch/
PyTorch是利用深度学习进行数据科学研究的重要工具,在灵活性、可读性和性能上都具备相当的优势,近年来已成为学术界实现深度学习算法最常用的框架。
https://www.youtube.com/watch?v=V_xro1bcAuA
Learn PyTorch for deep learning in this comprehensive course for beginners. PyTorch is a machine learning framework written in Python.
还有更多 •••