
商汤多模态理解生成见习算法研究员
社招全职算法研究地点:北京 | 上海 | 深圳状态:招聘
任职要求
1.扎实的理论基础: 计算机科学、人工智能、电子工程等相关专业在读硕士或博士生,对机器学习、深度学习有深入理解,熟悉Transformer等核心模型,以及基本的数学知识和编程能力。
2.强烈的探索精…登录查看完整任职要求
微信扫码,1秒登录
工作职责
1.多模态理解与生成算法研究: 紧跟领域前沿,深入研究多模态(图像、文本、视频)的理解与生成统一的核心算法。 2.模型设计与优化: 负责多模态理解与生成模型的设计、训练、评估和优化,不断提升模型性能和泛化能力。 3.创新技术探索: 探索新的预训练和后训练范式,发现和解决大模型靠单一模态难以解决的问题。
包括英文材料
机器学习+
https://www.youtube.com/watch?v=0oyDqO8PjIg
Learn about machine learning and AI with this comprehensive 11-hour course from @LunarTech_ai.
https://www.youtube.com/watch?v=i_LwzRVP7bg
Learn Machine Learning in a way that is accessible to absolute beginners.
https://www.youtube.com/watch?v=NWONeJKn6kc
Learn the theory and practical application of machine learning concepts in this comprehensive course for beginners.
https://www.youtube.com/watch?v=PcbuKRNtCUc
Learn about all the most important concepts and terms related to machine learning and AI.
还有更多 •••
相关职位

实习算法研究
工作职责1.多模态理解与生成算法研究: 紧跟领域前沿,深入研究多模态(图像、文本、视频)的理解与生成统一的核心算法。 2.模型设计与优化: 负责多模态理解与生成模型的设计、训练、评估和优化,不断提升模型性能和泛化能力。 3.创新技术探索: 探索新的预训练和后训练范式,发现和解决大模型靠单一模态难以解决的问题。 :
更新于 2025-12-09北京|上海|深圳
实习核心本地商业-基
多模态理解与生成能力是大模型实现通用人工智能的核心基石之一,涵盖了跨视觉、语言等多种模态的信息处理与创造。本课题致力于探索统一的多模态大模型架构,打通理解与生成之间的壁垒,研究如何在单一模型框架下实现对多模态信息的深度理解与高质量生成,从而构建具备更强泛化能力和创造性的通用人工智能大模型。 研究内容: 1)视觉表征研究:不同规模和训练范式的视觉基座预训练,模型结构探索和选型,开发更适合于多模态大模型的视觉基座。 2)理解生成统一:面向不同的多模态架构和训练范式,从视觉基座的角度深入探索视觉连续表征和离散表征的联系和区别,探索更具通用性的多模态特征。 3)视频多模态能力提升:探索短视频、长视频、视频流等不同形态的视频多模态方案,探究图像、视频统一的多模态解决方案。 4)高效和轻量化模型构建:探索适合轻量化多模态任务的模型架构,通过参数共享、模块化设计等手段,在不显著降低性能的前提下减少模型参数量和计算复杂度。
更新于 2025-05-23北京|上海|深圳

校招算法研究类
1. 多模态理解与生成算法研究: 紧跟领域前沿,深入研究多模态(图像、文本、视频)的理解与生成统一的核心算法; 2. 模型设计与优化: 负责多模态理解与生成模型的设计、训练、评估和优化,不断提升模型性能和泛化能力; 3. 创新技术探索: 探索新的预训练和后训练范式,发现和解决大模型靠单一模态难以解决的问题。
更新于 2025-08-21北京|上海|深圳