logo of meituan

美团多模态大模型算法专家

社招全职核心本地商业-基础研发平台地点:北京 | 上海 | 深圳状态:招聘

任职要求


1.熟练掌握Pytorch深度学习框架,Python编程语言;
2.熟悉大模型相关算法,并具备相应的项目实践经验;
3.对前沿技术有强烈的探索欲,有出色的团队协作精神;
4.发表过领域顶级会议文章(NeurIPSICMLICLR、ACL、Interspeech、ICASSP等)、ACM竞赛获奖者优先。

具备以下条件优先
1. 曾主导多模态相关项目的研发;
2. 具备深度学习训练平台或推理引擎研发经验;
3. 在国际顶会或期刊发表相关论文。

工作职责


1.参与视觉大模型、语音大模型研发,探索表征学习和模型架构设计等关键技术;
2.参与跨模态大模型研发,提升模型多模态感知、理解、生成和执行能力;
3.深入调研视觉、语音、文本等模态前沿技术,等提升模型通用智能水平;
包括英文材料
PyTorch+
深度学习+
Python+
大模型+
算法+
NeurIPS+
ICML+
推理引擎+
相关职位

logo of meituan
社招核心本地商业-基

1.参与视觉大模型、语音大模型研发,探索表征学习和模型架构设计等关键技术; 2.参与跨模态大模型研发,提升模型多模态感知、理解、生成和执行能力; 3.深入调研视觉、语音、文本等模态前沿技术,等提升模型通用智能水平;

更新于 2025-05-09
logo of vivo
社招3年以上研发类

1. 负责多模态大模型在图像与视频理解方向的算法研发、优化与部署; 2. 深入研究并实践多模态大模型的微调技术,以适配特定业务场景; 3. 参与构建和优化大规模多模态数据集; 4. 跟踪最新技术进展,不断优化算法性能(精度、效率、泛化能力); 5. 与团队紧密协作,推动算法在产品中的有效落地;

更新于 2025-08-05
logo of taptap
社招技术大类

1. 研发面向游戏平台场景的多模态大模型,包括文本、图像、视频、音频等多模态数据的理解与生成; 2. 构建与优化游戏内容理解算法,涵盖游戏玩法解析、类型识别、特色标签生成、玩家评论分析、剧情/世界观理解等; 3. 参与 TapTap 风格的视频与广告素材生成方案,支持用户增长团队等多模态素材生成的训练需求; 4. 支持游戏搜索与发现,利用多模态大模型进行精准匹配、语义搜索、跨模态检索(文本→视频、视频→游戏等); 5. 跟进并引入最新的多模态大模型研究成果,探索其在游戏行业的新应用场景; 6. 有预研的空间,进行学术研究与论文发表,推动顶会/顶刊产出,并结合业务进行技术落地; 7. 优化大模型的训练与推理性能,保障在海量游戏内容和用户数据上的高效运行。

更新于 2025-08-15
logo of xd
社招技术大类

1. 研发面向游戏平台场景的多模态大模型,包括文本、图像、视频、音频等多模态数据的理解与生成; 2. 构建与优化游戏内容理解算法,涵盖游戏玩法解析、类型识别、特色标签生成、玩家评论分析、剧情/世界观理解等; 3. 参与 TapTap 风格的视频与广告素材生成方案,支持用户增长团队等多模态素材生成的训练需求; 4. 支持游戏搜索与发现,利用多模态大模型进行精准匹配、语义搜索、跨模态检索(文本→视频、视频→游戏等); 5. 跟进并引入最新的多模态大模型研究成果,探索其在游戏行业的新应用场景; 6. 有预研的空间,进行学术研究与论文发表,推动顶会/顶刊产出,并结合业务进行技术落地; 7. 优化大模型的训练与推理性能,保障在海量游戏内容和用户数据上的高效运行。

更新于 2025-09-28