美团多模态大模型算法专家
任职要求
1.熟练掌握Pytorch等深度学习框架,Python编程语言; 2.熟悉大模型相关算法,并具备相应的项目实践经验; 3.对前沿技术有强烈的探索欲,有出色的团队协作精神; 4.发表过领域顶级会议文章(NeurIPS、ICML、ICLR、ACL、Interspeech、ICASSP等)、ACM竞赛获奖者优先。 具备以下条件优先 1. 曾主导多模态相关项目的研发; 2. 具备深度学习训练平台或推理引擎研发经验; 3. 在国际顶会或期刊发表相关论文。
工作职责
1.参与视觉大模型、语音大模型研发,探索表征学习和模型架构设计等关键技术; 2.参与跨模态大模型研发,提升模型多模态感知、理解、生成和执行能力; 3.深入调研视觉、语音、文本等模态前沿技术,等提升模型通用智能水平;
1.参与视觉大模型、语音大模型研发,探索表征学习和模型架构设计等关键技术; 2.参与跨模态大模型研发,提升模型多模态感知、理解、生成和执行能力; 3.深入调研视觉、语音、文本等模态前沿技术,等提升模型通用智能水平;
1. 负责多模态大模型在图像与视频理解方向的算法研发、优化与部署; 2. 深入研究并实践多模态大模型的微调技术,以适配特定业务场景; 3. 参与构建和优化大规模多模态数据集; 4. 跟踪最新技术进展,不断优化算法性能(精度、效率、泛化能力); 5. 与团队紧密协作,推动算法在产品中的有效落地;
1. 研发面向游戏平台场景的多模态大模型,包括文本、图像、视频、音频等多模态数据的理解与生成; 2. 构建与优化游戏内容理解算法,涵盖游戏玩法解析、类型识别、特色标签生成、玩家评论分析、剧情/世界观理解等; 3. 参与 TapTap 风格的视频与广告素材生成方案,支持用户增长团队等多模态素材生成的训练需求; 4. 支持游戏搜索与发现,利用多模态大模型进行精准匹配、语义搜索、跨模态检索(文本→视频、视频→游戏等); 5. 跟进并引入最新的多模态大模型研究成果,探索其在游戏行业的新应用场景; 6. 有预研的空间,进行学术研究与论文发表,推动顶会/顶刊产出,并结合业务进行技术落地; 7. 优化大模型的训练与推理性能,保障在海量游戏内容和用户数据上的高效运行。
1. 研发面向游戏平台场景的多模态大模型,包括文本、图像、视频、音频等多模态数据的理解与生成; 2. 构建与优化游戏内容理解算法,涵盖游戏玩法解析、类型识别、特色标签生成、玩家评论分析、剧情/世界观理解等; 3. 参与 TapTap 风格的视频与广告素材生成方案,支持用户增长团队等多模态素材生成的训练需求; 4. 支持游戏搜索与发现,利用多模态大模型进行精准匹配、语义搜索、跨模态检索(文本→视频、视频→游戏等); 5. 跟进并引入最新的多模态大模型研究成果,探索其在游戏行业的新应用场景; 6. 有预研的空间,进行学术研究与论文发表,推动顶会/顶刊产出,并结合业务进行技术落地; 7. 优化大模型的训练与推理性能,保障在海量游戏内容和用户数据上的高效运行。