logo of vivo

vivo多模态大模型算法专家

社招全职3年以上研发类地点:杭州 | 深圳状态:招聘

任职要求


1.	计算机、AI或相关专业硕士及以上学历,或同等工作经验;
2.	5年以上计算机视觉NLP或多模态相关研发经验;
3.	对多模态大模型有深入理解,并具备扎实的微调实践经验;
4.	熟悉图像与视频理解的核心算法和技术;
5.	具备良好的数学功底和独立解决问题的能力;
加分项:
1.	在顶级会议/期刊发表过相关论文;
2.	参与过知名开源多模态大模型项目。

工作职责


1.	负责多模态大模型在图像与视频理解方向的算法研发、优化与部署;
2.	深入研究并实践多模态大模型的微调技术,以适配特定业务场景;
3.	参与构建和优化大规模多模态数据集;
4.	跟踪最新技术进展,不断优化算法性能(精度、效率、泛化能力);
5.	与团队紧密协作,推动算法在产品中的有效落地;
包括英文材料
学历+
OpenCV+
NLP+
大模型+
算法+
相关职位

logo of meituan
社招核心本地商业-基

1.参与视觉大模型、语音大模型研发,探索表征学习和模型架构设计等关键技术; 2.参与跨模态大模型研发,提升模型多模态感知、理解、生成和执行能力; 3.深入调研视觉、语音、文本等模态前沿技术,等提升模型通用智能水平;

更新于 2025-05-09
logo of meituan
社招核心本地商业-基

1.参与视觉大模型、语音大模型研发,探索表征学习和模型架构设计等关键技术; 2.参与跨模态大模型研发,提升模型多模态感知、理解、生成和执行能力; 3.深入调研视觉、语音、文本等模态前沿技术,等提升模型通用智能水平;

更新于 2025-03-14
logo of taptap
社招技术大类

1. 研发面向游戏平台场景的多模态大模型,包括文本、图像、视频、音频等多模态数据的理解与生成; 2. 构建与优化游戏内容理解算法,涵盖游戏玩法解析、类型识别、特色标签生成、玩家评论分析、剧情/世界观理解等; 3. 参与 TapTap 风格的视频与广告素材生成方案,支持用户增长团队等多模态素材生成的训练需求; 4. 支持游戏搜索与发现,利用多模态大模型进行精准匹配、语义搜索、跨模态检索(文本→视频、视频→游戏等); 5. 跟进并引入最新的多模态大模型研究成果,探索其在游戏行业的新应用场景; 6. 有预研的空间,进行学术研究与论文发表,推动顶会/顶刊产出,并结合业务进行技术落地; 7. 优化大模型的训练与推理性能,保障在海量游戏内容和用户数据上的高效运行。

更新于 2025-08-15
logo of xd
社招技术大类

1. 研发面向游戏平台场景的多模态大模型,包括文本、图像、视频、音频等多模态数据的理解与生成; 2. 构建与优化游戏内容理解算法,涵盖游戏玩法解析、类型识别、特色标签生成、玩家评论分析、剧情/世界观理解等; 3. 参与 TapTap 风格的视频与广告素材生成方案,支持用户增长团队等多模态素材生成的训练需求; 4. 支持游戏搜索与发现,利用多模态大模型进行精准匹配、语义搜索、跨模态检索(文本→视频、视频→游戏等); 5. 跟进并引入最新的多模态大模型研究成果,探索其在游戏行业的新应用场景; 6. 有预研的空间,进行学术研究与论文发表,推动顶会/顶刊产出,并结合业务进行技术落地; 7. 优化大模型的训练与推理性能,保障在海量游戏内容和用户数据上的高效运行。

更新于 2025-09-28