心动TapTap 多模态大模型算法专家(上海)
任职要求
1. 计算机科学、人工智能、电子信息、数学等相关专业; 2. 深入理解深度学习与大模型原理,具备多模态(文本/图像/视频/音频)算法训练经验; 3. 掌握主流多机多卡训练和部署经验,P/D分离技术,包括但不限于Deepspeed、llama factory、SGLang; 5. 具备良好的数学与算法基础,以及创新性问题解决能力。 加分项 - 有游戏相关的多模态内容处理经验(如视频/截图解析、UGC 内容识别、广告素材自动化生成等); - 有社区平台、短视频平台或广告平台的多模态算法落地经验; - 参与过开源多模态项目; -…
工作职责
1. 研发面向游戏平台场景的多模态大模型,包括文本、图像、视频、音频等多模态数据的理解与生成; 2. 构建与优化游戏内容理解算法,涵盖游戏玩法解析、类型识别、特色标签生成、玩家评论分析、剧情/世界观理解等; 3. 参与 TapTap 风格的视频与广告素材生成方案,支持用户增长团队等多模态素材生成的训练需求; 4. 支持游戏搜索与发现,利用多模态大模型进行精准匹配、语义搜索、跨模态检索(文本→视频、视频→游戏等); 5. 跟进并引入最新的多模态大模型研究成果,探索其在游戏行业的新应用场景; 6. 有预研的空间,进行学术研究与论文发表,推动顶会/顶刊产出,并结合业务进行技术落地; 7. 优化大模型的训练与推理性能,保障在海量游戏内容和用户数据上的高效运行。
1. 研发面向游戏平台场景的多模态大模型,包括文本、图像、视频、音频等多模态数据的理解与生成; 2. 构建与优化游戏内容理解算法,涵盖游戏玩法解析、类型识别、特色标签生成、玩家评论分析、剧情/世界观理解等; 3. 参与 TapTap 风格的视频与广告素材生成方案,支持用户增长团队等多模态素材生成的训练需求; 4. 支持游戏搜索与发现,利用多模态大模型进行精准匹配、语义搜索、跨模态检索(文本→视频、视频→游戏等); 5. 跟进并引入最新的多模态大模型研究成果,探索其在游戏行业的新应用场景; 6. 有预研的空间,进行学术研究与论文发表,推动顶会/顶刊产出,并结合业务进行技术落地; 7. 优化大模型的训练与推理性能,保障在海量游戏内容和用户数据上的高效运行。
项目简介 我们在做一套面向创作者与玩家的 AI 驱动 UGC 游戏创作平台:你的加入,将直接决定下一代游戏开发工具的智能化上限。 我们的愿景: 让玩家玩到更多好游戏:帮助游戏行业创作出更多的好游戏 挖掘被埋没的创作者:让有天赋的人零门槛做出第一款游戏 你的使命: Agent 架构设计:负责核心 AI Agent 框架的设计与实现; 垂直领域落地:针对游戏开发场景,开发高性能、高可靠的垂直领域 Agent; 前沿技术转化:跟踪 LLM、多模态、强化学习等领域的前沿发展,并将其转化为能够提升开发者生产力的实际产品功能; 工程性能优化:优化 RAG(检索增强生成)链路及长文本处理能力,确保 AI 响应的实时性与准确性;
简介: 1、我们是谁: 我们搭建了业界领先的广告系统(TapTap 是国内 Top1 的游戏下载和分发平台),正在探索全新的 Agentic 广告平台; 2、你可参与:通过工具、算法探索丰富的广告创意形式,包括图文视频生成、可交互的广告生成等等,并在国内外百亿规模的流量上进行广告投放实战; 3、你所共事:不仅有清、北、复、交、浙大、牛津、斯坦福等名校的毕业生,也有来自腾讯、阿里、字节、Google 等世界一线互联网公司的大牛; 4、你将获得:每日 400-1000 不等的实习薪酬,上班时间灵活机动,各类增长期业务项目深度参与机会(信息高度公开透明)。 1、跟进多模态大模型工业界和研究最新的进展,积极探索新形态的广告创意创作模式; 2、保持极强的好奇心,了解最新的工具,动手参与制作视频、可玩游戏,通过广告投放验证效果; 3、跟进前沿大模型、Agent 相关的技术,尝试构建创意制作子Agent,参与技术调研和验证,协助推动落地。