蚂蚁金服研究型实习生-多模态大模型在商品领域的优化与应用研究
任职要求
研究领域: -目前正在攻读计算机科学或相关STEM领域的学士,硕士或博士学位 -具有一种或多种通用编程语言的经验,包括但不限于: Java,C/C ++ 、Python、JavaScript或Go -具有上述研究领域的…
工作职责
研究领域: 深度学习 项目简介: 在商品领域风险/质量防控、信息抽取、素材优化、营销文案生成和人货匹配推荐等多个场景都依赖对商品的认知,传统的方法需要运营人工定义标签体系并收集大量的标注数据,多模态大模型可以在较少的人力投入和标注成本下实现更好的商品理解和生成,有很大的应用前景。
希望解决如下技术问题。 1、适用于商品视频生成的文本-视频数据集:构建一个能够支持基于多模态大模型的商品视频生成算法训练和优化的文本-视频数据集 2. 基于多模态大模型的商品视频生成系统:通过探索基于多模态大模型的文本到视频生成技术,以“视频关键帧-高帧率视频-高分辨率视频”为基本路径,完成文本到视频关键帧生成模型、视频插帧模型、视频超分辨率生成模型等核心算法模型,构建视频生成系统,实现输入商品描述文本+商品图片,自动生成原生化的商品微视频和商品短视频。
我们是阿里妈妈搜索广告算法团队,负责淘宝搜索场景广告技术变现的算法设计和优化,包括并不限于: 1. 负责研究多模态大模型在淘宝海量图文、视频物料理解上的运用; 2. 负责研究生成式大模型/AIGC算法在广告投放物料挖掘上的运用; 3. 负责研究多模态大模型和生成式大模型在搜索广告中的全链路运用和升级; 4. 负责研究搜索广告场景下多物料投放算法的设计和优化,包含商品、直播、短视频等; 5. 负责研究超大规模多模态大模型的训练和推理加速; 6. 负责研究经典CV/多模态任务的设计和优化,包括分类、检测、OCR、度量学习等。
我们是阿里妈妈搜索广告算法团队,负责淘宝搜索场景广告技术变现的算法设计和优化,包括并不限于: 1. 负责研究多模态大模型在淘宝海量图文、视频物料理解上的运用; 2. 负责研究生成式大模型/AIGC算法在广告投放物料挖掘上的运用; 3. 负责研究多模态大模型和生成式大模型在搜索广告中的全链路运用和升级; 4. 负责研究搜索广告场景下多物料投放算法的设计和优化,包含商品、直播、短视频等; 5. 负责研究超大规模多模态大模型的训练和推理加速; 6. 负责研究经典CV/多模态任务的设计和优化,包括分类、检测、OCR、度量学习等。
随着大语言模型(LLM)在搜推广领域的深入应用,如何高效地将海量商品/内容信息与世界知识结合,成为突破推荐算法上限的关键。 本岗位重点探索生成式推荐中的核心基础设施——语义ID(Semantic ID)的构建。致力于解决现有ID体系维度单一、表达受限的问题,探索语义ID更丰富的兴趣表达。 具体职责: 1. 前沿跟进:研究生成式推荐前沿技术,快速跟进RecSys/KDD/SIGIR/ACL等顶会最新论文,探索语义ID与LLM的更佳的应用范式,并且在实际业务数据上验证。 2. 多兴趣表征:深入研究协同&多模态语义协作机制,探索多兴趣表征构建,,解决多维兴趣样本在训练过程中的Loss拉扯问题,探索基于图或对比学习等改进方案,构建更稳健的Item-to-Token映射机制。 3. 多兴趣语义ID:突破现有层级化方案(如RQ-VAE/RQ-Kmeans)仅能进行单一维度(如类目或单兴趣)表达的局限,将多兴趣表征进行量化。 4. 生成式LLM赋能:将构建的多兴趣语义ID应用于推荐场景的生成式大模型(LLM)训练中,降低训练/推理成本,提升模型对用户复杂行为序列的理解与生成能力。 5. 技术沉淀:负责实验数据的分析与整理,撰写技术报告;若产出具有创新性的研究成果,支持以第一作者身份发表顶级会议论文或申请专利。