蚂蚁金服研究型实习生-搜广推领域CTR模型多模态联合建模
任职要求
研究领域: -目前正在攻读计算机科学或相关STEM领域的学士,硕士或博士学位 -具有一种或多种通用编程语言的经验,包括但不限于: Java,C/C ++ 、Python、JavaScript或Go -具有上述研究领域的相关经验,包括行业经验或作为参与实验室研究 优先录用: -对技术研究充满热情,具有产生新思想和创新的能力; 在自学,问题分析和解决方面表现出色 -在国际会议上或核心期刊发表一份或多份出版物或论文 -至少3个月的全职工作
工作职责
研究领域: 人工智能 项目简介: 大语言模型(LLM)和多模态大模型(MMLM)的发展为推荐系统带来了新的生机。相较于传统推荐模型依赖协同过滤信息进行建模,大语言模型因其强大的泛化和推理能力,可以更好地对物品、内容进行关联、分析用户行为和偏好,从而具备处理复杂场景中复杂用户行为的潜力。但同时,虽然大语言模型在理解和生成自然语言方面表现出色,但它们在处理推荐系统中数据稀疏、特征异构、训练和部署效率等方面仍存在众多挑战。本项目旨在对传统推荐模型、大语言模型甚至多模态大模型进行联合建模,以期取长补短,更有效地利用多模态异构信息,从而进一步提升推荐模型表现。 主要的挑战包括但不限于: 1. 大语言模型的编码效率问题:LLM的训练及推理成本随编码的信息量增加而快速膨胀,如何高效地对长用户行为序列进行多模态编码是联合建模相关探索的基础问题。 2. 多模态信息融合问题:物品、内容存在大量不同模态且异构的信息,如何有效地对多模态信息进行融合,是保障联合建模效果的重要问题。 3. 联合建模的模态差异化优化问题:不同模态在拟合速度、信息权重等方面存在天然差异,如何在联合建模过程中平衡和调节不同模块的优化是联合建模的难点。
团队介绍:我们团队有着轻松的团队环境,可以就自己和公司感兴趣的方向进行充分的技术探索;我们团队的人才密度高,可以提供充分的研发指导,并且进行自由的学术交流。 职位描述: 1 、围绕高德的相关业务场景,进行大模型相关的研发,不限于预训练、SFT、RL、多模态、Agent等。 2、与团队合作,将研究成果转化为实际的产品功能。
1.跟进和研发大规模语言模型(LLM)的预训练、持续训练、SFT、RLHF 等技术; 2.大语言模型应用在大淘宝推荐场景的落地,包括逻辑推理、智能内容理解、商品创意生成等; 3.建立新一代认知推荐算法体系,结合交互式推荐的产品创新,提升用户体验和首页推荐的长期价值; 4.结合以上方向的探索和研究,撰写发表论文,和业界、学术界保持良好的交流。
我们是淘天集团淘宝用户算法团队,致力于通过外投广告、商品推荐、权益激励与消息触达等,全面提升淘宝用户的增长效率与长期价值。团队聚焦用户全生命周期管理,以算法驱动精细化运营,持续优化获客效率、增量GMV与用户LTV。 在权益策略场景中,传统模型面临选择性偏差、高噪声干扰、多场景异构等挑战,难以准确识别微弱增量信号。为此,我们正在构建下一代因果Transformer框架。 你将承担以下核心职责: 1. 增量建模与因果推断:深入解决观测数据中的选择偏差与时变混杂问题,基于淘天用户特征体系,提升权益效果的归因准确性; 2. 算法创新与模型研发:探索并设计基于因果推断Transformer的新型架构,设计提升微弱信号识别能力,推动CDUT等前沿模型落地;多场景协同建模:统一建模大促、日常、会员等多权益场景,实现跨场景知识迁移与泛化能力提升; 3. 前沿成果输出:在KDD、ICML、NeurIPS等顶级会议发表高水平论文,拓展因果推断与个性化营销领域的影响力; 4. 应用场景覆盖淘天多个权益体系,完成算法的线上应用及取得线上效果提升。 加入我们,你将参与最具挑战性的工业级因果推断课题,定义智能营销与用户增长的未来技术范式。