蚂蚁金服研究型实习生-大模型持续学习及领域蒸馏
任职要求
研究领域: -目前正在攻读计算机科学或相关STEM领域的学士,硕士或博士学位 -具有一种或多种通用编程语言的经验,包括但不限于: Java,C/C ++ 、Python、JavaScript或Go -具有上述研究领域的…
工作职责
研究领域: 其他 项目简介: LLM在多个任务中已经展示了强大的能力。然而,由于现实世界的数据和需求不断变化,模型需要持续学习新知识以保持其性能。如何通过数据合成、数据增强、数据采样等多种方式,使得模型能够获取更好的知识是当前行业研究的重点和难点。以DeepSeek-R1为代表的推理模型范式为行业提供了重要启示,尤其在数学解题、代码生成、科学计算等场景中,大模型需具备从多步骤推理到最终结论生成的完整逻辑链条处理能力。研究发现,模型性能的提升已从单纯依赖参数规模扩展转向对训练数据质量的深度优化。高质量数据的稀缺性及其对模型能力的影响机理,正成为制约大模型向高阶推理跃迁的核心瓶颈。本研究旨在通过“高质量”数据与AI融合,为AIXData产业应用(包括但不限于数据标注、数据生成、CoT数据等)带来应用价值。
随着人工智能技术的发展,尤其是自然语言处理领域的大语言模型的突破,为企业和个人带来了前所未有的机遇。在这一背景下,大语言模型智能体的应用成为推动业务创新的关键驱动力。 为了进一步推动大语言模型智能体的发展和应用,本项目将聚焦以下几个方面: 1. 增强智能体的多功能性和灵活性:目前,大语言模型智能体已经能够在多个场景中发挥作用,但是其功能性和灵活性仍有待提升。我们希望通过持续的模型训练和微调,使智能体能够更好地理解和响应用户的多样化需求,从而提供更加精准的服务。 2. 工具学习和集成:智能体需要能够学习和利用外部工具来完成特定任务。这包括但不限于数据检索、数据分析、第三方API调用等。我们计划开发一套工具学习框架,使得智能体能够自动识别哪些工具对于完成特定任务最有帮助,并能够有效地调用这些工具。
职位描述 你将加入高德地图核心算法团队,在算法专家的指导下探索大模型(LLM/多模态)与推荐系统的深度结合。你将有机会接触亿级用户规模的真实业务场景,参与从前沿技术研究到工程落地的全过程。 你将参与或负责以下工作内容(包括但不限于): 1.用户兴趣预测:基于生成式大模型解析用户行为与商品/内容语义,构建⽤户需求预测模型,提升推荐场景的转化与⽤户体验; 2.端到端⽣成式链路:探索端到端生成式范式,替代传统多阶段漏斗链路流程,基于强化学习融合业务逻辑,建设出具备⾼效scaling能力的生成式算法新链路; 3.重排范式创新:借鉴生成式大模型技术构建生成式重排创新范式,通过Reward model + 强化学习实现端到端序列整体生态价值建模; 4.深入研究和理解大模型预训练、微调与强化学习技术,结合搜推业务目标持续优化模型效果。
近年来,随着人工智能和深度学习技术的迅猛发展,多模态大模型(Multi-modal Large Models)取得了显著的进展。这些模型能够通过处理多种数据类型(如文本、图像、视频、音频等)来完成复杂的任务,与传统单一模态模型相比,展现出更强的理解与推理能力。尤其是在语言、视觉和音频等领域,多模态大模型为诸多实际问题提供了创新的解决方案,并越来越广泛地应用在产业和科研领域,显著提高了自动化和智能化的水平。 本项目将着眼于以下几个层面技术,以推进多模态大模型对于世界的感知和交互: 1.动态视内容的理解:提升多模态大模型可以实现对视频内容的自动理解与分析能力。 2.提升模型对于图像中人类知识的理解的识别水平。 3.多模态大模型推理与理解能力的持续提升。
【职位描述】 我们是小红书安全风控平台部/算法策略组/内容安全组,目前专注于多模态大模型在多模态理解和内容安全场景的技术落地和产品预研,目前在相关数据&技术方向有一定的积累,并将长期持续投入。我们希望寻求优秀在读硕士生/博士生共同突破大模型在安全审核行业落地的技术挑战,作为实习生,你将有机会与产品、工程紧密合作,将研究算法应用到实际问题中,并解决有难度有价值的问题,促进领域前沿技术的发展。欢迎投递简历。该岗位的核心研究方向包括但不限于: 1. 基础多模态表征:主要研究小红书多模态数据(笔记)下的基础多模态表征工作,包括层次化表征、特征融合、自监督探索等,作为基础模型,支持多样化检索场景。 2. 通用多模态大模型:通用多模态大模型在安全领域理解相关研究,包括高效微调、多模态理解等。建立安全多模态基础模型。