蚂蚁金服研究型实习生-神经网络和符号系统对齐方法研究和系统研发
任职要求
研究领域: -目前正在攻读计算机科学或相关STEM领域的学士,硕士或博士学位 -具有一种或多种通用编程语言的经验,包括但不限于: Java,C/C ++ 、Python、JavaScript或Go -具有上述研究领域的…
工作职责
研究领域: 人工智能 项目简介: ● LLM 大幅提升了自然语言理解和生成的能力,但存在黑盒化、幻觉、知识更新慢、领域知识缺乏等缺点,导致LLM在蚂蚁的诸多业务场景落地中遇到困难。 ● 我们希望结合以LLM为代表的神经网络系统和以知识图谱为代表的符号表示系统,协同进行知识的构建、训练、查询、预测、推理,帮助LLM缓解幻觉和领域知识缺乏等缺点,也帮助知识图谱提升语言理解和生成能力。预计可在蚂蚁财保、信贷、安全等多个场景上落地,帮助提升业务效果。 ● 该领域为AI方向的前沿领域,希望借助 RI 和学术界力量,共同探索研究。
大语言模型(LLM)是一种基于神经网络技术和海量语料库数据进行预训练的语言模型,拥有非常强大的语言理解、内容生成能力。结合检索增强生成(RAG)技术,LLM能够实时访问和整合外部知识库的信息,从而显著提高其在复杂问答和特定领域任务中的准确性和可靠性。然而,RAG方法会引入以下两种问题: 1. 额外成本(尤其是在利用搜索引擎的开放域场景下); 2. 不可避免的引入噪音,干扰大语言模型。 本项目通过识别特定LLM的知识边界,精确判断当前问题是否需要通过检索补充外部知识,降低模型幻觉。
专注于音频生成大模型的研究、探索和开发,具体职责包括: 1、研发更加通用、适用于多种音频信号生成的 Audio Tokenizer,包括但不限于声学事件、音效、背景音乐、歌唱等。 2、探索更加高效的自回归音频生成技术,从根本上解决现有自回归模型的效率问题。 3、探索基于连续声学特征的音频生成大模型,生成能力从语音扩展到包括音乐、声学事件、音效等更广泛的音频信号。 4、探索在音频生成时对 Life-term 上下文有效的建模方式,提高训练、推理效率以及合成音频的表现力。 5、研究适用于音频生成模型的 post-training 策略,例如强化学习、多任务微调等。
城市视频计算场景下的视图聚档,是指将来自城市摄像头下的人机非脸抓拍数据按照自然人唯一身份汇聚为一个个类簇,是实现城市人员ID化的一个非常核心的技术体系。围绕该场景,本项目拟解决如下问题: 1、基于多模态聚类算法、簇表征学习、图神经网络、同人识别模型算法等,持续提升聚类和归档过程中的准确率、召回率; 2、与多模态大模型、三维视觉分析等热门技术结合,优化聚档流程,扩展聚档应用范畴; 3、探索主动聚类、实时聚类等前沿方向,定义视图聚档技术发展的新路标; 4、基于时空轨迹分析、关系分析等数据分析算法,提升档案数据的挖掘价值。
团队介绍: 我们团队负责高德出行大数据的分析和应用开发,在机器学习、深度学习、大模型agent等方向探索解决业务问题,洞察业务机会,打造智能化的用户出行数据引擎。我们鼓励创新,鼓励发表论文和申请专利,乐于用新技术在业务方向做实际落地的尝试,期待你的加入! 具体职责包括但不限于: 1、负责机器学习、深度学习领域的数据挖掘研发工作,应用高德人地时空大数据挖掘用户画像、解决用户痛点问题; 2、负责时空大数据与AI Agent结合的应用实践,探索时空大数据Agent落地时间; 3、针对特定的业务场景对基座大模型进行微调优化,实现专属技能模型的能力升级和性能提升。