logo of antgroup

蚂蚁金服研究型实习生-面向搜推场景的查询理解图基础模型研究

实习兼职研究型实习生地点:北京 | 杭州状态:招聘

任职要求


研究领域:
-目前正在攻读计算机科学或相关STEM领域的学士,硕士或博士学位
-具有一种或多种通用编程语言的经验,包括但不限于: Java,C/C ++ 、Python、JavaScriptGo
-具有上述研究领域的…
登录查看完整任职要求
微信扫码,1秒登录

工作职责


研究领域:
  图计算
项目简介:
  在信息爆炸的时代,用户在搜推系统中面临的信息选择愈加复杂。查询理解作为搜推系统的核心技术,直接影响到用户体验和系统性能。现有的推荐系统在处理用户查询,特别是长尾或冷启动问题时,表现出了一定的局限性。开发一个能够高效理解用户查询意图的基础模型,成为提升系统智能化和用户满意度的关键所在。为此,本研究旨在针对搜推场景构建一个查询理解的基础模型,应用于查询改写、查询推荐和提升搜索相关性,横向赋能搜推业务。图神经网络和图基础模型为该研究提供了新的技术路径。我们计划探索以下几个关键问题。第一、如何构建一个通用且高效的查询理解基础模型,以适用于多样化的搜推场景?在此过程中,如何利用图神经网络的能力,融合用户查询和推荐物品之间隐藏的关系信息?第二、在冷启动情境下,如何通过图基础模型有效提升物品推荐的准确性,确保新的用户和物品也能被高效地推荐?第三、如何利用基于图的查询理解基础模型进行精准的查询改写和推荐,以进一步提升搜推相关性?通过这些研究,我们希望能为搜推系统提供创新的技术路径,实现更智能的用户交互和更精准的推荐服务。
包括英文材料
学历+
Java+
C+
还有更多 •••
相关职位

logo of antgroup
实习研究型实习生

研究领域: 人工智能 项目简介: 本课题面向典型大模型(dense、MoE)进行软硬协同、算子级深入优化,算子包括计算、通信、访存等。 背景: 1. 大模型和搜推模型推理需求: 大模型长序列和Tab3推荐模型增长迅速,前者迈向MoE千~万亿参数,推荐模型增长到数百GB。 - 需求背后存在计算密集、访存密集和多卡推理的通信瓶颈。例如在LLM prefill阶段和多模态模型通常计算密集;LLM decode阶段和搜推模型通常访存密集。 2. 算力阉割:主流NV卡算力大幅阉割,应对以上需求存在较大技术挑战。业界针对模型也不断有算子的深入优化例如FlashAttn系列,FlashMLA,SageAttn等,包括量化、稀疏的算子。

北京|杭州
logo of alibaba
实习淘天集团研究型实

1、构建面向搜推广场景的生成式通用用户大模型; 2、探索生成式预估模型的技术边界与架构创新; 3、主导大模型系统的工程化落地与全链路优化; 4、结合以上方向的探索和研究,撰写发表论文,和业界、学术界保持良好的交流。

更新于 2025-08-21北京
logo of amap
实习高德研究型实习生

职位描述: 面向高德“小高老师”AI搜&对话场景,满足用户出行、打车、信息获取等各类需求,目标做出业界顶尖的Agent智能体; 跟进AI Agent领域最新技术动态,围绕LLM大模型、Agent框架、LLM Reasoning技术(如思维链、多步推理)、优化复杂查询的Deep Research模式、Memory机制、RAG技术、自动化数据合成、指令微调(Instruction Tuning)、偏好对齐(RLHF/DPO)等技术,持续推动算法创新与落地; 开展LLM Agent技术研发,构建端到端Agent系统,涵盖意图识别、多场景工具调用、结果生成与偏好对齐,推动相关技术研究与算法落地,提升用户体验。

更新于 2026-01-13北京
logo of aliyun
实习阿里云研究型实习

面向AI场景下数据库资源优化系统研发,具体职责包括: 1.设计基于深度强化学习(DRL)的CPU/GPU混合负载调度框架,构建基于负载管理器、资源调度器的动态资源分配模型,实现资源利用率与服务质量(QoS)的联合优化; 2.研发“资源预热+缓存预热+计算编排”混合架构,通过热点数据预测模型、计算节点池化技术及数据预热机制,突破对象存储(OSS)水平弹性的性能瓶颈; 3.基于Neon分支技术改进动态数据隔离机制,设计多分支场景下的共享数据访问优化策略,在零冗余存储前提下保障租户间、branch间安全隔离,同时提升多分支并发场景下的数据访问吞吐量。

更新于 2025-07-02杭州