蚂蚁金服研究型实习生-面向搜推场景的查询理解图基础模型研究

实习兼职研究型实习生地点：北京 | 杭州状态：招聘

扫码手机上打开

任职要求

研究领域：
-目前正在攻读计算机科学或相关STEM领域的学士,硕士或博士学位
-具有一种或多种通用编程语言的经验,包括但不限于: Java,C/C ++ 、Python、JavaScript或Go
-具有上述研究领域的…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

研究领域：
  图计算
项目简介：
  在信息爆炸的时代，用户在搜推系统中面临的信息选择愈加复杂。查询理解作为搜推系统的核心技术，直接影响到用户体验和系统性能。现有的推荐系统在处理用户查询，特别是长尾或冷启动问题时，表现出了一定的局限性。开发一个能够高效理解用户查询意图的基础模型，成为提升系统智能化和用户满意度的关键所在。为此，本研究旨在针对搜推场景构建一个查询理解的基础模型，应用于查询改写、查询推荐和提升搜索相关性，横向赋能搜推业务。图神经网络和图基础模型为该研究提供了新的技术路径。我们计划探索以下几个关键问题。第一、如何构建一个通用且高效的查询理解基础模型，以适用于多样化的搜推场景？在此过程中，如何利用图神经网络的能力，融合用户查询和推荐物品之间隐藏的关系信息？第二、在冷启动情境下，如何通过图基础模型有效提升物品推荐的准确性，确保新的用户和物品也能被高效地推荐？第三、如何利用基于图的查询理解基础模型进行精准的查询改写和推荐，以进一步提升搜推相关性？通过这些研究，我们希望能为搜推系统提供创新的技术路径，实现更智能的用户交互和更精准的推荐服务。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

学历+

Java+

C+

还有更多 •••

登录查看完整学习资料

相关职位

研究型实习生-高性能推理算子

实习研究型实习生

研究领域：人工智能项目简介：本课题面向典型大模型（dense、MoE）进行软硬协同、算子级深入优化，算子包括计算、通信、访存等。背景： 1. 大模型和搜推模型推理需求: 大模型长序列和Tab3推荐模型增长迅速，前者迈向MoE千~万亿参数，推荐模型增长到数百GB。 - 需求背后存在计算密集、访存密集和多卡推理的通信瓶颈。例如在LLM prefill阶段和多模态模型通常计算密集；LLM decode阶段和搜推模型通常访存密集。 2. 算力阉割:主流NV卡算力大幅阉割，应对以上需求存在较大技术挑战。业界针对模型也不断有算子的深入优化例如FlashAttn系列，FlashMLA，SageAttn等，包括量化、稀疏的算子。

北京|杭州

研究型实习生-阿里妈妈-大模型算法工程师

实习淘天集团研究型实

1、构建面向搜推广场景的生成式通用用户大模型； 2、探索生成式预估模型的技术边界与架构创新； 3、主导大模型系统的工程化落地与全链路优化； 4、结合以上方向的探索和研究，撰写发表论文，和业界、学术界保持良好的交流。

更新于 2025-08-21北京

AI Agent算法工程师 - 实习

实习高德研究型实习生

职位描述: 面向高德“小高老师”AI搜&对话场景，满足用户出行、打车、信息获取等各类需求，目标做出业界顶尖的Agent智能体；跟进AI Agent领域最新技术动态，围绕LLM大模型、Agent框架、LLM Reasoning技术（如思维链、多步推理）、优化复杂查询的Deep Research模式、Memory机制、RAG技术、自动化数据合成、指令微调（Instruction Tuning）、偏好对齐（RLHF/DPO）等技术，持续推动算法创新与落地；开展LLM Agent技术研发，构建端到端Agent系统，涵盖意图识别、多场景工具调用、结果生成与偏好对齐，推动相关技术研究与算法落地，提升用户体验。

更新于 2026-01-13北京

研究型实习生 - 面向AI场景下的数据库资源优化

实习阿里云研究型实习

面向AI场景下数据库资源优化系统研发，具体职责包括： 1.设计基于深度强化学习（DRL）的CPU/GPU混合负载调度框架，构建基于负载管理器、资源调度器的动态资源分配模型，实现资源利用率与服务质量（QoS）的联合优化； 2.研发“资源预热+缓存预热+计算编排”混合架构，通过热点数据预测模型、计算节点池化技术及数据预热机制，突破对象存储（OSS）水平弹性的性能瓶颈； 3.基于Neon分支技术改进动态数据隔离机制，设计多分支场景下的共享数据访问优化策略，在零冗余存储前提下保障租户间、branch间安全隔离，同时提升多分支并发场景下的数据访问吞吐量。

更新于 2025-07-02杭州