小红书【Ace顶尖实习生】向量检索在大模型场景的应用和优化研究

实习兼职引擎地点：上海 | 杭州 | 北京状态：招聘

扫码手机上打开

任职要求

1、不限年级，本科及以上在读，计算机/人工智能/软件工程等相关专业优先；
2、编程基本功扎实，具有扎实的数据结构和算法功底，熟悉常用的设计模式、软件架构模式、计算网络、操作系统，擅长Java/C++至少一门语言；
3、 在Github上拥有有影响力的开源项目，或者是行业著名…

登录查看完整任职要求

微信扫码，1秒登录

工作职责

本课题研究如何优化向量检索技术以增强大型语言模型能力。 

主要方向包括： 
1、优化高维向量索引结构，实现千亿级多模态数据的高效检索；
2、设计多Agent场景下的智能检索增强生成(Agentic RAG)策略，探索检索结果与大模型上下文的最优融合方法； 
3、研究基于向量检索优化大模型推理过程中的KV Cache机制，为智能体应用的效果优化和大模型推理提供关键技术支持。

📮 投递简历 ✨AI模拟面试

难度：

包括英文材料

数据结构+

算法+

设计模式+

Java+

还有更多 •••

登录查看完整学习资料

相关职位

【Ace顶尖实习生】面向多模态数据的向量索引组织与混合查询优化技术研究

校招基础后端

本课题聚焦在多模态数据场景下如何高效的组织其向量索引数据，设计并实现配套的混合查询优化技术，能根据用户请求动态选择合理的索引组合，实现耗时、吞吐的合理平衡。预期成果是能用单一向量数据库产品原生支持异构多模态数据的向量索引构建和混合查询，为多模态大模型场景提供高效的向量支持。

更新于 2025-11-21上海|杭州|北京

【Ace顶尖实习生】基于Agent框架的AI搜索基座大模型

校招策略算法

传统的AI搜索依然基于RAG框架，少有的几个Agent框架也只涉及QueryPlanning，距离真实解决搜索中的实际问题还相距很远，例如做旅游攻略、做行业研究报告等等。我们判断，虽然当下LLM已经大范围的用于搜索领域，但是下一代的搜索技术变革一定是基于Agent的。本课题旨在研究基于Agent框架的基座模型。

更新于 2025-12-19北京|杭州|上海

【Ace顶尖实习生】面向多语言的AI搜索检索和生成系统研究

实习策略算法

本课题的研究目标是打造行业领先的多语言能力强化的大语言模型，结合业务海量的多语言互译语料，以及平台生活化特色的笔记评论数据，利用数据合成、RL冷启训练、SFT和RLHF等技术，实现： 1、在小红书多语言大模型翻译场景取得领先效果； 2、多语言场景下，AI搜索的检索和生成技术。

更新于 2025-07-20北京|上海|杭州

【Ace顶尖实习生】端到端的全双工自然语音交互

校招多媒体算法

本课题围绕点点、搜索等依赖自然人机交互的业务场景，打造面向AI Agent的端到端全双工自然语音交互能力，预期构建具有小红书特色的最低延迟、最具人感、最懂用户的语音Agent。重点攻克如何打造真实自然稳定的拟人感语音交互难题。其细分研究方向大模型语音内容理解【最懂用户】、可控对话式大模型语音合成【最具人感】、全双工speechLLM【最低延迟】等。

更新于 2025-11-21北京|上海|杭州