阿里云研究型实习生 - 向量数据库实际复杂场景下的搜索研究
实习兼职阿里云研究型实习生地点:杭州状态:招聘
任职要求
1、实现的原型系统及源码; 2、相关技术方案申请专…
登录查看完整任职要求
微信扫码,1秒登录
工作职责
随着近些年机器学习与表征学习的发展,非结构化数据的查询和分析变得更加普遍。通过表征学习,我们可以把图片或文本嵌入到高维空间从而用高维向量来代表这些图片或文本。进一步的,通过在高维空间中查找最近邻,我们可以对非结构化数据进行语义搜索。例如,通过检索增强生成技术(RAG),我们可以将外部知识或领域知识进行向量化,利用向量空间中的近邻搜索得到对应的原始知识,对大语言模型的生成结果进行增强,来减少大模型出现幻觉或知识过时的现象。 为了提升数据库产品对AI应用的支持,阿里云瑶池数据库也全面提升了向量检索能力,在PolarDB、RDS、AnalyticDB、Lindorm、Tair等产品中集成了向量功能,实现结构化数据、半结构化数据、多模数据、向量数据的一体化处理。 然而,目前向量索引主要关注查询速度和准确率,对于实际复杂场景下的搜索问题还没有足够的研究。例如,分布式架构下的向量查询索引、结构化与非结构化数据的联合查询,以及数据动态增删场景下的索引优化等问题,都需要进一步探索和研究。
包括英文材料
相关职位
实习阿里云研究型实习
1.研发新一代向量数据压缩存储格式; 2.设计基于JIT的索引快速预热机制; 3.优化磁盘-内存-GPU数据传输流水线; 4.开发分布式一致性内存管理组件。
更新于 2025-07-02杭州
实习阿里云研究型实习
1、研发新一代面向量数据索引和量化算法; 2、基于云原生存储架构,提升向量索引和检索性能; 3、将业界领先的算法落地在 PolarDB 云原生数据库中。
更新于 2026-01-26杭州
实习阿里云研究型实习
专注于数据湖场景下向量化和多模态数据存储和分析系统的研究、探索和开发,具体职责包括: 1、探索和研究高效可扩展的向量索引和分级存储算法,支持超大规模向量数据存储和检索; 2、探索和研究高性能的多模态数据检索和查询算法,支持大数据AI一体化场景下的融合分析; 3、分析现有向量索引算法和典型负载的性能瓶颈,提出并实现创新的优化技术; 4、结合阿里云Milvus和EMR 产品服务,提供可靠高效的向量存储和检索方案,支持不同行业和规模的客户场景; 5、面向数据湖仓场景构建业界领先的多模态数据查询分析解决方案。
更新于 2025-06-26北京