论文:RoarGraph: A Projected Bipartite Graph for Efficient Cross-Modal Approximate Nearest Neighbor Search
会议:VLDB 2024
作者:Meng Chen, Kai Zhang, Zhenying He, Yinan Jing, X.Sean Wang
简介:近似最近邻搜索(ANNS)是许多应用程序中的基本和关键组件,包括推荐系统和基于大型语言模型的应用。随着多模态神经模型的发展,多模态模型将不同模态的数据转换为共享的高维空间中的特征向量。跨模态ANNS旨在使用一个模态(例如文本)的数据向量作为查询,以检索另一模态(例如图像或视频)中最相似的项。然而,不同模态之间的向量存在固有的分布差异,跨模态查询变成了对数据库中数据的分布偏移(OOD)查询。因此,现有的ANNS方法在处理OOD工作负载时性能较差。
在本文中,我们分析了OOD工作负载的属性,以获得对其ANNS效率的影响。与单一模态向量检索任务不同,我们揭示了OOD查询在空间上偏离基础数据,且OOD查询的k个最近邻在高维空间中彼此距离较远。这一属性破坏了现有ANNS索引的假设,并且与其高效搜索而设计的目标不符。 通过对OOD工作负载中的搜索性能分析,我们提出了一个高效的ANNS图索引——Projected Bipartite Graph(RoarGraph),该图索引是在查询分布的指导下构建的。大量的实验表明,RoarGraph在现代跨模态数据集上显著优于最先进的方法,在保持90%召回率的情况下,OOD查询的搜索速度提高了数倍。