图搜索通过提供结构化的方法来导航图像之间的关系(这些图像被表示为图中的节点),从而与图像检索相关联。 在图像检索系统中,图像通常被编码为特征向量(例如,使用深度学习模型),并存储在图中,图中的边连接视觉上相似的图像。 图搜索算法,例如广度优先搜索 (BFS) 或近似最近邻 (ANN) 技术,会遍历这些连接以有效地定位与查询匹配的图像。 例如,系统可以构建一个图,其中每个节点代表一个图像,边连接具有相似颜色直方图或纹理模式的图像。 当用户提交查询图像时,系统使用图遍历来探索相邻节点,优先考虑使特征向量之间的余弦距离等相似性指标最大化的路径。
图结构使图像检索系统能够捕获更简单的方法(例如,线性搜索)错过的复杂关系。 例如,图可以表示分层或多跳相似性:如果图像 A 类似于图像 B,并且 B 类似于图像 C,则即使它们的直接相似性较低,图搜索也可以推断出 A 和 C 之间的连接。 这对于反向图像搜索等任务特别有用,其目标是找到图像的变体或编辑版本。 PageRank 等算法还可以根据图像在图中的连通性对图像进行排名,优先考虑具有更多边(即更高相关性)的图像。 此外,图卷积网络 (GCN) 可以学习在图中传播相似性信息,通过结合局部和全局关系来提高检索准确性。
实施基于图的图像检索的开发人员通常使用诸如 NetworkX 之类的工具进行图构建,或使用诸如 FAISS 和 HNSW(分层可导航小世界)之类的专用 ANN 库来优化搜索速度。 例如,HNSW 构建分层图,其中顶层允许快速“缩小”遍历,而下层则以更精细的粒度细化结果——这平衡了大型数据集中的效率和准确性。 挑战包括管理数十亿规模图的内存开销以及调整诸如边密度之类的参数。 一个实用的工作流程可能涉及使用预训练的 CNN 提取图像特征,从这些特征构建 HNSW 图,并使用 k 最近邻算法查询它。 通过将图搜索与现代嵌入技术相结合,开发人员可以创建可扩展的系统,以处理各种检索任务,从产品推荐到医学图像分析。