无监督学习通过组织和分析未标记的图像数据来支持图像搜索,从而发现模式、对相似内容进行分组并实现高效检索。与依赖于标记数据集的监督方法不同,无监督技术自动从原始像素数据中提取有意义的特征或结构。这对于图像搜索特别有用,因为手动标记大量图像集合是不切实际的,并且无监督方法可以扩展以处理大型、多样化的数据集,而无需预定义的类别。
一个关键应用是聚类,其中 K-means 或分层聚类等算法根据视觉相似性对图像进行分组。例如,图像搜索系统可以使用聚类将数百万张产品照片的数据集组织成具有相似形状、颜色或纹理的商品组。这允许用户查询“红色连衣裙”并从相关集群中检索结果,即使图像从未被明确标记为“红色”或“连衣裙”。另一种技术是降维,例如 t-SNE 或 PCA,它将高维图像数据简化为低维表示。这些压缩的表示使得有效比较图像在计算上是可行的。例如,一个系统可以将 10,000 像素的图像减少到 50 维向量,从而实现快速的最近邻搜索以找到视觉上相似的图像。
无监督特征提取方法,如自编码器,也发挥着作用。在未标记图像上训练的自编码器学习将关键视觉特征(例如,边缘、纹理)编码到紧凑的潜在空间中。当用户提交查询图像时,系统会将其编码到该空间中,并检索具有相似潜在向量的图像。例如,医疗成像系统可以使用这种方法来查找具有可比骨骼结构的 X 射线,而无需依赖标记的诊断结果。通过自动执行特征发现并减少手动注释工作,无监督学习为可扩展、适应性强的图像搜索系统提供了灵活的基础。