相似性搜索通过使其感知系统能够将实时传感器数据(例如,相机图像、激光雷达扫描)与标记的紧急车辆示例的预训练数据集进行比较,从而帮助自动驾驶汽车识别紧急车辆。 此方法利用 k 近邻 (k-NN) 或近似最近邻 (ANN) 搜索等算法来快速识别视觉或空间特征(例如,闪烁的灯光、警笛或车辆形状)中的模式。 通过测量传入的传感器数据与已知的紧急车辆签名匹配的紧密程度,该系统可以优先考虑准确的分类,即使在复杂的场景(例如,低光照条件或部分遮挡)下也是如此。 这降低了错误分类关键对象的风险,确保汽车在紧急车辆靠近时做出适当的响应。
例如,自动驾驶汽车的摄像头可能会拍摄到带有红色和蓝色闪光的车辆图像。 该系统从该图像中提取特征(例如,颜色分布、光模式和车辆),并将它们转换为数字嵌入(向量表示)。 然后,将此嵌入与来自标记的紧急车辆和非紧急车辆的嵌入数据库进行比较。 如果数据库中最接近的匹配是救护车或警车,则系统会将检测到的对象标记为紧急车辆。 诸如余弦相似度或欧几里得距离之类的技术可以量化实时数据与参考示例的“接近”程度。 为了处理规模,工程师经常使用诸如分层可导航小世界 (HNSW) 图之类的近似方法来优化这些搜索,从而平衡实时处理的速度和准确性。
这种方法的实际影响是双重的。 首先,它提高了可靠性:通过交叉引用多个属性(灯光、警笛、移动模式),该系统减少了误报 - 例如将建筑车辆的黄色灯光误认为是紧急信号。 其次,它能够更快地做出决策。 例如,如果自动驾驶汽车检测到从后面驶来的消防车的高置信度匹配,它可以立即触发诸如靠边停车或清理车道之类的协议。 这种集成依赖于在多样化数据集上训练的嵌入模型,包括旧救护车上褪色的油漆或不同地区非常规的紧急车辆等边缘情况。 通过将相似性搜索与其他模块(例如,警笛的音频检测)相结合,该系统会创建冗余检查,即使单个传感器面临限制,也能确保强大的性能。