通过更高效和具有代表性地处理边缘情况、减少偏差以及确保在罕见或模棱两可的情况下做出一致的决策,相似性搜索改进了自动驾驶系统的伦理 AI 训练。 核心在于,相似性搜索使开发人员能够快速检索与 AI 遇到的特定情况紧密匹配的训练示例,确保系统从多样化且平衡的数据集中学习。 例如,如果一辆自动驾驶汽车遇到一名骑自行车的人在黄昏时分不可预测地转向,相似性搜索可以从过去的数据中识别出类似的场景,例如低光条件或不稳定的运动,并使用这些示例来完善模型的响应。 这降低了 AI 在不熟悉的情况下做出错误决策的风险,这对于优先考虑安全性和公平性等道德结果至关重要。
一个具体的好处是解决导致偏差行为的数据不平衡问题。自动驾驶数据集通常过度表示常见场景(例如,白天高速公路驾驶),而低估罕见但关键的情况(例如,大雨期间儿童穿过道路)。通过使用相似性搜索,开发人员可以聚类和识别代表性不足的场景,然后在训练期间有意识地对它们进行过度采样。例如,如果模型难以检测到穿着不常见服装(如反光建筑装备)的行人,相似性搜索可以显示数据集中所有相关的示例,确保模型学会识别这些情况。这种方法确保 AI 不会仅偏向最频繁的数据点,否则可能会导致不安全的概括。
此外,相似性搜索增强了验证和测试过程。在模拟过程中,开发人员可以查询模型在特定场景(例如,学校区域附近突然刹车)中的性能,并使用相似性搜索来查找所有相关的测试用例。这有助于查明系统性弱点——例如,始终错误分类模糊的交通标志——并优先修复。例如,Waymo 的模拟工具使用真实世界的驾驶数据来重现罕见场景,而相似性搜索可以帮助按风险级别或环境因素对这些场景进行分组。通过根据这些见解迭代地改进模型,开发人员可以确保 AI 在更广泛的条件下以合乎道德的方式运行,而不是仅针对平均情况性能进行优化。这种有条不紊的方法降低了在实际部署中出现有害疏忽的可能性。