为确保检索增强的 LLM 避免引入新的偏见或问题,开发人员必须专注于三个领域:数据源质量、模型训练调整和验证协议。 首先,检索系统的数据源应经过严格的策划和监控。 例如,如果模型检索医疗信息,则应将来源限制为同行评审的期刊或受信任的健康组织,以最大程度地减少接触不可靠内容的机会。 预处理步骤(例如,检查文本中是否存在性别歧视的偏差检测工具)可以在问题内容添加到检索数据库之前对其进行标记。 此外,应该对模型进行训练,使其能够根据其内部知识来权衡检索到的信息。 交叉编码器重新排序(其中对检索到的段落的相关性和准确性进行评分)等技术可帮助模型优先处理可信内容。 如果没有这些保障措施,检索系统可能会放大外部数据集中存在的偏差,例如历史文档中过时的文化刻板印象。
评估对于识别对检索信息的过度依赖至关重要。 开发人员可以设计测试用例,其中检索系统返回故意不正确或有偏差的数据,然后衡量模型合并这些错误的频率。 例如,在问答任务中,如果检索系统提供捏造的统计数据(例如,“70% 的人更喜欢产品 X”),如果该声明与其训练数据相冲突,则模型的响应理想情况下应拒绝此声明。 “检索置信度得分”(模型对检索文本的依赖程度)和“矛盾检测率”(识别检索知识和内部知识之间的冲突)等指标可以量化误用。 诸如注意力可视化或基于梯度的归因之类的工具还可以揭示模型是否不成比例地关注检索到的内容,即使该内容不相关或有害。
为了减轻这些风险,开发人员应实施动态验证循环。 例如,事实检查层可以将检索到的信息与策划的知识图进行比较,以在最终确定响应之前标记不一致之处。 人工参与评估(领域专家在利害关系较高的情况下(例如,法律建议)审核模型输出)提供了另一层审查。 此外,检索系统可以设计为优先考虑具有透明来源和更新机制的来源,从而减少对静态或未经审查的数据的依赖。 通过结合严格的采购、有针对性的评估和迭代验证,开发人员可以平衡检索的益处与针对偏见和滥用的保障措施。