在所需信息广为人知、相对静态或受益于综合通用概念的场景中,依赖大型语言模型的参数知识更为可取。这种方法避免了外部检索带来的延迟和复杂性,非常适合那些不需要实时或特定领域数据的直观查询。例如,回答常见的实事问题(如“法国的首都是什么?”)或解释基本概念(如“光合作用是如何进行的?”)都可以通过模型的内部知识高效处理。在这种情况下,检索是不必要的,因为答案不太可能改变,并且在训练数据中得到了充分的体现。
有三种关键场景更倾向于使用参数知识。首先,无需定制或最新上下文的简单事实性查询——如历史日期或科学原理——最好由大型语言模型直接回答。其次,当查询需要综合通用知识时(例如,“解释第一次世界大战的起因”),大型语言模型可以在不需要外部文档的情况下连贯地组合多个事实。第三,对于低延迟的应用(如聊天机器人),避免对外部数据库进行 API 调用可以提高响应速度。例如,用户询问“牛顿第一定律是什么?”时,无需进行网络搜索;大型语言模型可以使用其训练数据即时准确地回答。
检测这些场景涉及分析查询意图和内容。技术包括:
- 关键词检查:识别“什么是什么”、“解释”、“定义”等术语,这些通常表明需要通用知识。
- 复杂度评估:简单、简短的查询(例如,“《哈姆雷特》是谁写的?”)很可能可以通过参数知识解决。
- 数据新鲜度:如果查询不需要最新信息(例如,“当前股价”),参数知识就足够了。
- 置信度评分:大型语言模型可以自我评估其答案是否可靠(例如,“我相信巴黎是法国的首都”)或不确定(例如,“截至2023年……”)。开发者可以实现基于规则的过滤器或训练分类器来自动化此检测,在标准匹配时优先使用参数响应。这平衡了效率和准确性,同时最大程度地减少了不必要的外部调用。