为了在初始结果不令人满意时提高 DeepResearch 输出的相关性或质量,首先要改进输入查询并调整搜索参数。 DeepResearch 很大程度上依赖于输入的具体性和清晰度来生成准确的结果。例如,如果像“AI 趋势”这样的查询返回广泛或不相关的结果,将其重新措辞为“基于 transformer 的 NLP 应用模型的最新进展”可以提供更清晰的上下文。添加日期范围(例如,“自 2022 年以来”)、特定领域的关键词(例如,“医疗保健”或“金融”)或排除不相关的术语(例如,“-营销”)等过滤器可以进一步缩小范围。开发人员应该迭代地测试查询的变体,以确定哪些术语或约束可以产生最相关的数据。
接下来,调整工具的配置设置以与所需的输出对齐。 许多研究工具允许用户优先考虑来源(例如,同行评审期刊与博客)、设置结果的置信度阈值或控制分析的深度。 例如,如果 DeepResearch 返回太多低质量的来源,则提高包含文档的最低可信度评分可以过滤掉不可靠的内容。 同样,如果输出缺乏技术深度,启用“专家模式”(如果可用)可能会优先考虑高度专业化的内容。 开发人员还应验证该工具是否支持自定义排名算法——例如,在像 AI 或网络安全这样快速发展的领域中,对近期出版物进行比旧出版物更高的加权。 这些调整需要实验,但可以显着提高相关性。
最后,结合反馈循环和后处理步骤。如果 DeepResearch 允许用户反馈(例如,将结果标记为“相关”或“不相关”),请使用此功能随着时间的推移训练系统。例如,如果该工具反复出现过时的研究论文,将其标记为不相关有助于它学习优先考虑较新的数据。此外,手动审查和分类初始输出可以发现模式——例如常见的关键词或重复出现的低质量来源——从而为进一步的查询改进提供信息。诸如脚本之类的后处理工具可以删除重复的结果、将相似的发现聚类或提取关键见解(例如,使用 regex 或 NLP 库)也可以增强最终输出。例如,一个 Python 脚本可以过滤结果,仅包含摘要中提到特定方法(例如,“随机对照试验”)的论文。结合这些策略可以确保结果质量的持续改进。