DeepResearch 提供多个自定义设置,帮助开发者根据他们的需求定制搜索结果,包括安全搜索和来源偏好选项。 这些功能旨在让用户控制他们遇到的内容的类型,以及在结果中优先考虑的来源。 虽然具体实现取决于平台的 API 或界面,但核心功能侧重于与用户定义的参数保持一致的过滤和排名机制。 例如,安全搜索可以排除露骨或非技术内容,而来源偏好允许用户强调来自特定存储库、文档中心或学术数据库的结果。
一个关键的自定义是能够通过安全搜索来强制执行严格的内容过滤。 这不仅限于阻止露骨材料,还可以过滤掉低质量或不相关的技术内容。 例如,一个从事医学成像项目的开发人员可能会启用过滤器以排除来自社交媒体或论坛的结果,确保只出现同行评审的论文或官方文档。 同样,来源偏好允许用户优先考虑像 GitHub、arXiv 或 Stack Overflow 这样的域。 这通常通过 API 参数来实现,比如 source_weights
,开发者可以将更高的分数分配给可信的来源。 当搜索特定于语言的语法时,用户可以配置该工具,使 Python 的官方文档的排名高于个人博客。
高级设置包括基于正则表达式的过滤器,用于文件类型、日期范围或代码存储库。 例如,开发人员可能会在 GitHub 搜索中排除测试目录 (**/tests/
),或者将结果限制为 Markdown 文件 (.md
) 用于文档。 日期过滤器对于优先考虑最近的研究很有用,比如排除 2020 年之前发表的论文。 这些选项通常可以通过配置文件或 API 标头访问,例如 exclude_patterns: ["*.log"]
或 min_date: "2022-01-01"
。 通过组合这些设置,开发者可以创建高度特定的搜索工作流程,减少噪音并提高结果的相关性,用于调试或文献综述等任务。 这些工具的灵活性使 DeepResearch 能够适应广泛的探索性搜索和范围严格的技术查询。