要启动 DeepResearch 查询,您首先需要进行身份验证并构建您的请求。大多数系统要求使用 API 密钥或令牌进行访问,您需要将其包含在请求头中。接下来,您需要构建查询载荷,通常采用 JSON 格式,指定搜索主题、过滤器(例如,日期范围、领域)和输出偏好(例如,结果数量、排序)等参数。例如,查询可能针对“机器学习优化技术”,并过滤出 2020 年之后发表的论文。开发人员通常使用 Postman 等工具或 Python 的 requests
等库向服务的端点发送 HTTP POST 请求。正确的错误处理在此至关重要——在提交前检查无效参数或身份验证问题。
提交查询后,系统会对其进行验证和处理。验证确保必需字段存在且参数在允许的范围内(例如,日期范围不超过系统限制)。如果验证失败,将返回包含详细信息的错误响应。验证通过后,查询进入处理队列。根据系统的架构,这可能涉及分布式工作器或无服务器函数来并行化任务。例如,查询可能被拆分为针对数据库、学术存储库或外部 API 的子查询。然后,系统使用相关性算法(例如,用于关键词加权的 TF-IDF 或用于语义相似性的神经网络模型)对结果进行聚合和排名,以优先显示高质量的来源。在此阶段,通常会收集日志和指标(例如,延迟、资源使用情况)用于监控。
处理完成后,系统会返回结构化响应。这通常包括状态码(成功/错误)、元数据(例如,总结果数、处理时间)以及结果本身——通常是以文档列表的形式,包含标题、URL、摘要和相关性评分。开发人员随后解析此输出,如果结果分页,则处理分页。例如,响应可能包含 100 个结果以及一个 next_page_token
用于获取更多结果。此阶段的错误(例如,超时、部分数据)需要重试或回退逻辑。一些系统还为长时间运行的查询提供 webhooks 或异步回调,让您可以避免阻塞应用程序。后期处理时,您可能会缓存结果或将其馈送到分析管道或可视化库等下游工具。