DeepResearch 需要结构化的用户输入来定义研究任务的范围、数据源和目标。用户通常提供一个主要研究问题、要查询的数据源或 API 列表以及指导分析的参数。例如,用户可以指定一个主题,如“比较 Python Web 框架的性能指标”,包含 GitHub 仓库、Stack Overflow 讨论串和技术博客等来源,并设置日期范围或关键字排除等过滤器。系统还接受可选的配置参数,例如输出格式(如 JSON、CSV)或分析深度(如表面趋势与详细统计比较)。输入在处理开始前会进行完整性和相关性验证。
要启动一个会话,用户通过编程接口与 DeepResearch 交互,例如 REST API 端点、CLI 工具或 SDK 方法。例如,开发人员可以向 /api/v1/research
发送包含研究问题、来源和参数的 JSON payload 的 POST 请求。或者,CLI 命令,如 deepresearch start --topic "CPU benchmarking data" --sources "arXiv,IEEE" --output-format markdown
,也可以触发此过程。身份验证通常通过 API 密钥或在请求头中传递的 OAuth token 处理。系统会立即返回一个会话 ID,允许用户跟踪进度或稍后检索结果。
DeepResearch 还支持批量处理和异步工作流。对于长时间运行的任务,用户可以注册 webhook URL 以在完成时接收通知,或使用会话 ID 轮询状态端点。输入验证错误(例如,不支持的数据源或缺少主题字段)会返回特定的错误代码,使开发人员能够以编程方式进行调试。例如,无效的 API 请求可能会触发 400 Bad Request
响应,并带有一条消息,如 "Source 'Twitter' not supported; valid sources: GitHub, arXiv, StackExchange"
。这种设计允许集成到自动化管道中,其中输入参数可以从其他系统动态生成。