DeepSeek 提供了多种 API,旨在让开发者高效地集成和与其 AI 模型交互。主要产品包括标准的聊天补全 API、嵌入 API 以及用于模型微调的定制工具。这些 API 基于 RESTful 原则构建,使用 JSON 进行请求和响应,可通过 HTTP 端点访问。它们适用于常见的用例,如文本生成、语义分析和特定任务的模型适配,这使得它们对于开发从聊天机器人到数据分析工具等应用程序的开发者来说非常通用。
聊天补全 API 是文本生成的核心接口。它允许开发者发送提示并接收模型生成的响应,类似于其他现代语言模型 API。例如,典型的请求可能包含一个 messages
数组,其中包含用户和系统角色,以及诸如 temperature
(用于控制随机性)或 max_tokens
(用于限制响应长度)等参数。例如,POST /v1/chat/completions
等端点会返回一个包含生成文本和元数据的 JSON 对象。此 API 支持流式传输以实现实时交互,这对于实时聊天机器人或交互式助手等应用非常有用。开发者还可以指定停止序列,以便在预定义点停止生成,确保输出符合特定的格式需求。
对于需要语义理解的应用,DeepSeek 提供了一个 嵌入 API。这会将文本转换为高维向量表示,从而实现相似性比较、聚类或搜索等任务。对诸如 POST /v1/embeddings
等端点的请求可能包含一个带有目标文本的 input
字段和一个指定嵌入变体(例如 text-embedding-3
)的 model
参数。响应提供了一个向量,可以使用余弦相似度进行存储或比较。这对于构建推荐系统或文档检索工具特别有用。此外,DeepSeek 还为在专有数据上微调模型提供了 定制 API。开发者可以通过诸如 POST /v1/fine_tuning/jobs
等端点上传数据集、触发训练作业,并部署自定义模型版本。这些 API 包括用于监控训练进度和管理模型版本的工具,使团队能够控制性能优化。
这些 API 的文档包含了认证(通常通过 API 密钥)、速率限制和错误代码的详细信息。例如,状态码 429 表示速率限制,而 401 表示无效凭证。DeepSeek 还提供了 Python 等语言的客户端库,以简化集成。通过专注于这些核心 API,该平台在灵活性和易用性之间取得了平衡,使开发者能够根据其特定需求调整工具,而不会增加不必要的复杂性。