Amazon Bedrock 提供了使用您自己的数据自定义基础模型的工具,主要通过两种方法:持续预训练和微调。 持续预训练允许您在特定领域的数据上进一步训练基础模型,这对于将其适应专门的词汇或概念(例如,法律文件或医学术语)很有用。 微调调整预训练模型以执行特定任务,例如提高客户支持聊天机器人的响应质量。 此外,Bedrock 与检索增强生成 (RAG) 集成,使模型能够从外部来源提取实时数据,而无需修改模型本身,例如查询产品数据库以获取最新的库存信息。
要使用这些功能,您首先需要以 JSONL (JSON Lines) 等格式准备您的数据,并将其上传到 Amazon S3。 对于微调,您可以通过 Bedrock 的 API 或控制台定义训练参数,例如 epoch、学习率和批量大小。 例如,开发人员可以对带注释的客户服务记录进行模型微调,以提高意图识别。 Bedrock 处理训练基础设施,并根据需要扩展资源。 对于 RAG,您可以使用 Bedrock Agents 将 Bedrock 连接到 Amazon OpenSearch 或 Aurora 数据库等数据源,从而允许模型在推理期间动态检索相关信息。 这避免了重新训练模型的需要,同时确保响应保持最新。
自定义后,Bedrock 会将您的模型部署为托管 API 端点,让您可以像任何其他 Bedrock 模型一样将其集成到应用程序中。 AWS 通过 IAM 策略、加密(静态和传输中)和 VPC 隔离来处理安全性。 例如,医疗保健应用程序可以部署在临床笔记上微调的模型,同时通过 AWS 的安全控制确保 HIPAA 合规性。 开发人员可以测试不同的模型版本 A/B 样式,并使用 CloudWatch 指标监控性能。 虽然并非 Bedrock 中的所有模型都支持完全微调(请查看提供商文档),但 RAG 和提示工程等选项为大多数用例提供了灵活性,而无需进行大量自定义。