图数据库是一种旨在存储和管理图结构数据的技术,该结构由节点(代表实体)和边(代表它们之间的关系)组成。它针对高效查询互连数据进行了优化,使用遍历操作来导航关系。示例包括 Neo4j、Amazon Neptune 和 JanusGraph。相比之下,知识图谱是图结构的一种特定应用,它将现实世界信息组织成实体及其语义关系的网络,通常会丰富语境细节。例如,谷歌的知识图谱通过连接人物、地点和概念来支持搜索结果。虽然图数据库提供了基础设施,但知识图谱代表了构建在这种基础设施之上的数据模型和内容。
主要区别在于它们的用途和范围。图数据库是一种通用存储系统,可以处理任何领域的连接数据,并提供工具和查询语言(例如,Cypher、Gremlin)来创建、更新和遍历图。它非常适合需要频繁基于关系进行查询的场景,如社交网络或欺诈检测。然而,知识图谱是一个经过整理的数据集,专注于捕获具有语境意义的领域特定知识。它通常包含本体(实体类型和关系的正式定义),并可能集成来自多个来源的数据。例如,医疗知识图谱可以连接疾病、症状和治疗,从而支持诊断辅助等应用。虽然知识图谱通常使用图数据库进行存储,但它们也可以通过其他技术实现,例如 RDF 三元组存储。
实际例子突显了它们的区别。开发者可以使用 Neo4j(一种图数据库)为电商平台构建推荐引擎,利用其快速遍历用户-商品交互的能力。同一开发者稍后可以将这部分数据构建成知识图谱,以规范商品类别、供应商关系和用户偏好,从而实现语义搜索功能。另一个例子是 Wikidata,这是一个公开可用的知识图谱,存储了数百万实体的结构化数据,可以使用 SPARQL(一种 RDF 查询语言)而不是传统的图数据库查询工具进行查询。本质上,图数据库是管理连接数据的“引擎”,而知识图谱是使用该引擎构建的“地图”,用于建模特定领域。