在知识图谱中,实体表示为由关系(边)连接的不同节点,这些关系定义了它们如何交互。 每个实体都对应于真实世界的对象、概念或事件,例如人、地点、组织或抽象概念。 这些节点被唯一标识,并使用描述其属性的属性(键值对)进行注释。 例如,表示人的实体可能包括诸如 name
、birthdate
或 occupation
之类的属性。 这种结构允许知识图谱以类似于人类理解概念之间关系的方式来建模复杂的、相互连接的数据。
通常为实体分配唯一的标识符,以避免歧义。 例如,“Paris”可以指法国的城市或人的名字。 在知识图谱中,这些将是具有不同标识符的独立实体,例如 Wikidata 中的 Q90
(对于法国巴黎)和 Q12345
(对于名为 Paris 的人)。 属性和关系进一步阐明实体的角色。 城市实体可能会链接到指向“France”的“country”关系,而人员实体可能会链接到指向某个位置的“bornIn”关系。 这种粒度可以通过遍历实体之间的关系来实现精确的查询,例如检索所有人口超过一百万的城市。
开发人员通常使用 RDF(资源描述框架)或属性图模型(例如,Neo4j)等框架与知识图谱进行交互。 在 RDF 中,实体表示为 URI(统一资源标识符),关系通过谓词定义。 例如,<http://example.org/Paris> <http://example.org/isCapitalOf> <http://example.org/France>
建立了两个实体之间的连接。 属性图通过允许将属性直接附加到节点和边来扩展这一点。 诸如 SPARQL 或 Cypher 查询语言之类的工具使开发人员可以遍历这些连接,从而实现诸如推荐系统(例如,“购买 X 的用户也购买了 Y”)或语义搜索之类的用例。 关键的结论是,实体构成了知识图谱的骨干,它们的属性和关系提供了上下文和含义。