文章目录
随着知识图谱规模的日益增长,数据管理愈加重要。一方面,以文件形式保存的知识图谱显然无法满足用户的查询、检索、推理、分析及各种应用需求;另一方面,传统数据库的关系模型与知识图谱的图模型之间存在显著差异,关系数据库无法有效地管理大规模知识图谱数据。为了更好地进行三元组数据的存储,语义万维网领域发展出专门存储RDF数据的三元组库;数据库领域发展出用于管理属性图的图数据库。虽然目前没有一种数据库系统被公认为具有主导地位的知识图谱数据库,但可以预见,随着三元组库和图数据库的相互融合发展,知识图谱的存储和数据管理手段将愈加丰富和强大。
RDF图
本节首先介绍目前表示知识图谱的两种主要图数据模型:RDF图和属性图。从数据模型角度来看,知识图谱本质上是一种图数据。不同领域的知识图谱均须遵循相应的数据模型。往往一个数据模型的生命力要看其数学基础的强弱,关系模型长盛不衰的一个重要原因是其数学基础为关系代数。知识图谱数据模型的数学基础源于有着近300年历史的数学分支---图论。在图论中,图是二元组G=(V,E),其中V是节点集合,E是边集合。知识图谱数据模型基于图论中图的定义,用节点集合表示实体,用边集合表示实体间的联系,这种一般和通用的数据表示恰好能够自然地刻画现实世界中事物的广泛联系。
RDF是W3C制定的在语义万维网上表示和交换机器可理解信息的标准数据模型。在RDF三元组集合中,每个Web资源具有一个HTTP URI作为其唯一的id;一个RDF图定义为三元组(s,p,o)的有限集合;每个三元组代表一个陈述句,其中s是主语,p是谓语,o是宾语;(s&#
标签:图谱,数据库,知识,三元组,RDF,数据模型 From: https://blog.csdn.net/weixin_43961909/article/details/140504572