文章目录
随着知识图谱规模的日益增长,数据管理愈加重要。一方面,以文件形式保存的知识图谱显然无法满足用户的查询、检索、推理、分析及各种应用需求;另一方面,传统数据库的关系模型与知识图谱的图模型之间存在显著差异,关系数据库无法有效地管理大规模知识图谱数据。为了更好地进行三元组数据的存储,语义万维网领域发展出专门存储RDF数据的三元组库;数据库领域发展出用于管理属性图的图数据库。虽然目前没有一种数据库系统被公认为具有主导地位的知识图谱数据库,但可以预见,随着三元组库和图数据库的相互融合发展,知识图谱的存储和数据管理手段将愈加丰富和强大。首先介绍图数据模型和图查询语言等基本知识:以演示操作的方式讲解各种主流知识图谱数据库,包括基于关系数据库的存储方案、面向RDF的三元组数据库和原生图数据库;以图数据库Neo4为例介绍图模型数据的底层存储细节,同时梳理图数据索引和查询处理等关键技术;最后,以ApacheJena为例,针对知识图谱数据库开源工具进行实践。
知识图谱数据模型
从数据模型角度来看,知识图谱本质上是一种图数据。不同领域的知识图谱均须遵循相应的数据模型。往往一个数据模型的生命力要看其数学基础的强弱,关系模型长盛不衰的一个重要原因是其数学基础为关系代数。知识图谱数据模型的数学基础源于有着近300年历史的数学分支一图论。在图论中,图是二元组G=(V,E),其中V是节点集合,E是边集合。知识图谱数据模型基于图论中图的定义,用节点集合表示实体,用边集合表示实体间的联系,这种一般和通用的数据表示恰好能够自然地刻画现实世界中事物的广泛联系。RDF是W3C制定的在语义万维网上表示和交换机器可理解信息的标准数据模型。在RDF三元组集合中,每个Web资源具有一个HTTPURI作
标签:知识,图谱,数据库,基本知识,三元组,RDF,数据模型 From: https://blog.csdn.net/weixin_43961909/article/details/140405578