首页 > 其他分享 >知识融合概述

知识融合概述

时间:2023-03-16 15:45:40浏览次数:27  
标签:知识 实体 融合 概述 对齐 知识库 属性

知识融合概述

什么是知识融合

构建知识图谱的过程中,往往会对多个知识库进行合并,以期获得更全面的知识,这个过程就称为知识融合。

由于被合并的各个知识库里的知识难免会存在错误,因而知识融合会对多个知识库的知识进行交叉验证,知识融合之后获得知识相比融合前的单知识库会更准确。

知识融合的难点

  • 异构问题:不同知识库对同一个实体或知识的表达差异很大,具体体现在一个相同的实体存在大量的别名。比如商品知识图谱中,不同数据源对于同一商品的描述可能不同。
  • 歧义问题:不同的实体使用同样或类似的文本表达。比如“苹果”既是一种水果,又是一个品牌名称。
  • 数据噪声:在工业界知识图谱实践中,数据噪声问题是广泛存在的,多知识库融合会方法噪声问题,容易造成准确率的下降。
  • 跨语言问题:不同语言再表达同一个实体或知识时,语义的漂移是十分严重的,可以认为跨语言是一种非常难处理的异构问题,因此跨语言的知识融合任务难度更大,在学术界往往作为一个独立戴尔研究子领域出现。

知识融合的基本步骤

本体对齐

本体是描述一样东西的框架,在不同的知识图谱中,对于同一样东西的描述方法可能是不同的。

本体对齐就是指对多个知识库本体结构进行对齐,涉及本体结构的类、属性项和属性值的对齐。本体对齐的目的是解决类、属性项和属性值的异构问题。

比如商品知识图谱中,不同的商品知识库本体结构不同。在类级别上,不同知识库的层级划分可能不同,比如“手机”、“智能手机”,命名方法可能也不同,比如“数码设备”和“3C数码”;每个类的属性项可能也会存在同,比如“尺寸”和“屏幕尺寸”;属性项下面的属性值也可能存在不同的划分或者命名不同的问题,比如同样“品牌”属性项下,可能一个知识库使用了“苹果”,另一个则是“Apple”。

实体对齐

实体对齐就是把多个知识库中描述同一个实体的记录找出来。由于实体的个数非常多,且同一个实体在不同知识库里异构问题严重,因此相比本体对齐,实体对齐是一个更为困难的任务,比如“iPhone 11”和“苹果手机 iPhone11”是同一个实体。

信息融合

不同知识库对同一个实体的描述可以有相当程度的互补,进行融合,能得到最全、最准的实体属性信息。信息融合就是将已对齐的实体对或者实体聚簇的属性信息融合到一起的过程,主要解决的多个数据源信息冲突的问题。

标签:知识,实体,融合,概述,对齐,知识库,属性
From: https://www.cnblogs.com/yangxuanzhi/p/17222796.html

相关文章

  • 概述
       ......
  • ACP云原生容器工程师 - ASM服务网格概述
    概述技术概要第一代服务网格服务网格基础设施层微服务通信保证请求可靠传递隐藏通信细节减少框架耦合预言无关数据平面边车模式通信代......
  • 网络 - IP地址基础知识
    IP地址基础知识IP地址分类IP地址表示IP地址由两个部分组成,net-id和host-id,即网络号和主机号:net-id:表示ip地址所在的网络号;host-id:表示ip地址所在网络中的某个主机号......
  • HTML基础知识
    1.1DOCTYPE<!DOCTYPE>文档类型声明,作用就是告诉浏览器使用哪种HTML版本来显示网页。<!DOCTYPEhtml>这句代码的意思是:当前页面采取的是HTML5版本来显示网页.1.2lan......
  • 爬虫基础知识
    目录一、requests模块二、requests携带参数的方式三、get请求URL解码编码四、post请求携带数据编码格式四、get请求携带请求头五、post请求携带参数六、requests.session的......
  • Redis基础知识
    IO多路复用IO:I/O是Input输入/Output输出的简称,通常指数据在内部存储器(内存)和外部存储器(硬盘、优盘)或其他周边设备之间的输入和输出。  输入/输出是信息处理系统(计算机)......
  • 小知识:什么叫做workaround?
    技术人当遇到具体问题,能给出的各种解决方案,有一种类型叫做workaround,翻译过来通常为“应变方法”、“变通方法”;其实这种方式通常是没有找到根本的解决方案,但是为了快速恢......
  • 琐碎知识
    枚举       枚举的好处,将取值范围定义为了大于等于0的整数,使得代码更加安全直观        进制转换           ......
  • Docker基础知识 (28) - 在 Dockerfile 中以 scratch 为基础镜像 (FROM scratch)
     通常使用Docker镜像时会以一个已存在的镜像为基础,在其上进行定制,这个已存在的镜像就是基础镜像。在DockerFile中必须指定基础镜像,FROM指令就是用于指定基础镜像,......
  • 【操作系统】简答题知识点整理
    进程与线程总纲(一)进程与线程进程与线程的基本概念:进程/线程的状态与转换线程的实现:内核支持的线程,线程库支持的线程进程与线程的组织与控制进程间的通信:共享内存,消......