首页 > 其他分享 >图神经网络基础(1)

图神经网络基础(1)

时间:2024-09-07 19:51:22浏览次数:8  
标签:卷积 图谱 可以 基础 任务 神经网络 节点

1.什么是图 ?
        我们最熟悉的社交网络就是一个最典型的图

        通常用图指代一种广义的抽象结构,用来表示一堆实体和它们之间的关系。实体被叫作图的节点,而实体和实体之间的关系构成了图的边。 —个图G={γ,g}包含一个节点集合γ和一个边的集合g。 以社交网络为例用户可以作为节点,而用户和用户之间的朋友关系可以作为边。 图几乎无处不在, 当我们在网上购物时,用户和产品之间的购买关系可以形成用户—产品图;当 我们在公司工作时,有公司的组织结构图。
2.深度学习与图
        二维的网格数据可以理解为图像,一维的序列数 据可理解为文本。
2.1 图数据的特殊性质
        以卷积神经网络为例我们通过对比网格数据和图数据来 说明为什么它不能直接用在图上。

1. 节点的不均匀分布

        在网格数据中,每个节点(不包含边缘节点)只有4个邻接点,因此我们 可以很方便地在一个网格数据的每个小区域中定义均匀的卷积操作。而在图结 构中节点的度数可以任意变化,每个邻域中的节点数都可能不一样,我们没 有办法直接把卷积操作复制到图上。 2.排列不变性         当我们任意变换两个节点在图结构中的空间位置时,整个图的结构是不变 的。如果用邻接矩阵表示图,调换邻接矩阵的两行,则图的最终表示应该是不 变的。在网格中,例如在图像上,如果我们变换两行像素,则图像的结构会明 显变化。因此,我们没有办法像处理图像一样直接用卷积神经网络处理图的邻 接矩阵,因为这样得到的表示不具有排列不变性。 3. 边的额外属性         大部分图结构上的边并非只能取值二元的{0,1},因为实体和实体的关系不 仅仅是有和没有,在很多情况下,我们希望了解这些实体关系连接的强度或者 类型。强度对应到边的权重,而类型则对应到边的属性。显然在网格中边 是没有任何属性和权重的,而卷积神经网络也没有可以处理边的属性的机制。 2.2将深度学习扩展到图上的挑战         由于图结构的普遍性,将深度学习扩展到图结构上的研究得到了越来越多的关注,图神经网络(GraphNeuralNetworks,GNN)的模型应运而生。深度学习在图上的应用有以下几个难点。

(1)图数据的不规则性 

(2) 图结构的多样性         作为表示实体关系的数据类型,图结构具有丰富的变体。图可以是无向的, 也可以是有向的;可以是无权重的,也可以是有权重的;除了同质图,还有异 构图等等。 (3) 图数据的大规模性         大数据作为深度学习的‘燃料”’在各个应用领域发挥了重要的作用。在大 数据时代,我们同样面临大规模的图的处理难题。我们常用的图结构数据,如 互联网、社交网络、金融交易网络,动辄有数以亿计的节点和边,这对深度学 习模型的效率提出了很高的要求。 (4) 图研究的跨领域性         我们介绍了各种各样的图,很容易发现图的研究是横跨很多不同的领域的,而在很多任务上,研究图的性质都需要具有领域知识。例如,对 分子图的性质进行预测,我们需要具有一些化学知识;对逻辑表达式的图进行 处理,我们需要具有一些逻辑学知识。
2.2图神经网络的分类

        通过图神经网络的发展历史,我们可以将它分成了谱域上的图神经网络和空域上的图神经网络。除此之外,根据不同的性质,图神经网络还可以分为:

 (1)卷积模式 vs 循环模式

        从信息传递的方式来看,图卷积网络等是模仿卷积神经网络定义了图上的 卷积操作,门控图神经网络等则是用序列上的循环神经网络模型来更新节点状态。随着图神经网络变形的增多,这种分类并不能包含所有的信息传递方式,但对我们理解图神经网络有很大的帮助。

(2) 有监督 vs 无监督

        根据有无标签(节点的标签或者图的标签),我们把图神经网络分为有监督的和无监督的。有监督的类别中又常常分为归纳式的和直推式的。归纳式的模型不需要测试数据出现在训练中,而直推式的模型则是半监督的,也就是在训练过程中已经包含了测试数据。

(3) 单图 vs 

        很多谱域的图神经网络由于不能在不同的图之间共享参数,只能限定在单图的任务上;而有些图神经网络(如图匹配相关的网络),由于要借助其他图的信息来学习节点的表示,只能限定在多图的任务上。大部分图神经网络既能在单图学习,也能在多图上学习。

3.图       

3.1 图数据上的任务

        按照元素和层级划分,深度学习在图数据上的任务主要分为3类。

(1)节点上的任务:包括节点的分类、回归、聚类等。例如,在引文网络中,我们对每个论文节点的领域和主题进行预测,就是一个最常用的节点的分类任务。

(2)边上的任务:包括边的分类、链路预测等。链路预测在人工智能产品中有着广泛的应用,例如产品推荐就可以看作预测用户和产品之间的连接。

(3)图上的任务:包括图的分类、图的生成、图的匹配等。图的分类是基于图的表示对整个图的性质进行预测,例如分子图性质的预测、定理图正确与否的预测等。

        还有一些图上的任务并不能简单地归类到以上3类,尤其是一些图神经网络与其他任务结合的衍生任务,(如利用图神经网络的时间序列分析,把图神经网络作为编码器的,但它们大多也是基于图的某一层级的表示(节点或图)来展开的。

4.图神经网络的应用领域

        由于图结构的普遍性和图神经网络强大的表征能力,在实际应用中图神经网络已经拓展到了人工智能的各个领域,包括网络分析、自然语言处理、计算机视觉、推荐系统等。这里只列举一些常见的图结构和这些图上的应用。

        计算机视觉:计算机视觉是图神经网络应用最广泛的领域之一,在图像和视频中有很多容易建立的图结构。例如,图像中的像素、点云中的点,可以基于空间关系构建图,用于图像识别和图像分割;图像中检测到的目标物体联合起来,目标识别之后可以建立场景图,方便计算机更好地理解图像中的信息;而在视频中的动作识别任务中,人体骨架的各个部分也可以通过关节 的连接构成一个图,帮助我们进行人体动作的分析。

        自然语言处理:自然语言处理的对象通常是文本。虽然文本上没有明显的图数据,但实则隐藏着丰富的图结构。例如,句子可以利用语法树表示成图结构,从而获得更好的句子编码表示,在机器翻译、语义角色标注、语义分析等任务中都有重要的应用。另外,文本段落中的实体可以构成网络, 帮助问答系统;文本之间的相似度可以构建图来做文本分类,文本中的词也可以构成图来做文本分类等。

        物理系统/交通网:物理世界中的物体、交通网络中的传感器等,都可以描述成图结构中的节点,从而用图神经网络预测它们的状态或者它们之间的交互。

        化学/生物/医疗:蛋白质和分子本身的化学结构都可以表示成图,于是我们可以用图神经网络对它们建模,预测蛋白质的作用界面、 分子的性质和化学反应,以及新分子的生成等等。除此之外,药物和蛋白质之间的作用也可以表示成交互作用图,来做药物副反应的预测等。

        知识图谱:知识图谱上的任务通常包括知识图谱的补全、知识图谱上的推理、不同知识图谱的匹配、利用知识图谱辅助完成其他预测任务等。虽然知识图谱上的图嵌入有一套相对独立的方法,但是越来越多的研究者开始尝试用图神经网络的方法来探索这个领域。在知识图谱中,常见的任务是知识图谱的补全,也就是推断出知识图谱中缺失的节点或者关系。例如,我们只知道<卢浮宫,位于>,想要推断出“巴黎”;或者只知 道<卢浮宫,巴黎>,需要推断它们之间的关系。在知识图谱中,我们经常利用本来存在的关系推断出未知的隐含关系,如从<蒙娜丽莎,在,卢浮宫>和 <卢浮宫,位于,巴黎>推断出<蒙娜丽莎,在巴黎>。

        推荐系统推荐系统一般构建在用户---产品图上,根据用户的购买习惯对用户推荐产品,可以看作一个异构图上的链路预测问题。

        金融:在金融领域,常见的任务有反洗钱、欺诈检测等。如果我们把交易双方作为节点,交易本身作为边,则在金融交易的图结构里,这两个任务就相当于边(或节点)的分类。

        组合优化问题图上的很多问题都是NP 困难的。这些问题同样可以采用 图神经网络来近似,如SAT 问题、TSP问题、图染色问题等。

        其他:随着图神经网络的研究越来越深入,它的应用延伸的领域也越来越广泛,有定理证明,程序推断,迁移学习,强化学习等。由于图结构的普遍性,图神经网络的潜在应用几乎无处不在。

 

标签:卷积,图谱,可以,基础,任务,神经网络,节点
From: https://blog.csdn.net/m0_63860007/article/details/141924750

相关文章

  • Linux基础操作
    目录1:XShell下的复制粘贴2:全屏3:进入自己的用户4:用root账户,创建普通用户5:输错时可以ctrlc换行 指令可以携带选项 文件属性​编辑​编辑6:文件介绍和类型7:ls指令(ls/home查看自己的创建用户)8:pwd命令9:cd指令10:touch指令11:mkdir指令(重要)12:tree的创......
  • ComfyUI 基础教程(三) —— 应用 Controlnet 精准控制图像生成
    一、前言你是否有见过下面类似这样的图片:看起来平平无奇,当你站远点看,或者把眼睛眯成一条缝了看,你会发现,这个图中藏有一些特别的元素。这就是利用了Ai绘画中的ControlNet,实现对图片的相对更精准控制。上一篇文章讲述了文生图的基本工作流和最基础的核心插件用法。通过提示......
  • 网络编程基础
    五种IO模型计算机编程中,IO模型是描述程序与输入/输出操作之间交互方式的抽象概念。不同的IO模型可以影响程序的性能、可扩展性和资源利用效率。我们常见有五种IO模型:阻塞式IO、非阻塞式IO、IO多路复用、信号驱动IO、异步IO。阻塞式IOlistenfd=socket();//打开......
  • C++继承基础
    虚函数默认实参C++默认实参是靠编译器实现的,因此默认实参不参与动态绑定,默认实参有静态类型决定。访问控制每个类分别控制自己的成员初始化过程,还分别控制其成员对于派生类来说是否可访问,友元不继承。成员:protected:派生类可见、自己、friend可见public:所有可见private:自己......
  • 【网络安全】服务基础第二阶段——第三节:Linux系统管理基础----Linux用户与组管理
    目录一、用户与组管理命令1.1用户分类与UID范围1.2用户管理命令1.2.1useradd1.2.2groupadd1.2.3usermod1.2.4userdel1.3组管理命令1.3.1groupdel1.3.2查看密码文件/etc/shadow1.3.4passwd1.4Linux密码暴力破解二、权限管理2.1文件与目录权限2.2目......
  • 【网络安全】服务基础第二阶段——第二节:Linux系统管理基础----Linux统计,高阶命令
    目录一、Linux高阶命令1.1管道符的基本原理1.2重定向1.2.1输出重定向1.2.2输入重定向1.2.3wc命令基本用法1.3别名1.3.1which命令基本语法1.3.2alias命令基本语法1.4压缩归档tar1.4.1第一种:gzip压缩1.4.2第二种:bzip压缩1.5tar命令二、VIM编辑器使用2......
  • js逆向基础14异步编程3
    上节课遗留.finally.finally()方法不管Promise对象最后的状态如何都会执行.finally()方法的回调函数不接收任何的参数,也就是你在.finally()函数中是没法知道Promise最终的状态是resolved还是rejected的它最终返回的默认会是一个上一次的Promise对象值,不过抛出的是一个异常......
  • 信息学奥赛初赛天天练-85-NOIP2014普及组-基础题4-链表、随机存取、顺序存取、二分查
    信息学奥赛初赛天天练-85-NOIP2014普及组-基础题4-链表、随机存取、顺序存取、二分查找、二分比较、循环结构、图领奖PDF文档公众号回复关键字:202409071NOIP2014普及组基础题49下列选项中不属于图像格式的是()AJPEG格式BTXT格式CGIF格式DPNG格式1......
  • SAP B1 基础实操 - 用户定义字段 (UDF)
    目录一、功能介绍1. 使用场景2.操作逻辑3.常用定义部分3.1主数据3.2营销单据4.字段设置表单4.1字段基础信息4.2不同类详细设置4.3默认值/必填二、案例1 要求2操作步骤一、功能介绍1. 使用场景在实施过程中,经常会碰见用户需要的信息字段在标准单......
  • 【人工智能学习笔记】1_人工智能基础
    本系列是个人学习《阿里云人工智能工程师ACA认证免费课程(2023版)》的笔记,仅为个人学习记录,欢迎交流,感谢批评指正人工智能概述智能的三大能力:感知、记忆与思维、学习与适应能力人工智能的定义明斯基:“人工智能是一门科学,是使机器做那些人需要通过智能来做的事情”尼尔森......