首页 > 编程语言 >Characterizing Graph Datasets for Node Classification Homophily-Heterophily Dichotomy and Beyond

Characterizing Graph Datasets for Node Classification Homophily-Heterophily Dichotomy and Beyond

时间:2024-02-27 17:25:23浏览次数:24  
标签:Node Heterophily Datasets frac homophily checkmark class sum metric

目录

Platonov O., Kuznedelev D., Babenko A. and Prokhorenkova L. Characterizing graph datasets for node classification: homophily-heterophily dichotomy and beyond. NIPS, 2023.

阐述合理的 homophily metrics 所应该遵守的一些准则, 同时分析现有准则的不足之处, 并给出一些更好的改进.

符号说明

  • \(G = (V, E)\), graph;
  • \(|V| = n\);
  • \(\mathbf{x}_v \in \mathbb{R}^m\), feature vector;
  • \(y_v \in \{1, \ldots, C\}\), class label;
  • \(n_k = |\{v: y_v = k\}|\);
  • \(N(v)\), 结点 \(v\) 的邻居;
  • \(d(v) = |N(v)|\);
  • \(p(k) = \frac{n_k}{n}\), empirical distribution of class labels;
  • \(\bar{p}(k) = \frac{\sum_{v: y_v=k} d(v)}{2 |E|}\), degree-weighted distribution.
  • Edge homophily:

    \[h_{edge} = \frac{ |\{u, v\} \in E: y_u = y_v| }{ |E| }. \]

  • Node homophily:

    \[h_{node} = \frac{1}{n} \sum_{v \in V} \frac{ |\{u \in N(v): y_u = y_v\} }{ d(v) }. \]

  • Class homophily:

    \[h_{class} = \frac{1}{C-1} \sum_{k=1}^C \bigg[ \frac{ \sum_{v: y_v = k} |\{u \in N(v): y_u = y_v\}| }{ \sum_{v: y_v=k} d(v) } - \frac{n_k}{n} \bigg]. \]

理想的准则

  • Maximal agreement: 一个理想的 homophily metric 应当保证存在一个可达的上界 \(c_{\mathrm{max}}\), 且满足如果图 \(G\) 满足 \(y_u=y_v, \: \forall \{u, v\} \in E\) 成立, 就有

    \[h(G) = c_{\text{max}}. \]

    反之, 若不成立, 应当有

    \[h(G) < c_{\text{max}}. \]

  • Minimal agreement: 一个理想的 homophily metric 应当保证存在一个可达的下界 \(c_{\mathrm{min}}\), 且满足如果图 \(G\) 满足 \(y_u \not= y_v, \: \forall \{u, v\} \in E\) 成立, 就有

    \[h(G) = c_{\text{min}}. \]

    反之, 若不成立, 应当有

    \[h(G) > c_{\text{min}}. \]

  • Asymptotic constant baseline: (这里我大概介绍一下, 具体的定义请参见原文) 倘若一个图的边是独立于结点的类别的, 那么显然这个图的 homophily value 就不应该太高. 理想的 homophily metric 应当近似满足这一性质.

  • Empty class tolerance: 假设我们给一个图添加一些虚拟的类别 (但是不分配任何点和边), homophily value 应该保持不变. 理想的 homophily metric 应当满足这一性质 (个人感觉这个性质不那么重要).

  • Monotonicity for edge-wise homophily measures: 首先, 让我们定义 class adjacency matrix \(\mathcal{C}\) 为

    \[ c_{ij} = |\{ (u, v) | \{u, v\} \in E, y_u=i, y_v = j \}|. \]

    注: \(\{u, v\} \in E\) 意味着同时存在两条边 \((u, v), (v, u)\).
    单调性就是指, homophily metric 增加若 \(\mathcal{C}\) 的对角线元素增加, homophily metric 减少 若 \(\mathcal{C}\) 的非对角线元素增加.

现有的 metrics 的分析

Maximal Minimal Constant Empty class Monotonicity
\(h_{edge}\) \(\checkmark\) \(\checkmark\) \(\checkmark\) \(\checkmark\)
\(h_{node}\) \(\checkmark\) \(\checkmark\) \(\checkmark\)
\(h_{class}\) \(\checkmark\)
\(h_{adj}\) \(\checkmark\) \(\sqrt{}\mkern-9mu{\smallsetminus}\) \(\checkmark\) \(\checkmark\)
  • 可以发现, \(h_{edge}\) 是上述三种 metrics 符合的比较好的一个指标了, 但是比较重要的 asymptoic constant baseline 的性质并不满足, 这容易导致一些同质图可能会被识别为异质图 (或者相反).

  • 作者给出了如下的一个改进策略:

    \[ h_{adj} = \frac{ h_{edge} - \sum_{k=1}^C \bar{p}(k)^2 }{ 1 - \sum_{k=1}^C \bar{p}(k)^2 }. \]

注: 还有一些其它方面的讨论, 请回看原文.

标签:Node,Heterophily,Datasets,frac,homophily,checkmark,class,sum,metric
From: https://www.cnblogs.com/MTandHJ/p/18037314

相关文章

  • Revisiting Heterophily For Graph Neural Networks
    目录概符号说明HomophilymetricsPost-aggregationnodesimilaritymatrix代码LuanS.,HuaC.,LuQ.,ZhuJ.,ZhaoM.,ZhangS.,ChangX.andPrecupD.Revisitingheterophilyforgraphneuralnetworks.NIPS,2022.概介绍了一种新的graphhomophilymetrics.符......
  • windows使用nvm安装多个版本node环境并切换node使用版本
    一、介绍使用nvm可以方便的在同一台设备上进行多个node版本之间切换,解决不同的项目所使用的node版本不一样的问题二、安装nvm如果已安装node环境先卸载后再安装nvm,防止出现不确定错误1、卸载node环境,并清除node环境变量配置通过程序和功能找到node卸载删除环境变量path中no......
  • node
    Node.js(通常简称为Node)是一个开源和跨平台的JavaScript运行时环境,它允许开发者在服务器端运行JavaScript代码。在Node.js出现之前,JavaScript主要用于在浏览器中运行,用于实现网页的动态效果和交互功能。Node.js的出现将JavaScript的应用范围扩展到了服务器端,使得开发者可以使用Jav......
  • Node安装及创建Vite项目
    1.安装node进入官网下载:Node.js(nodejs.org) 选择安装路径后,默认安装;确认是否成功安装: 2.创建vite项目npminitvite-apptestvite 3.启动cdtestvitenpmrundev 4.确认 ......
  • LeetCode] 2476. Closest Nodes Queries in a Binary Search Tree
    Youaregiventherootofabinarysearchtreeandanarrayqueriesofsizenconsistingofpositiveintegers.Finda2Darrayanswerofsizenwhereanswer[i]=[mini,maxi]:miniisthelargestvalueinthetreethatissmallerthanorequaltoqueries[......
  • vscode报错,nodemon 在此系统上禁止运行脚本
    1.vscode报错,nodemon:因为在此系统上禁止运行脚本注意:不仅仅适用于nodemon报错,报在此系统上禁止运行脚本的错都可以用以下方法解决2.报错原因分析:windows为了安全,默认的执行策略为Restricted,因此需要将执行策略设置为RemoteSigned即可3.解决方法  (1)get-exec......
  • 如何在Nodejs中切换版本
    Node.js的版本更新很快,有时候我们需要切换到更新的版本,以获取最新的功能和性能改进。Nodejs提供了多种方法来切换版本,下面介绍几种常用的方法:1.使用nvm切换版本NVM(NodeVersionManager)是一个管理Node.js版本的工具,可以让我们轻松地安装、卸载和切换Node.js版本。#安装nvm......
  • Graph-Skeleton: ~1% Nodes are Sufficient to Represent Billion-Scale Graph
    目录概符号说明EmpiricalAnalysisSkeletonGraphNodeFetchingGraphCondensation代码CaoL.,DengH.,WangC.,ChenL.andYangY.Graph-skeleton:~1%nodesaresufficienttorepresentbillion-scalegraph.WWW,2024.概本文提出了一种图压缩的方法,这些方法基......
  • follow-redirects 可以直接替换node http & https 的npm 模块
    follow-redirects可以直接替换nodehttp&https的npm模块包含的特性支持重定向功能支持重定向参数配置,比如最大重定向,以及最大请求大小,支持beforeredirect请求处理(比如认证处理)支持agents说明对于业务系统的请求会包含重定向场景的,follow-redirects是一个很不错的选......
  • 团队协作如何确保项目Node版本的一致性?
    前言想必大家在工作过程中都遇到过node版本带来的各种各样的问题,对于团队协作项目,你不能保证所有人的本地node版本都相同,所以在项目文档中往往会写上以下内容:为与线上环境一致,请保证以下版本node:15.x.xvue-cli:4.4.x但这样并不能完全避免问题,比如多个不同项目中使用的node版......