首页 > 其他分享 >Sampling from Large Graphs

Sampling from Large Graphs

时间:2023-10-18 21:58:18浏览次数:45  
标签:Node 结点 Random sampling Large Graphs 随机 Sampling

目录

Leskovec J. and Faloutsos C. Sampling from large graphs. KDD, 2006.

讨论了不同稀疏化方法对于 large-graph 的`结构' 的保持.

主要内容

  • 作者本文的目的是希望比较不同的'稀疏化'方法:

    1. 利用一些方法从大图 \(G\) 中采样子图 \(g\) (更少的结点数或更少的边或者二者);
    2. 希望 \(g\) 能够和大图 \(G\) 有一些共同的性质;
    3. 然后我们可以在小图 \(g\) 上做一些大图上难以做到的推理和模拟.
  • Sampling by random node selection:

    • RN (Random Node sampling): 随机选择一部分结点;
    • RPN (Random PageRank Node sampling): 首先用 PageRank 算出每个结点的权重, 然后根据权重随机选择点;
    • RDN (Random Degree Node): 根据 degree 随机选择点;
  • Sampling by random edge selection:

    • RE (Random Edge sampling): 随机选择边;
    • RNE (Random Node-Edge sampling): 先随机选个点, 然后在选择一条其上的边, 不断重复;
    • HYB (Hybrid): 上述两种策略混合进行;
  • Sampling by exploration:

    • RNN (Random Node Neighbor sampling): 选择一个点, 然后随机选一个邻居 (加上边), 重复进行.
    • RW (Random Walk sampling): 带 restart 的随机游走;
    • FF (Forest Fire sampling): 感觉像是扩散, 具体的算法没讲.

  • 作者考虑了诸如 degree, hops 等结构的指标, 上表是不同方法展示出来的差异 (越小越好), 虽然各有千秋, 总的来说 RW, FF, RPN 效果比较好.

  • 作者还讨论了一些更为复杂的 (动态图) 的采样, 具体请回看原文.

标签:Node,结点,Random,sampling,Large,Graphs,随机,Sampling
From: https://www.cnblogs.com/MTandHJ/p/17773430.html

相关文章

  • ORA-12899: value too large for column
    Errorsinfile/lbc/lionrdb/app/product/diag/rdbms/cnlionrdb/lionrdb02/trace/lionrdb02_j000_242326.trc:ORA-12012:erroronautoexecuteofjob3964ORA-12008:errorinmaterializedviewrefreshpathORA-12899:valuetoolargeforcolumn"FLUSR"......
  • 论文:Very deep convolutional networks for large-scale image recognition-VGG
    论文名:Verydeepconvolutionalnetworksforlarge-scaleimagerecognition"用于大规模图像识别的深度卷积网络"了解VGG模型研究问题:研究方法:主要结论:模型:问题:行文结构梳理:......
  • grpc服务报错: http2 frame too large
    报错如下:14xxBadRequesterrorreadingserverpreface:http2:frametoolarge其中4xx为客户端报错中的一个具体数字。比如:404/415,仅以报错举例,且出现报错码不固定。但是errormsg的核心内容不变:frametoolarge...这个是因为客户端在没有TLS加密的情况下发送HTT......
  • Running Large Language Models locally – Your own ChatGPT-like AI in C#
    Forthepastfewmonths,alotofnewsintechaswellasmainstreammediahasbeenaround ChatGPT,anArtificialIntelligence(AI)productbythefolksat OpenAI.ChatGPTisaLargeLanguageModel(LLM)thatisfine-tunedforconversation.Whileunderval......
  • Go - Creating Graphs
    Problem: Youwanttocreateaweightedgraphdatastructure.Solution: CreatestructsfornodesandedgesandplacetheminaGraphstruct.CreateandattachfunctionstoGraphtocreatenodesandedgesforthegraph. Graphsareverycommonnonlineard......
  • Lecture 2: Data Sampling and Probability
    详细地址:data100Lecture21.引1.1图表的使用两张图片基于相同数据生成,但是表达的意思、想突出的重点完全不一样1.2数据科学生命周期上图是数据科学生命周期,这节课就将如何收集数据2.人口普查和调查可能会有许多误差,有的人无家可归等等,需要理解数据3.取样:定义A......
  • G. Counting Graphs
    G.CountingGraphs题意:添加几条线段,使得图仍保持原先的最小生成树通过画图我们发现,要添加u->v的线段,线段必须大于u->v的路径内的最大值,不然会破坏原先的最小生成树。那么该怎么维护路径内的最大值呢?方法:1.我们对边的大小进行排序,这样当前边一定大于等于之前的边,只要对当前边......
  • ES报错:[parent] Data too large, data for [<http_request>] would be larger than limi
    ES报错:[parent]Datatoolarge,datafor[<http_request>]wouldbelargerthanlimitofXXXX  当es这个错误的时候:[parent]Datatoolarge,datafor[<http_request>]wouldbelargerthanlimitof[23941899878/22.2gb],with{bytes_wanted=23941987633bytes_l......
  • CF1857G Counting Graphs
    题目链接考虑每条非树边的取值,显然不能小于等于该边与树边形成的环中的最大值(当然这条非树边也可以不存在),所以每条非树边的取值范围就是\(S-max(w)+1\)(\(+1\)的原因是该边可能不存在)。暴力枚举肯定会超时,考虑优化。发现\(kruskal\)算法获得最小生成树的过程中,按从小到......
  • 无涯教程-JavaScript - LARGE函数
    描述LARGE函数返回数据集中的第k个最大值。您可以使用此功能根据其相对地位选择一个值。语法LARGE(array,k)争论Argument描述Required/OptionalArrayThearrayorrangeofdataforwhichyouwanttodeterminethek-thlargestvalue.RequiredKTheposition......