首页 > 其他分享 >视频】复杂网络分析CNA简介与R语言对婚礼数据聚类社区检测和可视化|数据分享|附代码数据

视频】复杂网络分析CNA简介与R语言对婚礼数据聚类社区检测和可视化|数据分享|附代码数据

时间:2023-05-20 10:05:14浏览次数:47  
标签:1.0000000 复杂 网络 可视化 网络分析 聚类 数据 节点

最近我们被客户要求撰写关于复杂网络分析的研究报告,包括一些图形和统计输出。

复杂网络分析研究如何识别、描述、可视化和分析复杂网络。

为了用R来处理网络数据,我们使用婚礼数据集

CNA 研究和应用爆炸式增长的突出原因是两个因素 - 一个是廉价而强大的计算机的可用性,使在数学、物理和社会科学方面接受过高级培训的研究人员和科学家能够进行一流的研究;另一个因素是是人类社会、行为、生物、金融和技术方面不断增加的复杂性。

网络是离散数据的组织和表示的关系形式。关于网络的两个最重要的概念是实体和它们之间的关系。实体称为节点,关系称为边。网络节点和边是高级抽象,对于大多数网络来说,它们的真实性质并不重要。当必要时,我们通过添加属性来表示节点和边。关系或边通常涉及两个离散的实体或节点,尽管实体可以与自身存在关系,这种关系称为自反关系。

视频】复杂网络分析CNA简介与R语言对婚礼数据聚类社区检测和可视化|数据分享|附代码数据_聚类

在讨论复杂网络的真正样子之前,让我们先谈谈有时称为经典网络的基本简单网络。 经典网络的一个例子是线性网络——我们生命的时间线,每个生命事件(例如“出生”、“第一次走路”、“学校毕业”、“婚姻”和最终的“死亡”)都是一个实体至少一个属性是时间。“发生在之后”是这种情况下的关系,因为一条边将两个事件连接在一起,一个事件紧接着另一个事件发生。这个网络之所以被认为是简单的,是因为它具有规则的结构,而不是因为它很小。

视频】复杂网络分析CNA简介与R语言对婚礼数据聚类社区检测和可视化|数据分享|附代码数据_数据挖掘_02

视频】复杂网络分析CNA简介与R语言对婚礼数据聚类社区检测和可视化|数据分享|附代码数据_聚类_03

线性时间线


点击标题查阅往期内容

视频】复杂网络分析CNA简介与R语言对婚礼数据聚类社区检测和可视化|数据分享|附代码数据_复杂网络_04

航空公司复杂网络对疫情进行建模

视频】复杂网络分析CNA简介与R语言对婚礼数据聚类社区检测和可视化|数据分享|附代码数据_聚类_05

左右滑动查看更多

视频】复杂网络分析CNA简介与R语言对婚礼数据聚类社区检测和可视化|数据分享|附代码数据_聚类_06

01

视频】复杂网络分析CNA简介与R语言对婚礼数据聚类社区检测和可视化|数据分享|附代码数据_数据挖掘_07

02

视频】复杂网络分析CNA简介与R语言对婚礼数据聚类社区检测和可视化|数据分享|附代码数据_数据挖掘_08

03

视频】复杂网络分析CNA简介与R语言对婚礼数据聚类社区检测和可视化|数据分享|附代码数据_聚类_09

04

视频】复杂网络分析CNA简介与R语言对婚礼数据聚类社区检测和可视化|数据分享|附代码数据_聚类_10

**
**

复杂的网络具有非平凡的结构,它既不是网格也不是树。

视频】复杂网络分析CNA简介与R语言对婚礼数据聚类社区检测和可视化|数据分享|附代码数据_数据挖掘_11

视频】复杂网络分析CNA简介与R语言对婚礼数据聚类社区检测和可视化|数据分享|附代码数据_聚类_12

 

由于没有全局控制的分散过程,这些复杂的网络发生在自然界和人造世界中。此类网络的一些代表包括:

  1. 社交网络:家人和朋友、Twitter 和 instagram 追随者等。
  2. 文化网络: 宗教网络、语言家族等。
  3. 技术网络: 交通和通讯系统等……
  4. 金融网络: 华尔街市场、国际贸易等。
  5. 生物网络: 基因/蛋白质相互作用、疾病流行等。

视频】复杂网络分析CNA简介与R语言对婚礼数据聚类社区检测和可视化|数据分享|附代码数据_聚类_13

R语言复杂网络分析:聚类(社区检测)和可视化

为了用R来处理网络数据,我们使用婚礼数据集 ( 查看文末了解数据获取方式 ) 。

 nflo=network(flo,directed=FALSE)

 plot(nflo, displaylabels = TRUE,+ boxed.labels =+ FALSE)

视频】复杂网络分析CNA简介与R语言对婚礼数据聚类社区检测和可视化|数据分享|附代码数据_复杂网络_14

下一步是igraph。由于我们有邻接矩阵,因此可以使用它

graph_from_adjacency_matrix(flo,

+ mode = "undirected")

视频】复杂网络分析CNA简介与R语言对婚礼数据聚类社区检测和可视化|数据分享|附代码数据_复杂网络_15

我们可以在两个特定节点之间获得最短路径。我们给节点赋予适当的颜色

all_shortest_paths(iflo,

 )

 

 

> plot(iflo)

视频】复杂网络分析CNA简介与R语言对婚礼数据聚类社区检测和可视化|数据分享|附代码数据_复杂网络_16

我们还可以可视化边,需要从输出中提取边缘

> lins=c(paste(as.character(L)[1:4],

+ "--" 

+ as.character(L)[2:5]  sep="" ,

+ paste(as.character(L) 2:5],

+ "--",

 

> E(ifl )$color=c("grey","black")[1+EU]> plot(iflo)

视频】复杂网络分析CNA简介与R语言对婚礼数据聚类社区检测和可视化|数据分享|附代码数据_聚类_17

也可以使用D3js可视化

> library( networkD3 )

> simpleNetwork (df)

视频】复杂网络分析CNA简介与R语言对婚礼数据聚类社区检测和可视化|数据分享|附代码数据_复杂网络_18

下一个问题是向网络添加一个顶点。最简单的方法是通过邻接矩阵实现概率

> flo2["f","v"]=1> flo2["v","f"]=1

视频】复杂网络分析CNA简介与R语言对婚礼数据聚类社区检测和可视化|数据分享|附代码数据_数据挖掘_19

然后,我们进行集中度测量。

视频】复杂网络分析CNA简介与R语言对婚礼数据聚类社区检测和可视化|数据分享|附代码数据_聚类_20

目的是了解它们之间的关系。

betweenness(ilo)

 

> cor(base)

betw close deg eig

betw 1.0000000 0.5763487 0.8333763 0.6737162close 0.5763487 1.0000000 0.7572778 0.7989789deg 0.8333763 0.7572778 1.0000000 0.9404647eig 0.6737162 0.7989789 0.9404647 1.0000000

可以使用层次聚类图来可视化集中度度量

hclust(dist( ase  ,

+ method="ward")

视频】复杂网络分析CNA简介与R语言对婚礼数据聚类社区检测和可视化|数据分享|附代码数据_复杂网络_21

相关视频

**

拓端

,赞20

查看集中度度量的值,查看排名

> for(i in 1:4) rbase[,i]=rank(base[,i])

视频】复杂网络分析CNA简介与R语言对婚礼数据聚类社区检测和可视化|数据分享|附代码数据_数据挖掘_22

在此,特征向量测度非常接近顶点的度数。

最后,寻找聚类(以防这些家庭之间爆发战争)

> kc <- fastgreedy.community ( iflo )

在这里,我们有3类

视频】复杂网络分析CNA简介与R语言对婚礼数据聚类社区检测和可视化|数据分享|附代码数据_复杂网络_23

视频】复杂网络分析CNA简介与R语言对婚礼数据聚类社区检测和可视化|数据分享|附代码数据_数据挖掘_24

视频】复杂网络分析CNA简介与R语言对婚礼数据聚类社区检测和可视化|数据分享|附代码数据_聚类_25



标签:1.0000000,复杂,网络,可视化,网络分析,聚类,数据,节点
From: https://blog.51cto.com/u_14293657/6317164

相关文章

  • 使用ssm框架出现数据库连接问题
    java.sql.SQLException:Accessdeniedforuser'jdbc:mysql://localhost:3306/oa?useSSL=false&allo'@'localhost'(usingpassword:YES)或者是PublicKeyRetrievalisnotallowed查阅资料发现当publicKeyRetrievalisnotAllowed错误解决或依然会出现数据连接失败问......
  • 【爬虫数据集】李子柒YouTube频道TOP10热门视频的TOP2000热门评论,共计2W条
    目录一、背景二、爬取目标三、结果展示四、演示视频五、附完整数据一、背景这段时间,有超多小伙伴找我要YouTube数据,做数据分析、情感分析之类的研究工作,但很多人并不是计算机软件相关专业,不具备爬虫开发技术,但又有数据需求,可能是新闻传播学、社会学等相关学科,旨在分析社会热点现......
  • 经常搞不清楚的几个数据类型
    1、什么是浮点数?之前我们学习了定点数,其中「定点」指的是约定小数点位置固定不变。那浮点数的「浮点」就是指,其小数点的位置是可以是漂浮不定的。这怎么理解呢?其实,浮点数是采用科学计数法的方式来表示的,例如十进制小数8.345,用科学计数法表示,可以有多种方式:8.345=8.345*1......
  • 数据结构!
    AT_joisc2014_c 歴史の研究该起床了。该起床了。该起床了。该起床了。该起床了。本题删除会改变最大值,十分麻烦,所以使用回滚莫队即可。该起床了。该起床了。该起床了。该起床了。该起床了。P3245 [HNOI2016]大数考虑如何提取区间\([l,r]\)组成的数。设\(SA_i\)......
  • MyBatis 在大数据量下使用流式查询进行数据同步
    通常的数据同步中,如果数据量比较少的话可以直接全量同步,默认情况下,完整的检索结果集会将其存储在内存中。在大多数情况下,这是最有效的操作方式,并且由于MySQL网络协议的设计,因此更易于实现。但是如果数据量很大的话,全量同步需要大量的内存,如果内存不足的话则可能会导致内存溢出。......
  • 数据结构基础一
    数据结构基础一1.单链表(数组模拟)常用的是邻接表(其实就是单链表,邻接表就是用多个单链表存储了多条线?!),一般用来存储图和树,使用结构体和指针来表示数组的时候,是使用的动态开辟空间,速度太慢,所以一般使用数组来静态模拟单链表。数组模拟单链表的思路:首先开辟两个足够大的数组,一个是存......
  • boot-admin 项目数据库缺省字段设计之最佳实践
    数据库(Database)中的缺省字段(也称为默认字段),就是在一般情况下,每个数据表(Table)必须包含的字段(Field),这类字段用于满足特定的数据需求,字段值的填充或更改一般遵照一定的逻辑要求。缺省字段的设计应该考虑到数据的完整性和一致性,以确保数据的正确与可靠,设计合理的表字段对于数据的有效......
  • 【大数据】Presto(Trino)REST API 与执行计划介绍
    目录一、概述二、环境准备三、常用RESTAPI1)worker节点优雅退出2)提交SQL查询请求3)获取查询状态4)获取查询结果5)取消查询请求6)获取Presto节点信息7)获取Presto服务器使用统计信息8)获取查询计划四、Presto(Trino)执行计划一、概述Presto(现在叫Trino)是一个分布式SQL查询引擎,它允许......
  • 用于 LLM 的公开的数值数据
    用于LLM的公开的数值数据这个存储库包含了用于训练OpenAI的大型语言模型的一部分公开的数值数据。这些数据已经被处理成符合OpenAI的数据管道格式。此外,我们还提供了一个 Python脚本,用于将原始的表格数据转换成适合训练的格式。数据来源这些数据来自于以下公开的来源:......
  • 网络数据库安全概述1
    一.概述   20世纪70年代初,美国军方率先发起对多级安全数据库管理系统(MultilevelSecureDatabaseManagementSystem,MLSDBMS)的研究,此后提出了一系列的数据库安全模型。  20世纪80年代,美国国防部根据军用计算机系统安全需要,制定了《可信计算机系统安全评估标准》(Trus......