将csv文件导入gephi,并构建图(带地理信息)
思路:
有时候,构建了网络后,无法保存为gexf文件,保存了可能无法使用gephi打开。有一种处理的方法,是将nodes和edges数据导入到gephi中。但是自己的数据导入到gephi中,往往会有一些问题。这边推荐:先在gephi中根据自己的数据创建列,如lon、lat列,并将列的类型设为Float
。之后,将空的gephi 节点、边数据导出,将自己的数据填充到对应的列。再将文件导入gephi中,就没有什么问题了。
eg:给node.csv文件添加lon、lat用于地理布局
1. gephi_nodes.csv导出
- 在gephi 数据资料视图中,添加
lon
、lat
两列。导出为csv空文件:gephi_nodes.csv - 导出:注意列的选择,不需要的列要去掉
2. gephi_edges.csv导出
gephi边文件导出:
注意:gephi导出的边文件选项中,默认包含 Source
,Target
两列 。 注意去掉不需要的列
3. 自己的数据填充到gephi_nodes和gephi_edges中
3.1自己的nodes、edges数据展示:
edges数据中的起终节点列分别是node_start
和node_end
,下面使用python代码进行处理,填充到gephi_edges中
3.2 数据处理(python)
import pandas as pd
gephi_edges = pd.read_csv('./test/gephi_edges.csv')
gephi_nodes = pd.read_csv('./test/gephi_nodes.csv')
# nodes 数据处理:
gephi_nodes['Id'] = nodes['nodeID']\
# 将nodes的geometry,分成lon|lat两列
O_xy = nodes['geometry'].apply(lambda p: list(p.coords)).explode().apply(pd.Series).rename(columns=({0:"x", 1:"y"}))
nodes['x'] = O_xy['x']
nodes['y'] = O_xy['y']
gephi_nodes['lon'] =nodes['x']
gephi_nodes['lat'] = nodes['y']
gephi_nodes.to_csv('./test/gephi_nodes_output.csv',index=False) #!!!保存为csv文件时,一定要去掉索引
# edges数据处理
gephi_edges['Source'] = edges['node_start']
gephi_edges['Target']= edges['node_end']
gephi_edges['Weight'] = edges['weight']
gephi_edges.to_csv('./test/gephi_edges_output.csv',index=False) #!!!保存为csv文件时,一定要去掉索引
注意:一定不要保存默认的索引