首页 > 其他分享 >Neo4j-数据导入

Neo4j-数据导入

时间:2024-07-02 20:00:42浏览次数:3  
标签:node tz 1.1 导入 Neo4j line csv 数据 gs

1.1.1 导入对比

常用的导入形式对比
在这里插入图片描述
1.1.2 csv文件导出

(1).注意CSV文件需要使用utf8-无Bom格式

(2).如果字段串中有逗号,需要给字符串的前后两端加上",

(3).如果字符串中有双引号,需要把双引号替换成"“,再在字符串的前后两端加上”

注意:导出csv不需要包含表头,增量和全量统一一种格式即可

1.1.3 neo4j-admin import

csv内容格式:把表头和数据分开存放,以便于多个数据文件共用同一个header

1.1.3.1 公司节点

gs_node_header.csv

eid:ID,name

gs_node.csv

06b53d2f-99b7-45c8-992e-6c86c88fdd1c,"三安光电股份有限公司"

06ad8296-3730-4d32-b7ad-e11c1e505384,"武汉澳华装饰设计工程有限公司"

0673f95f-6911-461a-8182-99c5732875f7,"无锡神探电子科技有限公司"

06ac3f73-8b22-44ca-b1cd-b9778814948b,"淄博市勘察测绘研究院有限公司"

1.1.3.2 投资信息节点

tz_node_header.csv

invest_eid:ID,invest_name

tz_node.csv

00029d21-820d-46da-8ff7-df745ebf67e0,北京麦可利商业管理有限公司

00040b09-f8b8-4ec2-8e79-b35d2e297749,齐齐哈尔温氏粮食有限公司

00052dbc-889a-4d26-a03d-652a5f50dc40,郑州郑煤岚新能源股份有限公司

00097423-f719-42c7-8e54-e4184ea8ec9f,青岛凯联精细化学有限公司

000af5fb-d892-4bfd-b34c-eba61400f445,郑煤集团(登封)教学二矿有限公司

1.1.3.3 关系节点

tz_relation_header.csv

:START_ID,:END_ID,gdpm:string,is_history:int,stock_percent:float,real_capi:float

tz_relation.csv

03c9ac77-f1e8-4bee-b0f4-9e4a073c64fb,ffd14d90-e3aa-4339-8485-2210b8ccd5bf,0,0.3,0

04f2a169-c277-4bbb-a27c-987a570d95ff,4c480c43-8bc2-4297-a24a-0e513bc51f47,0,1,300

04f2a169-c277-4bbb-a27c-987a570d95ff,d7c09a7e-3e50-49f9-968e-809d7d06038b,0,0.0001,0

052f010b-563d-401b-bb0f-13444d6c00de,023cbfa3-d096-4cc6-94dc-5fadd477b0b1,0,0.3855510313,0

052f010b-563d-401b-bb0f-13444d6c00de,3743e922-4318-4dce-a0c7-d3eb4403afe2,0,1,0

1.1.3.4 全量导入数据

./neo4j-admin import \

--mode=csv \

--database=graph.db  \

--nodes:gs_node "../import/all/gs_node_header.csv,../import/all/gs_node.csv" \

--nodes:tz_node  "../import/all/tz_node_header.csv,../import/all/tz_node.csv" \

--relationships:对外投资者关系  "../import/all/tz_relation_header.csv,../import/all/tz_relation.csv" \

--ignore-duplicate-nodes=true \

--ignore-missing-nodes=true

1.1.3.5 新增索引

create index on :gs_node(eid);

create index on :tz_node(invest_eid);

1.1.4 Load csv

1.1.4.1 语法释义

  1. using periodic commit 100 使用自动提交,每满100条提交一次,防止内存溢出

  2. load csv 加载csv

  3. from 引用文件地址

WITH HEADERS

从文件中读取第一行作为参数名,只有在使用了该参数后,才可以使用line.name这样的表示方式,否则需使用line[0]的表示方式

  1. AS line为每行数据重命名

5 .create/merge

首次导入node时一般用create语句,后面新增导入时用merge语句,防止重复导入

1.1.4.2 公司节点

gs_node_20210127.csv

06b53d2f-99b7-45c8-992e-6c86c88fdd1c,"三安光电股份有限公司"

06ad8296-3730-4d32-b7ad-e11c1e505384,"武汉澳华装饰设计工程有限公司"

0673f95f-6911-461a-8182-99c5732875f7,"无锡神探电子科技有限公司"

06ac3f73-8b22-44ca-b1cd-b9778814948b,"淄博市勘察测绘研究院有限公司"

1.1.4.3 投资信息节点

tz_node_20210127.csv

00029d21-820d-46da-8ff7-df745ebf67e0,北京麦可利商业管理有限公司

00040b09-f8b8-4ec2-8e79-b35d2e297749,齐齐哈尔温氏粮食有限公司

00052dbc-889a-4d26-a03d-652a5f50dc40,郑州郑煤岚新能源股份有限公司

00097423-f719-42c7-8e54-e4184ea8ec9f,青岛凯联精细化学有限公司

000af5fb-d892-4bfd-b34c-eba61400f445,郑煤集团(登封)教学二矿有限公司

1.1.4.4 关系节点

tz_relation_20210127.csv

03c9ac77-f1e8-4bee-b0f4-9e4a073c64fb,ffd14d90-e3aa-4339-8485-2210b8ccd5bf,0,0.3,0

04f2a169-c277-4bbb-a27c-987a570d95ff,4c480c43-8bc2-4297-a24a-0e513bc51f47,0,1,300

04f2a169-c277-4bbb-a27c-987a570d95ff,d7c09a7e-3e50-49f9-968e-809d7d06038b,0,0.0001,0

052f010b-563d-401b-bb0f-13444d6c00de,023cbfa3-d096-4cc6-94dc-5fadd477b0b1,0,0.3855510313,0

052f010b-563d-401b-bb0f-13444d6c00de,3743e922-4318-4dce-a0c7-d3eb4403afe2,0,1,0

1.1.4.5 导入公司信息节点

using periodic commit 100

load csv

from 'file:data/tdx/neo4j-community-3.4.5/import/update/gs_node_20210127.csv' AS line

merge (:gs_node {eid:toString(line[0]),name:toString(line[1])})

1.1.4.6 导入投资信息节点

using periodic commit 100

load csv

from 'file:data/tdx/neo4j-community-3.4.5/import/update/tz_node_20210127.csv' as line

merge (:tz_node {invest_eid:toString(line[0]),invest_name:toString(line[1])})

1.1.4.7 新增索引

增量新增的节点需要增加索引,如果全量已经增加了索引,此处无需增加

create index on :gs_node(eid);

create index on :tz_node(invest_eid);

1.1.4.8 导入增量关系

using periodic commit 100

load csv

from 'file:data/tdx/neo4j-community-3.4.5/import/update/tz_relation_20210127.csv' as line

match (from:tz_node{invest_eid:line[1]}),(to:gs_node {eid:line[0]})

merge (from)-[:对外投资者关系 {is_history:toInteger(line[2]),stock_percent:toFloat(line[3]),real_capi:tofloat(line[4])}]->(to)

标签:node,tz,1.1,导入,Neo4j,line,csv,数据,gs
From: https://blog.csdn.net/qq_45796594/article/details/140135127

相关文章

  • 大数据面试题之Flink(1)
    目录Flink架构 Flink的窗口了解哪些,都有什么区别,有哪几种?如何定义? Flink窗口函数,时间语义相关的问题 介绍下Flink的watermark(水位线),watermark需要实现哪个实现类,在何处定义?有什么作用? Flink的窗口(实现)机制 说下Flink的CEP 说一说Flink的Checkpoint机制 ......
  • 大数据面试题之Flink(2)
    Flink中Checkpoint超时原因 Flink的ExactlyOnce语义怎么保证? Flink的端到端ExactlyOnce Flink的水印(Watermark),有哪几种? Flink的时间语义 Flink相比于其它流式处理框架的优点? Flink和Spark的区别?什么情况下使用Flink?有什么优点? FlinkbackPressure反压机......
  • 大数据面试题之Flink(3)
    如何确定Flink任务的合理并行度? Flink任务如何实现端到端一致? Flink如何处理背(反)压? Flink解决数据延迟的问题 Flink消费kafka分区的数据时flink件务并行度之间的关系 使用flink-client消费kafka数据还是使用flink-connector消费 如何动态修改Flink的配置,前提......
  • java操作hbase查询数据 java操作hbase查询数据库
    java操作hbase查询数据java操作hbase查询数据库HBasejavaAPI访问HBase数据库登录后复制packagecom.hunan.hbase_options;importorg.apache.hadoop.conf.Configuration;importorg.apache.hadoop.hbase.;importorg.apache.hadoop.hbase.client.;importorg.apache.had......
  • RabbitMQ数据隔离
    1.用户管理点击Admin选项卡,首先会看到RabbitMQ控制台的用户管理界面:这里的用户都是RabbitMQ的管理或运维人员。目前只有安装RabbitMQ时添加的itheima这个用户。仔细观察用户表格中的字段,如下:Name:itheima,也就是用户名Tags:administrator,说明itheima用户是超级管理员,拥有所有......
  • 【嵌入式DIY实例】- LCD ST7735显示DHT11传感器数据
    LCDST7735显示DHT11传感器数据文章目录LCDST7735显示DHT11传感器数据1、硬件准备与接线2、代码实现本文介绍如何将ESP8266NodeMCU板(ESP-12E)与DHT11(RHT01)数字湿度和温度传感器连接。NodeMCU从DHT11传感器读取温度(以°C为单位)和湿度(以r......
  • 基于web实现的物业管理系统项目(运行视频+源码+数据库+部署文档)
    项目描述文档1.项目概述本项目旨在开发一个综合性物业管理系统,涵盖了保安保洁管理、保修管理、房产信息管理、公告管理、管理员信息管理、业主信息管理和登录管理等多个功能模块。该系统使用了JSP作为前端页面的开发技术,结合Bootstrap和jQuery进行页面设计和交互,后端则使用J......
  • SpringBoot在线软考考试管理系统(报告+源码+数据库)
    系统功能        基于SpringBoot框架的在线考试系统是一个集用户管理、权限控制[4]、试题管理、在线考试、成绩管理等功能于一体的综合性系统。该系统在构建时充分考虑了现代Web应用的最佳实践,采用了前后端分离架构,使得前端与后端能够各自独立开发、部署和扩展,通过......
  • 自适应神经模糊推理ANFIS价格预测实战 完整代码+数据
    直接看效果:代码: importnumpyasnpimportpandasaspdfromsklearn.model_selectionimporttrain_test_splitfromsklearn.metricsimportmean_squared_error,r2_scorefromsklearn.preprocessingimportMinMaxScalerimportnumpyasnpimportpandasaspdf......
  • Python TensorFlow双向Bi-LSTM长短期记忆神经网络深度学习可视化用户传感器活动数据
    全文链接:https://tecdat.cn/?p=36613原文出处:拓端数据部落公众号在本文中,我们旨在利用深度学习技术,特别是TensorFlow框架下的Keras库,对WISDM(无线传感器数据挖掘)数据集进行活动识别。WISDM数据集包含了从用户身上佩戴的加速度传感器收集的三轴加速度数据,这些数据被用于识别用户的......