首页 > 数据库 >MIMIC IV 3.0数据库安装方法

MIMIC IV 3.0数据库安装方法

时间:2024-08-08 19:23:31浏览次数:16  
标签:代码 IV MIMIC 3.0 安装 数据库

        MIMIC IV 3.0在上月已经发布了,那么如何安装这个最新的MIMIC数据库呢?

1.MIMIC IV 3.0数据库变化情况

        2024年7月19日,知名医疗数据库MIMIC-IV发布了最新的3.0版本,此次更新为数据库带来了诸多重要改进和新增数据。此次更新最显著的变化是新增了2020年至2022年期间的住院数据。新增数据的具体情况如下:

  • 患者数:从v2.2的299,712增加至364,627。
  • 住院次数:从v2.2的431,231增加至546,028。
  • ICU停留次数:从v2.2的73,181增加至94,458。

        此外,数据库中还包含了住院或急诊出院后最长1年的院外死亡率数据。这一改进将极大地提升研究人员对于患者长期预后的研究能力。(MIMIC-IV v3.0 重磅发布:新增2020-2022年住院数据及多项改进

        这里需要说明一点,经常有人说MIMIC 3、MIMIC 4等等名词,本身没有错,但是如果把MIMIC IV 3.0说成MIMIC 3是错误的表达,因为MIMIC 3实际指的是MIMIC iii。

2.MIMIC IV 3.0安装准备

        首先需要到MIMIC的官方网站(https://physionet.org/content/mimiciv/3.0/)下载原始数据包,原始数据包是csv.gz压缩包,大概9.8GB。如果之前已经有MIMIC IV 2.2版本的权限,那么无需申请,可以直接下载。如果没有权限访问是无法下载的,需要进行申请。不过申请MIMIC数据库可不是件容易的事情,可以找专业人士(加微 idata01)帮忙协助,省时省力。

        如果您的账号有权限那么可以直接通过浏览器下载,但由于国内网络条件情况以及9.8GB的数据包,下载过程很容易中断。这里需要说明的是任何有权限的人下载得到的数据库都是完全一样的,就是A医生下载的MIMIC IV 3.0和B医生下载的并没有区别,只要版本一样文件大小一样,那么就是一样的。

        安装MIMIC IV 3.0数据库其实是不需要physionet网站访问权限,很多以为现申请后才能安装,其实不然。申请citiprogram和physionet权限,本质上是为了在发表论文时符合学术要求,因为MIMIC、eICU等数据库是受限访问和使用的,所以您发文章必须要证明您有资格使用这些数据进行研究,否则您的研究成功违法学术要求,会有很大的风险。所以才发论文之前必须要申请到citiprogram和physionet权限,需要特别说明的是仅仅有citiprogram权限是不符合要求的,因为citiprogram权限只是申请physionet权限的一个前置条件。目前国内很多人在这方面投机取巧,虽然文章也发表了,但是后患无穷。

3.MIMIC IV 3.0软件环境准备

        MIMIC数据库的安装环境主要是Postgresql数据库软件和7z解压软件。官方建议把MIMIC IV数据库安装到Postgresql数据库,虽然国内目前也有人安装到SQL Server数据库,但是实在是非常非常小众,不建议这样做。否则到时拿到其他人代码来执行提取,都不能保证通用。毕竟全世界国内外大都是用Postgresql来安装的。对于广大医学生和医务工作者来说,安装MIMIC也是一件痛苦的事情,平时看书、做实验、上班、做手术已经够累了,对计算机技术方面还要深入学习的话就难上加累,因此建议可以找专人人士(加微 idata01)来安装,一般Windows电脑安装10多分钟安装好,自己折腾要几个小时甚至几天都搞不定。

4.MIMIC IV 3.0导入数据方法

        目前MIMIC的code还没有更新,在安装MIMIC IV 3.0的时候会直接报错,也不知道官方何时能够更新。这些报错对于懂数据库的人来说很简单,但是对于没搞过这方面的人简直是噩梦,一头雾水,因此建议可以找专人人士(加微 idata01)来安装。

        另外就是构建concept也是十分费事,官方其实没有说的很明确,导致有些人把concept生成到Public表,有些人生成到mimiciv_derived的表。其实concept是用来生成派生或者衍生数据的代码,它是从hosp和ICU模块通过官方提供的代码提取出来的数据,可以直接理解为官方给大家提前提取的数据,方便研究人员进行参考和开展研究。国外会把concept数据生成到实体化视图(物化视图)中,而不是表,而国内很多MIMIC培训班讲师大都说这样做不对,认为安装到表才对,我认为这里其实是很大的误区。从技术上讲太深可能很难理解,但是实体化视图(物化视图)其实是一直更优的做法,视图可以通过简单的代码就能够自动或手动更新数据,而表不行,假设对Hosp和ICU数据进行了清洗处理,那么对应的视图可以快速进行自动或者手动更新。

5.MIMIC IV 3.0提取数据

        提取数据是大家安装MIMIC IV 3.0数据库的终极需求,这里我给大家一点建议。我看很多人还是使用pgadmin来提取数据,我知道造成情况的原因是视频教程里用了pgadmin来做演示数据提取,但是实际上这个pgadmin使用体验上比较槽糕,界面也不太友好。我建议大家使用Navicat来提取,Navicat是一款商业数据库可视化工具,目前个人版已经免费了,旗舰版也有很多方法可以使用。Navicat在界面友好,代码运行性能,操作功能等等方面都值得大家去用。当然无论是用pgadmin还是Navicat,SQL代码是通用的,不会因为使用的SQL工具不一样,代码就会不同。

        关于提取代码的备份问题:如果用SQL提取数据,我建议大家写SQL的时候要注意备份好代码。有些人会把SQL保存在查询的对话里,虽然这是一种便利的操作,但是容易丢失无法恢复,千五别把自己辛苦研究的代码交给一个软件去给你保管。无论是SQL代码、R代码、python代码,我们建议都进行备份,例如备份到有道云笔记、OneNote或者邮箱等云产品中,这样的话即使电脑坏掉了或者被偷了,自己也能够找回来代码。

6.MIMIC IV 3.0安装总结

        MIMIC IV 3.0数据库安装方法或者思路如上,其实和MIMIC IV 2.2没有区别。常规的安装方法,会安装且电脑也比较快的话一般需要2-4小时,慢的也有七八小时的情况。idata01(加微 idata01)全网首创了一种极速安装技术,安装好的数据和官网是完全一样的,但是安装时间只需要10-20分钟,极大的节省了科研人员的时间。

标签:代码,IV,MIMIC,3.0,安装,数据库
From: https://blog.csdn.net/idata01/article/details/141034352

相关文章

  • 论文笔记:Investigation of Passengers’ Perceived Transfer Distance in Urban Rail
    (基于XGBoost和SHAP的城市轨道交通站点乘客感知换乘距离研究)话题点:城市轨道交通站点、换乘距离、XGBoost模型、SHAP模型:感知传输距离偏差theRatioofPerceivedTransferDistanceDeviation(R)、XGBoost和SHAP模型考虑的因素:乘客个人属性、换乘设施和换乘环境相关的32个指......
  • 关于java连接数据库时提示异常java.sql.SQLException: No suitable driver found for
    当我们测试一个新的数据库服务时,需要使用对方提供jdbc驱动来连接数据库,有时候简单的写个demo去连接,发现提示异常:java.sql.SQLException:Nosuitabledriverfoundforjdbc:jdbc:nuuv://10.1.8.99:8832/xxoo比如有以下程序连接数据库测试:publicstaticvoidmain(String[]a......
  • Codeforces Round 964 (Div. 4)
    知识点1.对于两个数字,一个乘n,一个除以n,可以理解为n进制下的这个数乘10和除10。比如E题用这个知识点就可以很快的解决问题。题解A.A+BAgain?#include<bits/stdc++.h>#defineintlonglongusingnamespacestd;voidsolve(){ strings; cin>>s; cout<<s[0]-'0'+s[1]-......
  • Flutter实现启动页、闪屏广告页、引导页Flutter的flutter_native_splash库
    ///yaml文件中的配置信息,可以参考官方文档color:"#42a5f5"#图片格式必须是pngimage:images/avata.png///在main文件中添加代码,主要用来初始化包,并且启动splash页面;WidgetsBindingwidgetsBinding=WidgetsFlutterBinding.ensureInitialized();FlutterNative......
  • Codeforces Round 964 (Div. 4)
    CodeforcesRound964(Div.4)A送分B大意:两个人两张牌随机翻求a翻出来的牌比b大的可能#include<cstdio>#include<cmath>#include<algorithm>#include<iostream>#include<cstring>#include<vector>#defineepemplace_backusingnamespace......
  • Codeforces Round 964 (Div. 4) D. Slavic's Exam
    题目链接:https://codeforces.com/contest/1999/problem/D题目描述Slavic的考试非常难,需要您的帮助才能通过。以下是他正在努力解决的问题:存在一个字符串s,它由小写英文字母和可能零个或多个“?”组成。Slavic被要求将每个“?”更改为小写英文字母,使得字符串t成为字符串s的......
  • Keepalived双机热备
    在这个高度信息化的IT时代,企业的生产系统、业务运营、销售和支持,以及日常管理等环节越来越依赖于计算机信息和服务,对高可用(HA)技术的应用需求不断提高,以便提供持续的、不间断的计算机系统或网络服务。keepalived双击热备基础知识Keepalived起初是专门针对LVS设计的一款......
  • hive06_SQL优化
    HiveSQL原理joinjoin分为MapJoin、ReduceJoin两种,其中MapJoin思想是将小表存内存,然后大表分片,与小表完成连接操作。MapJoinMap阶段分为两个操作:将小表数据读入内存,生成分片文件后存储到分布式存储系统中;每个Mapper从分布式存储系统中读取文件分片到内存,然后顺......
  • hive05_窗口函数
    窗口函数窗口函数可以更加灵活地对一定范围内的数据进行操作和分析,它能够为每行数据划分一个窗口,然后对窗口范围内的数据进行计算,最后将计算结果返回给该行数据;举个例子,区别于GroupBy,GroupBy对分组范围内的数据进行聚合统计,得到当前分组的一条结果;窗口函数对每一条数据处理,......
  • hive04_DQL操作
    注意点全局排序OrderBySELECT<select_expression>,<select_expression>,...FROM<table_name>ORDERBY<col_name>[ASC|DESC][,col_name[ASC|DESC],...]Hive中使用全局排序时,会将所有数据交给一个Reduce任务进行计算,实现查询结果的全局排序。所以数据量......