MIMIC-III 临床数据集V1.4简介

数据库介绍

MIMIC-III(重症监护医学信息市场)是一个大型的单中心数据库,其中包含与大型三级护理医院重症监护病房收治的患者有关的信息

数据包括生命体征,药物,实验室测量值,医嘱,手术代码,诊断代码,影像报告,住院时间,生存数据等

MIMIC-III包含与2001年至2012年之间进入重症监护病房的成年患者(16岁或以上)的53,423例不同的医院入院相关的数据以及2001年至2008年之间收治的7870名新生儿的数据

数据集中一共包括26个数据表,除了字典表(D_开头)以外,表之间通过患者编号(SUBJECT_ID)、病案号(HADM_ID)、和ICU编号(ICUSTAY_ID)连接

按照数据格式,患者数据可以被划分为结构化数据(实验室测量、生命体征等)和非结构化数据(医嘱信息等)

一个患者对应一个subject_id,但是可能多次入院,有多个hadm_id,一次入院可能有多次进入ICU,即一个hadm_id可能对应多个icustay_id

通常采用一个hadm_id对应的第一个icustay_id开展相关的研究

字典表用于某个项的查询,举例如下:
比如查询某个患者的白细胞的数据(在LABEVENTS表中),首先需要找到患者对应的三个ID,然后在实验室检查编码(d_labitems)中找到白细胞的item_id,然后再去LABEVENTS表中查找

官方数据说明

MIMIC-III 是一个包含 26 个表的关系数据库。表由通常带有后缀“ID”的标识符链接。例如,SUBJECT_ID 指的是唯一的患者,HADM_ID 指的是唯一的医院入院,ICUSTAY_ID 指的是唯一的重症监护病房入院。

记录、实验室测试和体液平衡等图表事件存储在一系列“events”表中。例如,OUTPUTEVENTS 表包含与给定患者的输出相关的所有测量值,而 LABEVENTS 表包含患者的实验室测试结果。

以“D_”为前缀的表是字典表,并提供标识符的定义。例如,CHARTEVENTS 的每一行都与一个 ITEMID 相关联,它表示测量的概念,但它不包含测量的实际名称。通过在 ITEMID 上连接 CHARTEVENTS 和 D_ITEMS,可以识别给定 ITEMID 所代表的概念。

开发 MIMIC 数据模型涉及平衡解释的简单性和与基本事实的接近程度。因此,该模型反映了基础数据源,根据用户反馈对 MIMIC 数据库的迭代进行了修改。在进行转换时已注意避免对基础数据做出假设,因此 MIMIC-III 密切代表原始医院数据。

从广义上讲,有五个表格用于定义和跟踪患者住院时间:
ADMISSIONS;(入院)
PATIENTS; (患者)
ICUSTAYS;(ICU)
SERVICES; (服务)
TRANSFERS. (转移)

另外五个表是对照各自定义交叉引用代码的字典:
D_CPT;
D_ICD_DIAGNOSES;
D_ICD_PROCEDURES;
D_ITEMS;
D_LABITEMS.

其余表包含与患者护理相关的数据,例如生理测量、护理人员观察和账单信息。

在某些情况下,可以合并表——例如,D_ICD_PROCEDURES 和 CPTEVENTS 表都包含与程序相关的详细信息并且可以合并——但我们的方法是为了清楚起见保持表独立,因为数据源明显不同。我们建议研究人员开发适当的数据库视图和转换,而不是在 MIMIC 数据模型中组合表格。

全部26张表的详细信息

患者人口学信息以及院内周转信息(6张)

表名简介特征/属性行列数文件大小
ADMISSIONS患者入院情况行号、患者编号、病案号、入院时间、出院时间、死亡时间、入院类型、入院地点、出院目的地、保险类型、语种、宗教信仰、婚姻状况、种族、急诊留观登记时间、急诊留观出观时间、初步诊断、院内死亡标记、是否有charievents记录58,976*1912.5MB
CALLOUT患者ICU出科时的即时信息行号、患者编号、病案号、提交出科申请的科室代码、目标科室代码、出科申请结果、患者需接受的治疗服务、出科且期、出科时是否感染了MRSA等34,499*246.34MB
ICUSTAYSICU入住信息行号、患者编号、病案号、ICU病案号、数据源、患者入住监护室24小时内的首个和最终监护室类别、入住首个和末次监护室代码、入科出科时间、住院时长61,532*126.36MB
PATIENTS患者信息行号、患者编号、性别、出生日期、死亡日期、院内登记死亡日期、社保局登记死亡日期、死亡标记种类46,520*82.63MB
SERVICES患者需要接受的医疗服务行号、患者编号、病案号、服务种类更改时间、前次服务种类、当前服务73,343*63.48MB
TRANSFERS患者周转信息行号、患者编号、病案号、ICU病案号、数据源、周转项目、前次和当前所在监护室类型、前次和当前所在科室代码、入科出科时间、住院时长261,897*1325.1MB

患者在监护室住院期间采集的各类信息(8张)

表名简介特征/属性行列数文件大小
CAREGIVERS护理人员信息行号、护理人员标志符、头衔缩穿、类别7,567*4203KB
CHARTEVENTS患者观察记录数据行号、患者编号、病案号、ICU病案号、项目标志符、记录时间、存储时间、护理人员标志符、项目值等330,712,483*1535.5GB
DATETIMEEVENTS患者操作时间信息行号、患者编号、病案号、ICU病案号、项目标志符、记录时间、存储时间、护理人员标志符、项目对应时间4,485,937*14526MB
INPUTEVENTS_CV使用CareVue监护系统记录的入量信息行号、患者编号、病案号、ICU病案号、记录时间、项目标志符、前次纪录至今总入量、护理人员标志符、给药速率、给药途径、给药部位药品组合标志符、药品组合总量17,527,935*222.46GB
INPUTEVENTS_MViMDSoftMetavision系统入量数据行号、患者编号、病案号、ICU病案号、出入量活动开始结束时间、项目标志符、总入量、入量单位、药品组合标志符、药品一级分类名、药品类型、液体总量、出科后是否续药、输液状态等3,618,991*31975MB
NOTEEVENTS治疗记录行号、患者编号、病案号、记录时间、记录类别、护理人员标志符、医嘱具体内容2,083,180*114.01GB
OUTPUTEVENTS患者出量信息行号、患者编号、病案号、ICU病案号、记录时间,项目标志符、液体出量、护理人员标志符、输液是否中断、新液体准备状态4,349,218*13396MB
PROCEDUREEVENTS_MVMetavision系统的操作信息行号、患者编号、病案号、ICU病案号、操作或手术开始结束时间、项目标志符、项目值、数据上传时间、护理人员标志符、药品组合标志符、药品一级分类名、药品类型、医嘱状态258,066*2548.8MB

医院记录系统采集的各类信息(7张)

表名简介特征/属性行列数文件大小
CPTEVENTS患者操作记录行号、患者编码、病案号、记录时间、操作编码、部门573,146*1258.2MB
DIAGNOSES_ICD患者诊断ICD-9编码行号、患者编号、病案号、ICD9编码651,047*519.1MB
DRGCODES患者诊断类别组行号、患者编号、病案号、诊断类别、诊断编码125,557*810.5MB
LABEVENTS患者化验项目行号、患者编号、病案号、项目标志符、记录时间、项目值27,854,055*91.85GB
MICROBIOLOGYEVENTS病人标本微生物病原体检测结界行号、患者编号、病案号、记录时间、化验项目标志符、化验类型、化验微生物、是否隔离631,726*1672.5MB
PRESCRIPTIONS病人用药记录行号、患者编号、病案号、ICU病案号、用药开始结束时间、药物类型、药物名称、剂量,用药途径、处方药代码、药物gsn4,156,450*19770MB
PROCEDURES_ICD病人手术记录ICD-9编码行号、患者编号、病案号、ICD9编码240,095*56.8MB

字典信息(5张)

表名简介特征/属性行列数文件大小
D_CPT操作记录代码索引细分成多个category,包括每个子部分的代号及范围134*913.8KB
D_ICD_DIAGNOSES诊断代码索引行号、ICD9编码、缩写、全称14,567*41.39MB
D_ICD_PROCEDURES手术操作代码索引行号、ICD9编码、缩写、全称3,882*4311KB
D_ITEMS记录项目代码索引行号、项目标志符、项目标签、数据来源12,487*10954KB
D_LABITEMS化验项目代码索引行号、项目标志符、项目标签、化验类型753*643.1KB

全部26张表总结

1、ADMISSIONS患者入院情况,包括每个患者的入院代码、患者标识码、人口统计学资料等

2、CALLOUT患者准备从ICU出科时的即时信息,包括具体ICU科室、病床号、出科日期等

3、CAREGIVERS监护提供人员,是医生、护士还是社工等

4、CHARTEVENTS患者的呼吸机设定、神志状态,患者入院期间的大多数信息都在这个大表里

5、CPTEVENTS患者操作记录

6、D_CPTCPT操作记录代码索引

7、D_ICD_DIAGNOSESICD-9诊断代码索引

8、D_ICD_PROCEDURESICD-9手术操作代码索引

9、D_ITEMS记录项目代码索引,如代码211就是用来表示心率的

10、D_LABITEMS化验项目代码索引,如50820表示血气化验里的pH

11、DATETIMEEVENTS各项操作日期信息

12、DIAGNOSES_ICD患者诊断ICD-9码

13、DRGCODES患者诊断类别组

14、ICUSTAYSICU出入科时间

15、INPUTEVENTS_CV使用CareVue监护系统记录的入量信息

16、INPUTEVENTS_MV使用Metavision监护系统记录的入量信息

17、OUTPUTEVENTS患者出量信息

18、LABEVENTS患者化验项目结果

19、MICROBIOLOGYEVENTS患者标本微生物病原体检测结果

20、NOTEEVENTS病程及出院录记录信息

21、PATIENTS患者出生及死亡信息

22、PRESCRIPTIONS患者用药记录

23、PROCEDUREEVENTS_MV患者手术记录

24、PROCEDURES ICD患者手术记录ICD-9码

25、SERVICES患者在院期间接受专科服务信息

26、TRANSFERS患者在院期间所有床位信息