MIMIC-IV2.0解析

core

core模块包含三个表:

patients

:患者的人口统计数据

subject_id 患者的唯一标识符
gender 患者的性别
anchor_age 患者在入院时的年龄
anchor_year 患者在入院时的年份
anchor_year_grop 患者入院年份的分组 (按照年份将患者分成了5组)
dod 患者死亡日期,如果患者还活着,则为NULL

admissions

:每次住院的记录

subject_id 患者 ID,这是一个唯一的标识符,用于关联其他表中的数据。
hadm_id 入院记录 ID,这是一个唯一的标识符,用于关联其他表中的数据。
admittime 入院时间,表示患者被接纳到医院的时间。
dischtime 出院时间,表示患者从医院出院的时间。
deathtime 死亡时间,表示患者死亡的时间。如果患者没有死亡,则该列的值为空。
admission_type 入院类型,表示患者被接纳到医院的方式。可能的取值包括:EMERGENCY(急诊)、ELECTIVE(择期)、NEWBORN(新生儿)等。
admission_location 入院地点,表示患者被接纳到医院的位置。可能的取值包括:EMERGENCY ROOM ADMIT(急诊室接诊)、TRANSFER FROM HOSPITAL(从其他医院转入)、TRANSFER FROM SKILLED NUR(从护理院转入)等。
discharge_location 出院地点,表示患者从医院出院的位置。可能的取值包括:HOME(回家)、DEAD/EXPIRED(死亡)、SNF(护理院)等。
insurance 医疗保险类型,表示患者的医疗保险类型。
language 语言,表示患者的语言。
marital_status 婚姻状态,表示患者的婚姻状态。
ethnicity 民族,表示患者的民族。
edregtime 急诊登记时间,表示患者在急诊室的登记时间。如果患者没有通过急诊室接诊,则该列的值为空。
edouttime 急诊出诊时间,表示患者从急诊室出诊的时间。如果患者没有通过急诊室接诊,则该列的值为空。
hospital_expire_flag 二进制标志,用于指示患者在医院内是否死亡。如果患者在医院内死亡,则该列的值为 1,否则为 0。该列通常用于研究医院死亡率和相关的临床结果。

transfers

:住院期间每次住院的记录 (包含了患者转移和转运的信息)

subject_id 患者的唯一标识符,用于关联其他表中的数据。
hadm_id 入院记录的唯一标识符,用于关联其他表中的数据。
transfer_id 转移记录的唯一标识符,用于区分不同的转移记录。
eventtype 转移事件的类型,可能的取值包括:ADMIT(入院)、TRANSFER(转移)、DISCHARGE(出院)等。
careunit 转移时患者所在的护理单元,可能的取值包括:CCU(冠心病监护室)、MICU(医学重症监护室)、SICU(外科重症监护室)等。
intime 转移发生的时间,表示患者进入护理单元的时间。
outtime 转移结束的时间,表示患者离开护理单元的时间。

hosp

Hosp 模块提供从医院范围内的电子健康记录中获取的所有数据。涵盖的信息包括患者和入院信息、实验室测量、微生物学、药物管理和计费诊断。
医院模块包含来自医院范围内的 EHR 的数据。这些测量值主要是在住院期间记录的,尽管一些表格也包括来自医院外的数据(例如,labevents 中的门诊实验室测试)。信息包括患者和入院详细信息(patients、admissions、transfers)、实验室测量(labevents、d_labitems)、微生物学培养(microbiologyevents)、提供者订单(poe、poe_detail)、药物管理(emar、emar_detail)、药物处方(prescriptions、pharmacy )、医院账单信息(diagnoses_icd、d_icd_diagnoses、procedures_icd、d_icd_procedures、hcpcsevents、d_hcpcs、drgcodes)和医院服务相关信息(services)。

admissions

:每次住院的记录

subject_id 入院记录 ID,这是一个唯一的标识符,用于关联其他表中的数据。
hadm_id 患者 ID,这是一个唯一的标识符,用于关联其他表中的数据。
admittime 入院时间,表示患者被接纳到医院的时间。
dischtime 出院时间,表示患者从医院出院的时间。
deathtime 死亡时间,表示患者死亡的时间。如果患者没有死亡,则该列的值为空。
admission_type 入院类型,表示患者被接纳到医院的方式。可能的取值包括:EMERGENCY(急诊)、ELECTIVE(择期)、NEWBORN(新生儿)等。
admission_location 入院地点,表示患者被接纳到医院的位置。可能的取值包括:EMERGENCY ROOM ADMIT(急诊室接诊)、TRANSFER FROM HOSPITAL(从其他医院转入)、TRANSFER FROM SKILLED NUR(从护理院转入)等。
discharge_location 出院地点,表示患者从医院出院的位置。可能的取值包括:HOME(回家)、DEAD/EXPIRED(死亡)、SNF(护理院)等。
insurance 医疗保险类型,表示患者的医疗保险类型。
language 语言,表示患者的语言。
marital_status 婚姻状态,表示患者的婚姻状态。
ethnicity 民族,表示患者的民族。
edregtime 急诊登记时间,表示患者在急诊室的登记时间。如果患者没有通过急诊室接诊,则该列的值为空。
edouttime 急诊出诊时间,表示患者从急诊室出诊的时间。如果患者没有通过急诊室接诊,则该列的值为空。
hospital_expire_flag 二进制标志,用于指示患者在医院内是否死亡。如果患者在医院内死亡,则该列的值为 1,否则为 0。该列通常用于研究医院死亡率和相关的临床结果。

d_hcpcs

d_hcpcs表主要用于为hcpcsevents表中使用的代码提供可读的定义。这些概念主要对应于医院的计费,并且大多数是CPT(Current Procedural Terminology)代码。由于许可限制,不是所有的代码定义都可用。

d_hcpcs表是用于存储CPT(Current Procedural Terminology)代码的参考信息,其四个列分别表示CPT代码所属的类别、代码编码、详细描述和简短描述

category 该列表示CPT代码所属的类别。CPT代码是由美国医学协会(AMA)开发并维护的一套医疗服务编码标准。CPT代码根据其所代表的医疗服务的特性,被分为多个类别,例如手术、检查、治疗等
code 该列是CPT代码的具体编码。CPT代码通常由五位数字组成,代表了一个特定的医疗服务
long_description 该列包含了CPT代码的详细描述。通常包括了该医疗服务的名称、功能、用途等信息,帮助医务人员理解该代码的具体含义
short_description 该列包含了CPT代码的简短描述。通常是该医疗服务的简称或缩写。该列的主要作用是在界面上进行展示时,能够更加简洁地呈现信息,方便医务人员快速浏览和理解

d_icd_diagnoses

ICD病情确诊词典表。d_icd_diagnoses表是国际疾病分类(International Classification of Diseases,ICD)的参考表,用于存储ICD诊断代码和说明信息

icd_version 该列表示ICD诊断代码的版本号。ICD是由世界卫生组织(WHO)开发和维护的一套医学诊断分类标准,目前已经发布了多个版本。该列用于区分不同版本的ICD诊断代码
icd_code 该列是ICD诊断代码的具体编码。ICD诊断代码通常由字母和数字组成,代表了一个特定的疾病或健康问题
long_title 全称。该列包含了ICD诊断代码的详细描述。通常包括了该疾病或健康问题的名称、病因、症状等信息,帮助医务人员理解该代码的具体含义

d_icd_procedures

ICD医疗过程词典表。

d_icd_procedures表是国际疾病分类(International Classification of Diseases,ICD)的参考表,用于存储ICD手术代码和说明信息

icd_version 该列表示ICD诊断代码的版本号。ICD是由世界卫生组织(WHO)开发和维护的一套医学诊断分类标准,目前已经发布了多个版本。该列用于区分不同版本的ICD诊断代码
icd_code 该列存储医院内部手术和操作的 ICD-9-CM 编码,每个编码由三到四位数字组成,用于描述手术和操作的类型、位置和方法等
long_title ICD 编码对应的手术或操作的长标题。该列存储与每个 ICD-9-CM 编码相对应的手术或操作的长标题,用于更详细地描述手术或操作的具体内容和目的

d_labitems

门诊化验词典表。

itemid 该列是检验项目的唯一标识符。每个检验项目都有一个唯一的itemid
label 该列是检验项目的名称或标签。它通常是医学术语或缩写,用于描述检验项目的类型和特征
fluid 该列表示检验项目的样本类型或检测液体类型。例如,血液、尿液、脑脊液等。测量的物质 ‘blood’ ‘urine’
category 该列是检验项目的类别。检验项目根据其功能和测试类型被分为多个类别,例如血液生化、免疫学、微生物学等

diagnoses_icd

diagnoses_icd表是一个诊断编码表,用于存储患者的诊断信息。每个记录表示患者在一次住院期间的一个诊断结果,包括诊断编码、诊断编码的版本号、诊断编码的顺序号等信息。该表中的诊断编码采用ICD-9-CM或ICD-10-CM编码标准,ICD-9-CM编码标准用于描述1998年到2015年期间的诊断结果,ICD-10-CM编码标准用于描述2015年以后的诊断结果。

该表的主要作用是为研究人员提供患者的诊断信息,帮助他们了解患者的病情和治疗过程,并进行相关的研究分析。例如,可以使用该表来分析患者的疾病类型、疾病的发展趋势、疾病之间的关联性等,为临床医生提供更好的诊治建议和指导。

subject_id 患者的唯一标识符,与patients表中的subject_id列相对应
hadm_id 住院就诊的唯一标识符,与admissions表中的hadm_id列相对应
seq_num 诊断编码的顺序号,表示该诊断的顺序。例如,seq_num = 1 表示该诊断是主要诊断,seq_num = 2 表示该诊断是次要诊断,以此类推
icd_version 诊断编码的版本号,表示使用的诊断编码标准。在MIMIC-IV数据库中,icd_version列的值为9或10,分别表示使用ICD-9-CM和ICD-10-CM诊断编码标准
icd_code 诊断编码,表示患者的诊断结果,使用ICD-9-CM或ICD-10-CM编码标准编码

drgcodes

诊断相关组编码表

drgcodes表是用于存储诊断相关分组(Diagnosis-Related Group,DRG)代码和信息的参考表。该表的主要作用是帮助医务人员理解和使用DRG分类系统,从而更好地进行医疗诊断和治疗,并且这些代码也被用于医院的付款和统计分析

hadm_id 该列是患者住院的唯一标识符,用于与其他表格中的数据关联
drg_severity 该列表示DRG的严重程度。DRG是一种将医疗服务组织成一组可比较的疾病类别的分类系统,用于确定医院的付款和统计分析。DRG根据患者的诊断、治疗和其他相关因素进行分类,每个DRG都有一个严重程度
drg_mortality 该列表示DRG的死亡率。DRG的死亡率是指在某个DRG中的患者在住院期间内死亡的比例
subject_id 该列是患者的唯一标识符,用于与其他表格中的数据关联
drg_code 该列是DRG的编码,用于标识DRG
drg_type 该列是DRG的类型。DRG根据医学服务的类型和性质进行分类,例如手术DRG、医学DRG等
description 该列包含了DRG的详细说明。通常包括了该DRG的诊断和治疗特点、组成要素、支付标准等信息,帮助医务人员理解该DRG的具体含义

emar

storetime 该列是记录的时间戳,即EMAR记录存储在数据库中的时间
hadm_id 该列是患者住院的唯一标识符,用于与其他表格中的数据关联
pharmacy_id 该列是药房的唯一标识符,用于与药房信息表格中的数据关联
charttime 该列是护士记录给药的时间,通常在给药前或给药后记录
scheduletime 该列是药物计划的时间,即该药物应该在何时给予患者
subject_id 该列是患者的唯一标识符,用于与其他表格中的数据关联
emar_seq 该列是EMAR记录的序列号,用于标识不同的EMAR记录
emar_id 该列是EMAR记录的唯一标识符,与其他EMAR记录相关联
event_txt 该列包含了EMAR事件的详细描述,例如药物名称、剂量、途径等信息
poe_id 该列是医嘱的唯一标识符,用于与医嘱信息表格中的数据关联
medication 该列包含了药物的详细信息,例如药物名称、剂量、途径等信息

emar_detail

pharmacy_id 该列是药房的唯一标识符,用于与药房信息表格中的数据关联
parent_field_ordinal 该列是EMAR记录的上级序列号,用于标识EMAR记录的层级关系
emar_seq 该列是EMAR记录的序列号,用于标识不同的EMAR记录
subject_id 该列是患者的唯一标识符,用于与其他表格中的数据关联
reason_for_no_barcode 如果药物没有条形码,则该列包含药物未被扫描的原因
complete_dose_not_given 该列表示是否完全给药,如果没有完全给药,则为True
dose_due 该列是应该给予患者的药物剂量
dose_due_unit 该列是药物剂量的单位
dose_given 该列是实际给予患者的药物剂量
dose_given_unit 该列是给予药物的剂量单位
will_remainder_of_dose_be_given 该列表示是否会继续给予剩余的药物剂量
product_amount_given 该列是给予患者的药物的数量
product_unit 该列是给予患者的药物的数量单位
product_code 该列是药品的编码
product_description 该列是药品的描述
product_description_other 该列是药品的其他描述
prior_infusion_rate 该列是之前的输液速率
infusion_rate 该列是当前的输液速率
infusion_rate_adjustment 该列是输液速率的调整,例如加速或减速
infusion_rate_adjustment_amount 该列是输液速率调整的数量
infusion_rate_unit 该列是输液速率的单位
route 该列是药物给予的途径,例如口服、静脉注射等
infusion_complete 该列表示输液是否完成
completion_interval 该列是完成输液所需的时间
new_iv_bag_hung 该列表示是否需要更换输液袋
continued_infusion_in_other_location 该列表示输液是否在其他地方继续进行
restart_interval 该列是重新开始输液所需的时间间隔
side 该列表示药物给予的侧面,例如左侧或右侧
site 该列是药物给予的部位
non_formulary_visual_verification 该列表示药品是否需要视觉确认
emar_id 该列是EMAR记录的唯一标识符,与其他EMAR记录相关联
administration_type 该列是药物给予的方式,例如口服、注射等
barcode_type 该列是药物条形码的类型

hcpcsevents

住院期间发生的计费事件。包括 CPT 代码。
hcpc事件 在MIMIC-IV数据库中,hcpcsevents表是用于存储医院常用过程及编码系统(Healthcare Common Procedure Coding System,HCPCS)事件的参考表,包含了患者接受医疗过程的相关信息

  1. “subject_id”:该列是患者的唯一标识符,用于与其他表格中的数据关联。
  2. “hadm_id”:该列是患者住院的唯一标识符,用于与其他表格中的数据关联。
  3. “chartdate”:该列是医疗过程发生的日期和时间。
  4. “seq_num”:该列是医疗过程发生的序列号,用于标识不同的医疗过程。
  5. “hcpcs_cd”:该列是医疗过程的编码(CPT),用于标识医疗过程的类型。
  6. “short_description”:该列是医疗过程的简短描述,通常是对医疗过程编码的解释。

labevents

labevents表是用于存储患者实验室检查结果的参考表。该表包含了患者实验室检查的各种结果,例如血液、尿液、呼吸道分泌物等

  1. “labevent_id”:该列是实验室检查结果的唯一标识符,用于与其他表格中的数据关联。
  2. “subject_id”:该列是患者的唯一标识符,用于与其他表格中的数据关联。
  3. “hadm_id”:该列是患者住院的唯一标识符,用于与其他表格中的数据关联。
  4. “itemid”:该列是实验室检查的项目ID,用于标识实验室检查的类型。
  5. “charttime”:该列是实验室检查结果记录的时间。
  6. “storetime”:该列是实验室检查结果存储的时间。
  7. “value”:该列是实验室检查结果的值,例如血液检查的白细胞计数、尿液检查的蛋白质含量等。
  8. “valuenum”:该列是实验室检查结果的值的数值表示,通常与”valueuom”列一起使用。
  9. “valueuom”:该列是实验室检查结果的值的单位,例如血液检查的白细胞计数的单位为每立方毫米(/mm3)。
  10. “flag”:该列是实验室检查结果的标志,用于指示实验室检查结果是否异常或需要进一步处理。
  11. “reference_range”:该列是实验室检查结果的参考范围,通常与”value”列一起使用,用于指示实验室检查结果是否正常。包含了”ref_range_lower”和”ref_range_upper”两列,分别表示参考范围的下限和上限。
  12. “specimen_id”:该列是实验室检查的标本ID,例如血液、尿液等。
  13. “comments”:该列是实验室检查结果的注释,例如实验室技术员的注释或者医生的备注。
  14. “priority”:该列是实验室检查的优先级,例如“紧急”或“常规”。

microbiologyevents

d_icd_diagnoses表是国际疾病分类(International Classification of Diseases,ICD)的参考表,用于存储ICD诊断代码和说明信息

  1. “microevent_id”:该列是微生物检查结果的唯一标识符,用于与其他表格中的数据关联。
  2. “subject_id”:该列是患者的唯一标识符,用于与其他表格中的数据关联。
  3. “hadm_id”:该列是患者住院的唯一标识符,用于与其他表格中的数据关联。
  4. “chartdate”:该列是微生物检查结果记录的日期。
  5. “charttime”:该列是微生物检查结果记录的时间。
  6. “storedate”:该列是微生物检查结果存储的日期。
  7. “storetime”:该列是微生物检查结果存储的时间。
  8. “spec_type_desc”:该列是微生物检查的标本类型描述,例如血液、尿液等。
  9. “micro_specimen_id”:该列是微生物检查的标本ID,用于标识不同的微生物检查结果。
  10. “test_name”:该列是微生物检查的测试名称,例如培养、鉴定等。
  11. “org_name”:该列是微生物检查结果中检测到的微生物名称,例如细菌、真菌、病毒等。
  12. “ab_name”:该列是微生物检查结果中检测到的抗生素名称。
  13. “quantity”:该列是微生物检查结果中检测到的微生物数量,例如细菌数量。
  14. “dilution_value”:该列是微生物检查结果中使用的稀释值。
  15. “dilution_text”:该列是微生物检查结果中使用的稀释值的文本表示。
  16. “dilution_comparison”:该列是微生物检查结果中使用的稀释值与参考值的比较结果。
  17. “interpretation”:该列是微生物检查结果的解释,例如微生物敏感性、抗生素疗效等。
  18. “spec_itemid”:该列是微生物检查的标本ID,用于标识不同的微生物检查结果。
  19. “test_itemid”:该列是微生物检查的测试ID,用于标识不同的微生物检查测试。
  20. “ab_itemid”:该列是微生物检查的抗生素ID,用于标识不同的微生物检查结果中的抗生素。
  21. “isolate_num”:该列是微生物检查结果中检测到的微生物序列号。
  22. “test_seq”:该列是微生物检查结果中检测到的微生物测试序列号。
  23. “comments”:该列是微生物检查结果的注释,例如实验室技术员的注释或者医生的备注。

omr

omr表是用于记录患者口腔护理的参考表。该表包含了患者口腔护理的各种结果,例如口腔清洁程度、口腔感染情况等

  1. “subject_id”:该列是患者的唯一标识符,用于与其他表格中的数据关联。
  2. “chartdate”:该列是口腔护理记录的日期。
  3. “seq_num”:该列是口腔护理结果的序列号,用于标识不同的口腔护理结果。
  4. “result_name”:该列是口腔护理结果的名称,例如口腔清洁程度、龈炎情况等。
  5. “result_value”:该列是口腔护理结果的值,例如口腔清洁程度得分、龈炎程度等。

patients

:患者的人口统计数据

subject_id 患者的唯一标识符
gender 患者的性别
anchor_age 患者在入院时的年龄
anchor_year 患者在入院时的年份
anchor_year_grop 患者入院年份的分组 (按照年份将患者分成了5组)
dod 患者死亡日期,如果患者还活着,则为NULL

pharmacy

pharmacy表是用于存储患者药物治疗相关信息的参考表。该表包含了患者接受药物治疗过程中的各种信息,例如药物名称、药物剂量、给药途径、给药频率、开始时间和结束时间等

  1. “entertime”:该列是记录药物治疗信息的录入时间。
  2. “verifiedtime”:该列是药物治疗信息的审核时间。
  3. “basal_rate”:该列是药物治疗中基础剂量的速率。
  4. “stoptime”:该列是药物治疗的停止时间。
  5. “doses_per_24_hrs”:该列是每日给药次数。
  6. “duration”:该列是药物治疗的持续时间。
  7. “pharmacy_id”:该列是药物治疗信息的唯一标识符。
  8. “expiration_value”:该列是药物的有效期。
  9. “hadm_id”:该列是患者的入院记录标识符,用于与其他表格中的数据关联。
  10. “expirationdate”:该列是药物的过期日期。
  11. “starttime”:该列是药物治疗的开始时间。
  12. “subject_id”:该列是患者的唯一标识符,用于与其他表格中的数据关联。
  13. “duration_interval”:该列是药物治疗的持续时间间隔。
  14. “expiration_unit”:该列是药物有效期的单位。
  15. “dispensation”:该列是药物的配药信息。
  16. “fill_quantity”:该列是药物配药的数量。
  17. “poe_id”:该列是医嘱的唯一标识符,用于与其他表格中的数据关联。
  18. “medication”:该列是药物的名称。
  19. “proc_type”:该列是药物治疗的类型,例如注射、口服等。
  20. “status”:该列是药物治疗的状态,例如已审核、未审核等。
  21. “route”:该列是药物给药的途径,例如口服、静脉注射等。
  22. “frequency”:该列是药物给药的频率。
  23. “disp_sched”:该列是药物配药的时间表。
  24. “infusion_type”:该列是药物给药的类型,例如静脉注射、持续泵等。
  25. “sliding_scale”:该列是药物给药的滑动比例。
  26. “lockout_interval”:该列是药物给药的锁定间隔。
  27. “one_hr_max”:该列是药物给药的最大剂量。

poe

poe表是用于存储患者医嘱信息的参考表。该表包含了患者医嘱的各种信息,例如医嘱类型、医嘱状态、医嘱开始时间和结束时间等

  1. “hadm_id”:该列是患者的入院记录标识符,用于与其他表格中的数据关联。
  2. “ordertime”:该列是医嘱的开立时间。
  3. “poe_seq”:该列是医嘱的序列号,用于标识不同的医嘱。
  4. “subject_id”:该列是患者的唯一标识符,用于与其他表格中的数据关联。
  5. “discontinue_of_poe_id”:该列是被撤销医嘱的唯一标识符。
  6. “discontinued_by_poe_id”:该列是撤销医嘱的唯一标识符。
  7. “poe_id”:该列是医嘱的唯一标识符。
  8. “order_status”:该列是医嘱的状态,例如已审核、未审核等。
  9. “order_type”:该列是医嘱的类型,例如药物治疗、手术等。
  10. “order_subtype”:该列是医嘱的子类型,例如药物治疗中的口服药物、静脉注射药物等。
  11. “transaction_type”:该列是医嘱操作的类型,例如创建、修改、撤销等。

poe_detail

  1. “poe_seq”:该列是医嘱的序列号,用于标识不同的医嘱。
  2. “subject_id”:该列是患者的唯一标识符,用于与其他表格中的数据关联。
  3. “poe_id”:该列是医嘱的唯一标识符。
  4. “field_name”:该列是医嘱详细信息的名称,例如药物剂量、给药途径、给药频率等。
  5. “field_value”:该列是医嘱详细信息的值,例如药物剂量的具体数值、给药途径的具体名称等。

prescriptions

prescriptions表是用于存储患者处方药物信息的参考表。该表包括了患者接受处方药物治疗的各种信息,例如药物名称、药物剂量、给药途径、给药频率、开始时间和结束时间等。该表中的一些重要列的含义如下

  1. “hadm_id”:该列是患者的入院记录标识符,用于与其他表格中的数据关联。
  2. “poe_seq”:该列是医嘱的序列号,用于标识不同的医嘱。
  3. “starttime”:该列是药物治疗的开始时间。
  4. “stoptime”:该列是药物治疗的停止时间。
  5. “pharmacy_id”:该列是药物治疗信息的唯一标识符。
  6. “doses_per_24_hrs”:该列是每日给药次数。
  7. “subject_id”:该列是患者的唯一标识符,用于与其他表格中的数据关联。
  8. “prod_strength”:该列是药物剂量的强度。
  9. “form_rx”:该列是药物剂型的名称,例如片剂、胶囊等。
  10. “dose_val_rx”:该列是药物剂量的具体数值。
  11. “dose_unit_rx”:该列是药物剂量的单位,例如毫克、克等。
  12. “form_val_disp”:该列是药物剂型的具体数值。
  13. “form_unit_disp”:该列是药物剂型的单位。
  14. “route”:该列是药物给药的途径,例如口服、静脉注射等。
  15. “poe_id”:该列是医嘱的唯一标识符。
  16. “drug_type”:该列是药物类型,例如化学药品、生物制品等。
  17. “drug”:该列是药物的通用名称。
  18. “formulary_drug_cd”:该列是药物的处方代码。
  19. “gsn”:该列是药物的全球唯一标识符。
  20. “ndc”:该列是药物的国家药品编码。

procedures_icd

procedures_icd表是用于存储患者实施过的医疗过程的参考表。该表包括了患者接受的各种医疗过程的ICD编码信息,例如手术、检查等

  1. “subject_id”:该列是患者的唯一标识符,用于与其他表格中的数据关联。
  2. “hadm_id”:该列是患者的入院记录标识符,用于与其他表格中的数据关联。
  3. “seq_num”:该列是医疗过程的序列号,用于标识不同的医疗过程。
  4. “chartdate”:该列是医疗过程记录的日期。
  5. “icd_version”:该列是ICD编码的版本,例如ICD-9、ICD-10等。
  6. “icd_code”:该列是医疗过程的ICD编码。

services

  1. “subject_id”:该列是患者的唯一标识符,用于与其他表格中的数据关联。
  2. “hadm_id”:该列是患者的入院记录标识符,用于与其他表格中的数据关联。
  3. “transfertime”:该列是医疗服务的时间。
  4. “prev_service”:该列是医疗服务之前的服务类型。
  5. “curr_service”:该列是医疗服务的服务类型。

icu

ICU 模块包含从 ICU 内使用的临床信息系统收集的信息。记录的数据包括静脉给药、呼吸机设置和其他图表项目。
ICU 模块包含来自 BIDMC 临床信息系统的数据:MetaVision (iMDSoft)。MetaVision 表被非规范化以创建星型模式,其中 icustays 和 d_items 表链接到一组数据表,所有表都以“事件”为后缀。icu 模块中记录的数据包括静脉和液体输入 (inputevents)、上述输入的成分 (ingredientevents)、患者输出 (outputevents)、程序 (procedureevents)、记录为日期或时间的信息 (datetimeevents) 以及其他图表信息(图表事件)。所有事件表都包含一个 stay_id 列,允许识别 icustays 中相关的 ICU 患者,以及一个 itemid 列,允许识别 d_items 中记录的概念。

chartevents

:患者在 ICU 的护理记录信息,包括生命体征、病情观察、医疗措施等

subject_id 患者的唯一标识符,对应于 ICU 模块中的 admissions 和 patients 表中的 subject_id
hadm_id 患者在 ICU 中的入院号,对应于 ICU 模块中的 admissions 表中的 hadm_id
stay_id 患者在 ICU 中的住院号,对应于 ICU 模块中的 admissions 表中的 stay_id
charttime 护理记录的时间,格式为 yyyy-mm-dd hh:mm:ss
storetime 护理记录存储的时间,格式为 yyyy-mm-dd hh:mm:ss。
itemid 护理项目的唯一标识符,对应于 D_ITEMS 表中的 itemid,可以用于查询该项目的描述信息
value 护理记录的值,可以是数字、文本或者其他格式
valuenum 护理记录的数值型值,如果 value 列的值是数值型的,则该列会存储数值型的值,否则为 NULL
valueuom 护理记录的单位,描述 value 列的单位
warning 护理记录是否有警告信息,如果有警告信息则为 1,否则为 0

d_items

:包含了 ICU 中的所有测量指标、药品、手术等项目的元数据信息

itemid 项目的唯一标识符,用于在其他表中引用该项目
label 项目的标签,描述该项目的名称和测量单位
abbreviation 项目的缩写,常用于在图表和报告中显示
linksto 该项目与其他表的关联信息,描述该项目在其他表中的引用方式
category 项目的类别,用于对不同类型的项目进行分类
unitname 项目的测量单位名称,描述该项目的测量单位
param_type 项目的参数类型,描述该项目的参数类型
lownormalvalue 项目的正常最低值,描述该项目的正常最低值范围
highnormalvalue 项目的正常最高值,描述该项目的正常最高值范围

datetimeevents

:包含了 ICU 中的一些时间相关的事件的记录信息

subject_id 患者的唯一标识符,对应于 ICU 模块中的 admissions 和 patients 表中的 subject_id
hadm_id 患者在 ICU 中的入院号,对应于 ICU 模块中的 admissions 表中的 hadm_id
stay_id 患者在 ICU 中的住院号,对应于 ICU 模块中的 admissions 表中的 stay_id
charttime 事件发生的时间,格式为 yyyy-mm-dd hh:mm:ss
storetime 事件存储的时间,格式为 yyyy-mm-dd hh:mm:ss
itemid 事件的唯一标识符,对应于 D_ITEMS 表中的 itemid,可以用于查询该事件的描述信息
value 事件的值,可以是数字、文本或者其他格式
valueuom 事件的单位,描述 value 列的单位
warning 事件是否有警告信息,如果有警告信息则为 1,否则为 0

icustays

:包含了 ICU 中每个患者的住院记录信息

subject_id 患者的唯一标识符,对应于 ICU 模块中的 admissions 和 patients 表中的 subject_id
hadm_id 患者在 ICU 中的入院号,对应于 ICU 模块中的 admissions 表中的 hadm_id
stay_id 患者在 ICU 中的住院号,用于区分不同的 ICU 住院记录
first_careunit 患者进入 ICU 后的第一个护理单元,记录该 ICU 住院记录的开始
last_careunit 患者最后一个护理单元,记录该 ICU 住院记录的结束
intime 患者进入 ICU 的时间,格式为 yyyy-mm-dd hh:mm:ss
outtime 患者离开 ICU 的时间,格式为 yyyy-mm-dd hh:mm:ss
los 患者在 ICU 中的住院时间,以小时为单位

inputevents

包含了 ICU 中患者的药品、液体和营养剂等输入信息

subject_id 患者的唯一标识符,对应于 ICU 模块中的 admissions 和 patients 表中的 subject_id
hadm_id 患者在 ICU 中的入院号,对应于 ICU 模块中的 admissions 表中的 hadm_id
stay_id 患者在 ICU 中的住院号,用于区分不同的 ICU 住院记录
starttime 输入事件开始时间,格式为 yyyy-mm-dd hh:mm:ss
endtime 输入事件结束时间,格式为 yyyy-mm-dd hh:mm:ss
storetime 输入事件记录的时间,格式为 yyyy-mm-dd hh:mm:ss
itemid 输入项目的唯一标识符,对应于 D_ITEMS 表中的 itemid,可以用于查询该项目的描述信息
amount 输入项目的数量
amountuom 输入项目的数量单位,描述 amount 列的单位
rate 输入项目的速率
rateuom 输入项目的速率单位,描述 rate 列的单位
orderid 输入项目的订单编号
linkorderid 输入项目关联的订单编号
ordercategoryname 订单的类别名称
secondaryordercategoryname 次要订单的类别名称
ordercomponenttypedescription 订单组成类型的描述信息
ordercategorydescription 订单类别的描述信息
patientweight 患者的体重
totalamount 输入项目的总数量
totalamountuom 输入项目的总数量单位,描述 totalamount 列的单位
isopenbag 输入项目是否为开袋状态,如果是则为 1,否则为 0
continueinnextdept 输入项目是否需要在下一个部门中继续,如果是则为 1,否则为 0
cancelreason 输入项目取消的原因
statusdescription 输入项目的状态描述
originalamount 原始输入项目的数量
originalrate 原始输入项目的速率

outputevents

包含了 ICU 中患者的尿液、排泄物和引流液等输出信息

subject_id 患者的唯一标识符,对应于 ICU 模块中的 admissions 和 patients 表中的 subject_id
hadm_id 患者在 ICU 中的入院号,对应于 ICU 模块中的 admissions 表中的 hadm_id
stay_id 患者在 ICU 中的住院号,用于区分不同的 ICU 住院记录
charttime 事件发生的时间,格式为 yyyy-mm-dd hh:mm:ss
storetime 事件存储的时间,格式为 yyyy-mm-dd hh:mm:ss
itemid 事件的唯一标识符,对应于 D_ITEMS 表中的 itemid,可以用于查询该事件的描述信息
value 事件的值,可以是数字、文本或者其他格式
valueuom 事件的单位,描述 value 列的单位

procedureevents

医疗过程事件表

包含了 ICU 中患者的各种手术、治疗和检查等操作信息

subject_id 患者的唯一标识符,对应于 ICU 模块中的 admissions 和 patients 表中的 subject_id
hadm_id 患者在 ICU 中的入院号,对应于 ICU 模块中的 admissions 表中的 hadm_id
stay_id 患者在 ICU 中的住院号,用于区分不同的 ICU 住院记录
starttime 事件开始时间,格式为 yyyy-mm-dd hh:mm:ss
endtime 事件结束时间,格式为 yyyy-mm-dd hh:mm:ss
storetime 事件记录的时间,格式为 yyyy-mm-dd hh:mm:ss
itemid 事件的唯一标识符,对应于 D_ITEMS 表中的 itemid,可以用于查询该事件的描述信息
value 事件的值,可以是数字、文本或者其他格式
valueuom 事件的单位,描述 value 列的单位
location 事件发生的位置
locationcategory 位置的类别
orderid 事件的订单编号
linkorderid 事件关联的订单编号
ordercategoryname 订单的类别名称
secondaryordercategoryname 次要订单的类别名称
ordercategorydescription 订单类别的描述信息
patientweight 患者的体重
totalamount 事件的总数量
totalamountuom 事件的总数量单位,描述 totalamount 列的单位
isopenbag 事件是否为开袋状态,如果是则为 1,否则为 0
continueinnextdept 事件是否需要在下一个部门中继续,如果是则为 1,否则为 0
cancelreason 事件取消的原因
statusdescription 事件的状态描述
comments_date 事件的评论日期
originalamount 原始事件的数量
originalrate 原始事件的速率

MIMIC2.2新增

ed

ED 模块包含急诊科患者在 ED 时收集的数据。 信息包括入院原因、分类评估、生命体征和药物调和。 subject_id 和 hadm_id 标识符允许 MIMIC-IV-ED 链接到其他 MIMIC-IV 模块。

diagnosis

  • “subject_id”: 这是一个唯一标识符,用于表示在MIMIC-IV数据库中的每个患者。每个患者都有一个独特的subject_id。

  • “stay_id”: 唯一标识单个患者在急诊室停留的标识符。

  • “seq_num”: 这是一个整数,表示某个诊断在某个留观期中的顺序。例如,如果一个患者在留观期中被诊断为三种疾病,那么每个诊断都会有一个不同的seq_num,以表示诊断的顺序。

  • “icd_version”: 这是指国际疾病分类系统的版本。ICD系统是一种用于编码医疗诊断和手术过程的系统,目前已经发展为第十版(ICD-10)。

  • “icd_code”: 这是一个字符串,表示某个具体的诊断代码,它是根据ICD系统编制的。

  • “icd_title”: 这是一个字符串,表示与诊断代码对应的具体疾病名称或诊断。

edstays

edstays表是急诊就诊的主要跟踪表它提供了患者进入急诊室的时间和他们离开急诊室的时间。

  • “subject_id”: 这是一个唯一标识符,用于表示在MIMIC-IV数据库中的每个患者。每个患者都有一个独特的subject_id。

  • “hadm_id”: 如果患者在 ED 住院后入院,hadm_id将包含医院标识符(范围从 2000000 - 2999999)。可hadm_id用于将 ED 停留与 MIMIC-IV 中的住院联系起来。

    如果hadm_idNULL,则患者在 ED 停留后未入院。

  • “stay_id”: 唯一标识单个患者在急诊室停留的标识符。

  • “intime”: 给定急诊科住院的入院日期时间 ( intime)

  • “outtime”: 给定急诊科住院的出院日期时间 (outtime )

  • “gender”: 这是指患者的性别,可为”Male”或”Female”。

  • “race”: 这是指患者的种族,可能是”White”, “Black or African American”, “Asian”, “Native Hawaiian or Other Pacific Islander”, “Hispanic or Latino”, “American Indian or Alaska Native”, “Other”, 或者为空值。

  • “arrival_transport”: 这是指患者进入急诊室的方式,可能是”Ambulance”, “Walk-in”, “Other”, 或者为空值。

    到达_运输 数数
    步入 251849
    救护车 155752
    未知 15352
    其他 1266
    直升机 868

    “disposition”: 个人离开 ED 的方法。在非空方法中,可能性包括:

medrecon

在进入急诊室时,工作人员会询问患者目前正在服用什么药物。此过程称为药物调和,medrecon表存储护理人员的调查结果。

Links to:

  • edstays on stay_id

  • “stay_id”: 唯一标识单个患者在急诊室停留的标识符。

  • “charttime”: 绘制药物调和图的时间。

  • “name”: 这是指药物的通用名称。

  • “etc_rn”: 这是一个整数,表示某个药物在某个ED留观期中的顺序。例如,如果一个患者在留观期中使用了三种药物,那么每种药物都会有一个不同的etc_rn,以表示药物的顺序。

  • “etccode”: 这是表示药物的编码。在MIMIC-IV数据库中,每个药物都具有一个唯一的etccode。

  • “etcdescription”: 这是表示药物的描述。它提供了有关药物名称、剂量和给药方式等信息。

  • “gsn”: 这是指药物的识别号(GSN)。每种药物都具有唯一的gsn。

  • “ndc”: 这是指药物的国家药品编码(ndc)。它是一种被广泛使用的药物标识符。

pyxis

pyxis表提供了通过 Pyxis 系统进行药物分配信息。

请注意,由于同一种药物可能有多个gsn值,因此每一行不一定表示唯一的分配。该med_rn列允许对个别分配进行二次选择。

Links to:

  • edstays on stay_id

stay_id:唯一标识单个患者在急诊室停留的标识符。

charttime :药物被绘制成图表的时间,这是最接近药物给药时间的时间。

med_rn 用于对单次分配进行分组的药物的行号。

name药名。

gsn通用序列号 (GSN),一种为每种药物提供代码的本体。

gsn_rn由于药物可能是 GSN 本体中多个组的成员,因此该行号将它们区分开来。的顺序gsn_rn没有意义。

triage

分类表包含有关患者在急诊室首次分类时的信息。患者在分诊时由一名护理提供者进行评估,并询问一系列问题以评估他们目前的健康状况。测量他们的生命体征并指定敏锐度水平。根据敏锐度水平,患者要么在候诊室等待稍后的关注,要么优先接受即时护理。

triage中的所有字段最初都是自由文本。出于去识别化的目的,生命体征和疼痛字段被转换为数值。因此,NULL为文本条目引入了少量值。

重要注意事项

没有与分类观察相关的时间。最接近分类时间的近似值是edstaysintime表中患者的时间。

此表中的数字条目最初存储为自由文本。因此,这些列需要去标识化。无法简单转换的自由文本条目已被删除。通常,MIMIC-IV中去标识化的应用使用三个下划线(___)表示,以向用户明确表示我们对数据进行了修改。但是,由于数据类型的限制,我们无法在这种情况下执行此操作。因此,数字列中缺失的数据表示数据已去标识化或未记录数据。然而,这通常很少见。下表显示了出于去标识化目的删除数据的频率:

subject_id
subject_id是指定单个患者的唯一标识符。与单个subject_id关联的任何行都属于同一个人。

stay_id
唯一标识单个患者在急诊室停留的标识符。

temperature
患者的华氏温度。有些温度可能被错误地记录为摄氏度。

heartrate
患者的心率(每分钟心跳次数)。

resprate
患者的呼吸频率(每分钟呼吸次数)。

o2sat
患者的外周血氧饱和度百分比。

sbp,dbp
患者的收缩压和舒张压分别以毫米汞柱 (mmHg) 为单位测量。

pain
患者自我报告的疼痛程度,评分范围为 0-10。

acuity
基于使用紧急严重程度指数 (ESI) 五级分类系统的敏锐度的优先顺序。此优先级由注册护士指定。级别 1 是最高优先级,而级别 5 是最低优先级。级别是:

1个
当 1 级条件或患者符合 ED 触发标准时,分类过程停止,患者被直接带到房间并要求立即进行医生干预。
触发 1 级的患者状况包括无反应、插管、呼吸暂停、无脉搏、需要药物/干预以改变 ESI 水平,例如麻醉剂/腺苷/心脏复律、外伤、中风、stemi
2个
当确定 2 级条件时,分诊护士会通知资源护士并确定适当的安置。
触发 2 级的患者情况包括高风险情况、新发的精神错乱、自杀/杀人念头、嗜睡、癫痫发作或定向障碍、可能的异位妊娠、免疫功能低下的患者发烧、剧烈疼痛/痛苦或生命体征不稳定
3个
包括需要两种或多种资源(实验室、心电图、X 光、静脉输液等)且生命体征稳定的患者
4个
患者只需要一种资源(实验室、心电图等)
5个
不需要任何资源的患者
chiefcomplaint
患者主诉的去标识化自由文本描述。

vitalsign

进入急诊室的患者每 1-4 小时进行一次常规生命体征检查。这些生命体征存储在生命体征表中

重要注意事项
此表中的数字条目最初存储为自由文本。因此,这些列需要去标识化。无法简单转换的自由文本条目已被删除。通常,MIMIC-IV中去标识化的应用使用三个下划线(___)表示,以向用户明确表示我们对数据进行了修改。我们认为最好是省略此修改,而不是通过将大多数数字数据共享为文本来增加用户的困惑和困难。因此,数字列中缺失的数据表示数据已去标识化或未记录数据。但是,在大多数情况下,缺失数据表明没有记录任何信息。下表显示了出于去标识化目的删除数据的频率:

subject_id
subject_id是指定单个患者的唯一标识符。与单个subject_id关联的任何行都属于同一个人。

stay_id
唯一标识单个患者在急诊室停留的标识符。

charttime
绘制生命体征的时间。

temperature
患者的华氏温度。有些温度可能被错误地记录为摄氏度。

heartrate
患者的心率(每分钟心跳次数)。

resprate
患者的呼吸频率(每分钟呼吸次数)。

o2sat
以百分比形式测量的患者氧饱和度。

sbp,dbp
患者的收缩压 (sbp) 和舒张压 (dbp) 以毫米汞柱 (mmHg) 为单位测量。

rhythm
病人的心律。

pain
患者自我报告的疼痛程度,评分范围为 0-10。痛苦被记录为自由文本,可能包含非数字条目

note

住院出院小结

注释模块包含针对住院患者的未识别的自由文本临床注释

discharge

出院表包含住院的出院摘要。出院小结是长篇叙述,描述了患者入院的原因、住院过程以及任何相关的出院说明。

Links to

  • discharge_detail on note_id

note_id
给定注释的唯一标识符。note_id由subject_id、the note_type(总是两个字符长)和一个单调递增的整数组成note_seq,格式如下:subject_id- note_type- note_seq。

subject_id
subject_id是指定单个患者的唯一标识符。与单个subject_id关联的任何行都属于同一个人。

hadm_id
hadm_id是一个整数标识符,对于每个患者住院是唯一的。

note_type
行中记录的注释类型。注释有两种类型:

‘DS’ - 出院总结
‘AD’ - 出院摘要附录

note_seq
一个单调递增的整数,按时间顺序对类别内的笔记进行排序note_type。也就是说,笔记可以按顺序排序note_seq。

charttime
注释绘制的时间——这通常是解释注释内容最相关的时间,但不一定是注释完全写入的时间。

storetime
笔记存储在数据库中的时间。这通常是在笔记完成并签名时

Discharge detail

出院总结的辅助信息。

与出院表中记录的注释相关的附加信息。可以使用note_id链接到discharge表

note_id
给定注释的唯一标识符。note_id由subject_id、the note_type(总是两个字符长)和一个单调递增的整数组成note_seq,格式如下:subject_id- note_type- note_seq。

subject_id
subject_id是指定单个患者的唯一标识符。与单个subject_id关联的任何行都属于同一个人。

field_name
每行都提供了关于注释的特定方面的详细信息。field_name是给那个方面的名称。从 MIMIC-IV v1.0 开始,可能的值包括:作者

field_value
field_value是与给定关联的值field_name,与注释关联。例如,对于field_name“作者”的,该field_value列包含注释的作者

Radiology

放射学报告

放射表包含与放射成像相关的自由文本放射学报告。放射学报告涵盖多种成像方式:X 射线、计算机断层扫描、磁共振成像、超声等。自由文本放射学报告是半结构化的,通常遵循给定成像协议的一致模板

note_id
给定注释的唯一标识符。note_id由subject_id、the note_type(总是两个字符长)和一个单调递增的整数组成note_seq,格式如下:subject_id- note_type- note_seq。

subject_id
subject_id是指定单个患者的唯一标识符。与单个subject_id关联的任何行都属于同一个人。

hadm_id
hadm_id是一个整数标识符,对于每个患者住院是唯一的。

note_type
行中记录的注释类型。注释有两种类型:

‘RR’ - 放射学报告
‘AR’ - 放射学报告附录
note_seq
一个单调递增的整数,按时间顺序对类别内的笔记进行排序note_type。也就是说,笔记可以按顺序排序note_seq。

charttime
注释绘制的时间——这通常是解释注释内容最相关的时间,但不一定是注释完全写入的时间。

storetime
笔记存储在数据库中的时间。这通常是在笔记完成并签名时。

Radiology detail

放射学笔记的辅助信息

与放射学表中记录的注释相关的附加信息。可以使用note_id链接到放射表Radiology

note_id
给定注释的唯一标识符。note_id由subject_id、the note_type(总是两个字符长)和一个单调递增的整数组成note_seq,格式如下:subject_id- note_type- note_seq。

subject_id
subject_id是指定单个患者的唯一标识符。与单个subject_id关联的任何行都属于同一个人。

field_name
每行都提供了关于注释的特定方面的详细信息。field_name是给那个方面的名称。从 MIMIC-IV v1.0 开始,可能的值包括:

附录_note_id
parent_note_id
cpt_code
考试代码
考试名称

field_value
field_value是与给定关联的值field_name,与注释关联。例如,对于field_name“作者”的,该field_value列包含注释的作者

治疗名称

病情 治疗名称
心脏骤停 心肺复苏
急性呼吸窘迫 呼吸支持治疗
失学性休克 休克支持治疗
  1. 急性呼吸窘迫的治疗名称通常称为呼吸支持治疗。呼吸支持治疗包括吸氧、呼吸机支持、呼吸道管理等措施,旨在改善患者的呼吸功能,维持氧合和二氧化碳排泄,以缓解呼吸窘迫症状和维持生命体征的稳定。
  2. 失学性休克的治疗名称通常称为休克支持治疗。休克支持治疗包括补液、使用血管活性药物、纠正酸碱平衡等措施,旨在维持患者的循环功能和器官灌注,以缓解休克症状和维持生命体征的稳定。

碰见的问题:

问GPT的SQL语句前缀

我已经将mimic-iv1.0数据库导入到了postgresql中并用pgadmin可视化,表名为mimiciv,三个架构分别为mimic_core,mimic_hosp,mimic_icu,请给我在pgadmin中查询subject_id =10014354且hadm_id =29600294的患者数据信息的sql语句

我已经将mimic-iv2.0数据库导入到了postgresql中并用pgadmin可视化,表名为mimiciv20,我想查mimic_hosp架构中diagnoses_icd表的所有的列名,请给我sql语句

问题1:选择查询工具

为什么我用pgadmin4的psql tool,会弹出sql shell类似的窗口

根据你提供的信息,我猜测你打开的是 pgAdmin 4 的“SQL Shell”工具,而不是“Query Tool”工具。这两个工具在 pgAdmin 4 中具有不同的用途和功能。

“SQL Shell”工具是 pgAdmin 4 中的命令行界面,它允许你使用 psql 命令行工具来连接和管理 PostgreSQL 数据库。当你打开“SQL Shell”工具时,它会弹出一个类似于 SQL Shell 的命令行窗口,你可以在该窗口中输入 psql 命令。

如果你想要使用 pgAdmin 4 的图形界面来执行 SQL 查询和管理数据库对象,你应该使用“Query Tool”工具(对应中文就是”**查询工具”**),而不是“SQL Shell”工具。要打开“Query Tool”工具,请按照以下步骤操作:

  1. 打开 pgAdmin 4 工具,然后选择要连接的服务器对象。
  2. 在对象树中展开服务器对象,然后右键单击要查询的数据库对象。
  3. 在弹出的上下文菜单中,选择“Query Tool”选项,这将打开一个新的 SQL 查询窗口。
  4. 在 SQL 查询窗口中,你可以输入 SQL 查询语句,并使用工具栏中的按钮执行查询、保存查询或导出查询结果等操作。

请注意,这里的“Query Tool”工具是 pgAdmin 4 中的图形界面工具,它提供了许多方便的功能来管理数据库对象和执行 SQL 查询。如果你想要使用 psql 命令行工具来连接和管理数据库,你可以选择使用“SQL

问题2:查询示例

# 设置搜索路径设置为mimic_core
SET search_path = mimic_core;
# 检查当前的搜索路径是否已正确设置为mimic_core架构
SHOW search_path;
# 查询是否有subject_id =10014354的患者
SELECT * FROM mimic_core.patients
WHERE subject_id = '10014354';

关于icd_code

ICD-9 和 ICD-10 代码通常都带有小数点。ICD 代码的解释不需要这个小数点;即icd_code‘0010’ 等同于’001.0’。

MIMIC-IV2.0的icd10是新版本的(不是2019年版本的):https://www.icd10data.com/ICD10CM/Codes

心脏骤停

ICD-9 代码列表 390–459:循环系统疾病

ICD-9-CM: 427.5

ICD-10-CM: I46x

SELECT subject_id,hadm_id,icd_code
FROM mimic_hosp.diagnoses_icd
WHERE icd_code LIKE '4275%' OR icd_code LIKE 'I46%'
ORDER BY subject_id;
Match found: p14071752		21211403	I462	17:18:20.236 28/7/2156
Match found: p15896656 29053618 I468 04:35:54.543 12/9/2179
# Match found: p18573443 28015626 I462
在ICD-10编码标准中,I46.2、I46.8和I46.9均表示心搏骤停,但它们之间有细微的差异。

具体来说,I46.2表示由于电击治疗导致的心搏骤停,而I46.8表示其他特定原因导致的心搏骤停,例如过度透析导致的心搏骤停或药物过量导致的心搏骤停等。而I46.9则表示未特定原因导致的心搏骤停。

因此,在使用ICD-10编码标准时,需要根据患者的具体情况和诊断信息来选择相应的编码。

急性呼吸窘迫综合征

ICD-9-CM: 518.81

ICD-10-CM: J80

# Match found: p13080738		20217710	51881
# Match found: p13620446 20475690 51881
Match found: p14285792 23014125 J80

失血性性休克

# Match found: p13184012		23868910	R571
Match found: p15315368 28289785 R571
Match found: p17818849 29560301 R571
Match found: p18080257 29393950 R571

匹配

请按照我的需求给我写一段python代码:
我想做一个匹配,我有一份csv文件,路径在E:\Work\mimic\Dataset\sid4725.csv,里面是一千多行的1维数据,这是他前三行的内容:
"subject_id"
10013569
10026161
10062020
我还有一个MIMIC-IV-Waveform-Database文件夹,路径在E:\Work\mimic\MIMIC-IV-Waveform-Database\physionet.org\files\mimic4wdb\0.1.0\waves,再下一层的文件名是p100-p199,再下一层的文件名是pxxxxxxxx,举例:p100文件夹内有几个文件夹,其中一个文件夹的名字是p10014354,
如果上面说的csv文件里的每个数(即subject_id)和MIMIC-IV-Waveform-Database文件夹里的文件名(这里指pxxxxxxxx)去掉p之后的8位数一样,则输出到控制台,提示:sid4725.csv文件和MIMIC-IV-Waveform-Database文件夹都已经按升序排列
Match found: p14071752
Match found: p15896656
Match found: p18573443

和手术相关的表

d_hcpcs 主要用于为hcpcsevents表中使用的代码提供可读的定义(有cpt) 查不到我想要的
d_icd_procedures ICD医疗过程词典表。
poe 患者医嘱信息的参考表。“order_type”:该列是医嘱的类型,例如药物治疗、手术等。
procedures_icd 存储患者实施过的医疗过程的参考表
datetimeevents 包含了 ICU 中的一些时间相关的事件的记录信息
d_items 包含了 ICU 中的所有测量指标、药品、手术等项目的元数据信息
procedureevents 医疗过程事件表包含了 ICU 中患者的各种手术、治疗和检查等操作信息

根据subject_id和hadm_id查出对应cpt代码(失败)

在hosp模块的hpcsevents表中

-- 根据subject_id和hadm_id查出对应cpt代码
-- SELECT hcpcs_cd
SELECT *
FROM mimic_hosp.hcpcsevents
WHERE subject_id = '14285792' AND hadm_id = '23014125'
ORDER BY hadm_id

很遗憾,我没查到任意一个我自己想要的,只能按照一般的来了,gpt随便问了一下:

心脏骤停的CPT代码通常与心肺复苏(CPR)相关。以下是一些比较常见的心脏骤停相关的CPT代码:

92950:心肺复苏(包括胸外按压和人工呼吸)
92953:心肺复苏(包括胸外按压和人工呼吸),经气管插管或气管切开
92960:心肺复苏(包括胸外按压和人工呼吸),经导管直接插入气管
92977:体外心脏去纤维化术(包括心肺复苏和电除颤)
需要说明的是,CPT代码的使用可能因为医疗机构、地区和时间等因素而有所不同,以上CPT代码仅为参考,具体情况需要根据具体的研究目的和条件进行查找和匹配。此外,还需要了解CPT编码的使用规范和标准,以便正确地应用和解读编码信息。

根据subject_id和hadm_id查出procedures_icd表对应手术详细信息(失败)

-- 根据subject_id和hadm_id查d_icd_procedures
-- SELECT *
SELECT icd_code
FROM mimic_hosp.procedures_icd
WHERE subject_id = '15896656' AND hadm_id = '29053618' AND chartdate = '2179-09-12 00:00:00'
ORDER BY seq_num
-- 手术编码结果:
"5A12012" -- 这个编码表示进行单次手动测量心输出量,主要用于评估心脏功能和血流动力学状态。
"5A1955Z"
"0WCG0ZZ"
"0W3G0ZZ"
"02HV33Z" -- 这个编码表示使用经皮穿刺开放性技术进行心脏辅助系统的植入,主要用于治疗心衰等心脏疾病。
"0BH17EZ"
-- 如果查到了再根据查到的procedures_icd编码去d_icd_procedures表里查解释说明
SELECT *
FROM mimic_hosp.d_icd_procedures
WHERE icd_code IN (
SELECT icd_code
FROM mimic_hosp.procedures_icd
WHERE subject_id = '15896656' AND hadm_id = '29053618' AND chartdate = '2179-09-12 00:00:00'
ORDER BY seq_num
)

根据subject_id和hadm_id查出poe表对应医嘱信息 (失败)

-- 查某个患者的医嘱
SELECT *
FROM mimic_hosp.poe
WHERE subject_id = '15896656' AND hadm_id = '29053618' AND ordertime >= '2179-09-12 00:16:46' AND ordertime <= '2179-09-12 21:43:51'
ORDER BY ordertime;

查了下医嘱类型:

SELECT DISTINCT order_type
FROM mimic_hosp.poe
WHERE subject_id = '15896656' AND hadm_id = '29053618' AND ordertime >= '2179-09-12 00:16:46' AND ordertime <= '2179-09-12 21:43:51'
-- ORDER BY ordertime;

医嘱类型含义:

MIMIC-IV2.0中的mimic_hosp模块中的poe表中的order_type列包含了多种医嘱类型。以下是其中几种类型及其含义:

  1. “ADT orders”: 包括与患者入院和出院相关的医嘱,如护理评估、病历记录等。
  2. “Blood Bank”: 包括与输血相关的医嘱,如血型鉴定、血液成分治疗等。
  3. “Cardiology”: 包括与心脏疾病相关的医嘱,如心电图、心脏监测等。
  4. “Critical Care”: 包括与重症监护相关的医嘱,如机械通气、血流动力学监测等。
  5. “General Care”: 包括与一般护理相关的医嘱,如病人转移、伤口护理等。
  6. “IV therapy”: 包括与静脉输液治疗相关的医嘱,如输液速率、输液种类等。
  7. “Lab”: 包括与实验室检测相关的医嘱,如血常规、尿常规等。
  8. “Medications”: 包括药物治疗相关的医嘱,如用药剂量、用药频率等。
  9. “Nutrition”: 包括与营养治疗相关的医嘱,如饮食种类、进食方式等。
  10. “Radiology”: 包括与放射治疗相关的医嘱,如X光检查、CT检查等。
  11. “Respiratory”: 包括与呼吸治疗相关的医嘱,如吸氧、呼吸机操作等。

需要注意的是,不同的医疗机构可能会有不同的医嘱类型分类方式,因此在具体应用时需要结合具体的情况进行理解和使用。

医嘱子类型含义:

  1. “Activity”: 活动相关的医嘱,例如安排患者进行康复训练、体育锻炼等。
  2. “Blood tests”: 血液检测相关的医嘱,例如安排患者进行血常规、凝血功能等检查。
  3. “CPAP for OSA”: 针对睡眠呼吸暂停综合症的持续正压通气(CPAP)治疗相关的医嘱。
  4. “Cryoprecipitate Product Order”: 冻沉淀制品治疗相关的医嘱。
  5. “Diet Order”: 饮食相关的医嘱,例如安排患者进行特殊膳食、禁食等。
  6. “ECG”: 心电图检查相关的医嘱。
  7. “Frozen Plasma Product Order”: 冰冻血浆治疗相关的医嘱。
  8. “General Xray”: 一般X光检查相关的医嘱。
  9. “Hemodynamic monitoring”: 血流动力学监测相关的医嘱,例如安排患者进行动脉压力监测等。
  10. “IV access”: 静脉通路相关的医嘱,例如安排患者进行静脉穿刺、置管等。
  11. “IV fluids”: 静脉输液相关的医嘱,例如安排患者进行生理盐水、葡萄糖等输液治疗。
  12. “Mechanical Ventilation”: 机械通气治疗相关的医嘱。
  13. “Other”: 其他类型的医嘱,没有特定的分类。
  14. “Oxygen Therapy”: 氧疗治疗相关的医嘱。
  15. “Platelet Product Order”: 血小板制品治疗相关的医嘱。
  16. “Postop”: 术后相关的医嘱,例如安排患者进行术后康复、护理等。
  17. “Red Cell Product Order”: 红细胞制品治疗相关的医嘱。
  18. “Restraints”: 约束治疗相关的医嘱,例如安排患者进行限制活动、绑带约束等。
  19. “Therapeutic devices/DVT/Prophylaxis”: 治疗性设备、深静脉血栓预防相关的医嘱。
  20. “Tubes/Drains”: 包括管道和引流管的相关医嘱,例如安排患者进行胃肠减压、胸腔引流等。
  21. “Ultrasound”: 超声检查相关的医嘱。
  22. “Vitals/Monitoring”: 生命体征监测相关的医嘱,例如安排患者进行血压监测、呼吸频率监测等。

根据subject_id和hadm_id查datetimeevents表和d_items表(失败)

-- 根据subject_id和hadm_id查datetimeevents
SELECT *
FROM mimic_icu.datetimeevents
WHERE subject_id = '14071752' AND hadm_id = '21211403'
ORDER BY charttime

根据subject_id和hadm_id查procedureevents表

-- 根据subject_id和hadm_id查procedureevents表
SELECT *
FROM mimic_icu.procedureevents
WHERE subject_id = '14071752' AND hadm_id = '21211403'
ORDER BY starttime

根据subject_id和hadm_id查chartevents(成功)

不过很遗憾,没有看见心电相关的,全是呼吸相关的

SELECT *
FROM mimic_icu.chartevents
WHERE subject_id = '14071752' AND hadm_id = '21211403'
ORDER BY charttime
SELECT itemid
FROM mimic_icu.chartevents
WHERE subject_id = '14071752' AND hadm_id = '21211403' AND charttime = '2156-07-28 17:19:00' OR charttime = '2156-07-28 17:26:00'
ORDER BY charttime

从7856行到7887行,共32行

看charttime还是storetime

MIMIC-IV-Waveform-Database中的时间应该对应MIMIC-IV2.0 中chartevents表中的charttime还是storetime呢?

GPT答:charttime

MIMIC-IV-Waveform-Database 中的时间戳应该对应 MIMIC-IV2.0 中 “chartevents” 表中的 “charttime” 字段,而不是 “storetime” 字段。

这是因为 “charttime” 字段表示记录这些数据的时间点,通常是医疗保健工作者记录数据的时间。而 MIMIC-IV-Waveform-Database 中的时间戳表示记录数据的时间点,即数据采集的时间点,与 “chartevents” 表中的 “charttime” 字段所表示的时间点更加一致。

在进行数据整合和分析时,应该将 MIMIC-IV-Waveform-Database 中的波形数据与 “chartevents” 表中的其他生理参数和临床数据进行整合,以获取更全面和准确的患者信息。需要注意的是,在进行数据整合时,可能需要进行时间戳的校准和匹配,以确保数据的一致性和准确性。

根据itemid查d_items表

itemid从chartevents表中查到的

-- 心脏骤停根据itemid查d_items表
SELECT *
FROM mimic_icu.d_items
WHERE itemid IN
(SELECT itemid
FROM mimic_icu.chartevents
WHERE subject_id = '14071752' AND hadm_id = '21211403' AND charttime = '2156-07-28 17:19:00' OR charttime = '2156-07-28 17:26:00'
ORDER BY charttime)

解析81739927_0001.hea

81739927_0001 4 62.4725/999.56 320
81739927_0001e.dat 516x4 200/mV 14 8192 0 512 0 II
81739927_0001e.dat 516x4 200/mV 14 8192 0 512 0 V
81739927_0001e.dat 516x4 200/mV 14 8192 0 512 0 aVR
81739927_0001r.dat 516 1637(1230)/Ohm 10 512 0 32736 0 Resp

signal 0 (II): channel=0 bandpass=[0.5,35]
signal 1 (V): channel=1 bandpass=[0.5,35]
signal 2 (aVR): channel=2 bandpass=[0.5,35]

解析:

这是一个 MIMIC-IV 波形数据库中某个 .hea 文件的内容,文件中包含了一些波形信号的相关信息。具体地,文件内容的含义如下:

第一行:记录号为 81739927_0001,共有 4 个信号通道,采样率为 62.4725 Hz,数据长度为 320。
第二行:第一个信号通道的数据文件名为 81739927_0001e.dat,数据为 516 行 4 列,增益为 200mV,基线为 14,ADC 最大值为 8192,最小值为 0,采样位数为 512,通道名称为 II。
第三行:第二个信号通道的数据文件名为 81739927_0001e.dat,数据为 516 行 4 列,增益为 200mV,基线为 14,ADC 最大值为 8192,最小值为 0,采样位数为 512,通道名称为 V。
第四行:第三个信号通道的数据文件名为 81739927_0001e.dat,数据为 516 行 4 列,增益为 200mV,基线为 14,ADC 最大值为 8192,最小值为 0,采样位数为 512,通道名称为 aVR。
第五行:第四个信号通道的数据文件名为 81739927_0001r.dat,数据为 516 行 1 列,增益为 1637(1230)Ohm,基线为 10,ADC 最大值为 32736,最小值为 0,采样位数为 512,通道名称为 Resp。
第六行:对于信号通道 0,使用 bandpass=[0.5,35] 的带通滤波器进行滤波。
第七行:对于信号通道 1,使用 bandpass=[0.5,35] 的带通滤波器进行滤波。
第八行:对于信号通道 2,使用 bandpass=[0.5,35] 的带通滤波器进行滤波。
该文件中包含了四个波形信号通道,分别为 II、V、aVR 和 Resp。其中前三个信号通道的数据文件名为 81739927_0001e.dat,后一个信号通道的数据文件名为 81739927_0001r.dat。每个信号通道的采样率和采样位数、增益、基线、ADC 最大值和最小值等信息都有所不同。文件中还给出了对信号通道进行带通滤波的相关信息。

解析81739927.hea

#wfdb 10.7
81739927/21 7 62.4725/999.56 6661120 09:00:17.566 16/8/2148
81739927_0000 0
81739927_0001 320
81739927_0002 3200
81739927_0003 544
81739927_0004 96
81739927_0005 1920
81739927_0006 224
81739927_0007 96
81739927_0008 1431360
81739927_0009 1280
81739927_0010 641280
81739927_0011 1600
81739927_0012 776320
81739927_0013 640
81739927_0014 1227840
81739927_0015 23360
81739927_0016 741760
81739927_0017 1236800
81739927_0018 320
81739927_0019 5760
81739927_0020 566400
# subject_id 10014354
# hadm_id 29600294

解析:

这是一个 MIMIC-IV 波形数据库中某个数据文件的 .hea 描述文件,用于描述该数据文件中所包含的信号通道和一些相关的参数信息。具体内容的含义如下:

第一行:文件格式为 wfdb 10.7,表示该文件符合 WFDB(Waveform Database)格式规范的版本号为 10.7。
第二行:记录号为 81739927/21,表示该数据文件对应的患者记录号为 81739927,该记录中包含了 21 个信号通道。
第三行:共有 7 个信号通道,采样率为 62.4725 Hz,数据长度为 6661120,记录开始时间为 09:00:17.566,采样位数为 16,信号精度为 8 bit,数据文件长度为 2148。
第四到第二十四行:分别描述了 21 个信号通道的相关信息。每行的格式为“信号通道名称 数据长度”,其中数据长度表示该信号通道在数据文件中的数据长度。
第二十五行及以后:包含了一些与该数据文件相关的患者信息,其中 subject_id 表示患者的唯一标识符,hadm_id 表示患者在医院中的唯一标识符。
该文件中包含了 21 个信号通道,具体每个信号通道的含义和数据类型需要查看数据文件中的 .dat 文件或数据字典文件来确定。该文件中的信息可以帮助使用者了解数据文件的基本特征、信号通道数目和采样率等信息,以及对数据文件进行后续的处理和应用。

MIMIC2.2心脏骤停病人

-- 在diagnosis表中查出所有心脏骤停患者的subject_id
SELECT *
FROM mimiciv_ed.diagnosis
WHERE icd_code LIKE '4275%' OR icd_code LIKE 'I46%'
ORDER BY icd_code;
subject_id	stay_id				note_id
13025850 39910982 "I469" "13025850-DS-3"