编者按:本文2024年1月发表于Nature官网,作者为Martin Dugas等11人。编译者曹智,内容谨供参考。
1.概况
结构化的患者数据在所有类型的临床研究中都发挥着至关重要的作用。这类数据通常被存放在数据库中以供研究之用。为了对下一代研究型数据库的特征进行描述并对其实现的可行性进行评估,德国的一家大学医院进行了概念验证研究。经研究,下一代(医学)研究型数据库的关键特征应包括:可实现公平访问的电子病历报告表 (eCRF)系统;符合监管要求的临床试验数据采集系统(EDC),后者可与电子健康记录 (EHR)系统集成,且可用于医疗文档的扩展;患者生成的数据和临床决策支持。在本研究中,我们成功地为19个临床试验数据采集系统(EDC),计2,217名患者实施了下一代研究数据库, 该数据库通过名为OpenEDC的本地临床试验数据采集系统(EDC)链接到ISHMED (美国顶级健康信息技术平台、服务和硬件供应商Oracle Cerner的“软件即服务产品”)。德国海德堡大学医院(一家大型三级转诊医院)的11个临床科室参与本项目并帮助我们确定了新一代患者数据库的需求。我们整理并分析了2021年5月至2023年7月间提交给OpenEDC团队的产品需求特征和功能请求。新一代研究数据库在技术和临床上都是可行的,但仍需要进一步的研究来评估我们的方法在多中心环境下是否可行。
2.介绍
结构化患者数据在所有类型的临床研究中都发挥着关键作用。这些数据中的数据元素具有被明确定义的含义和统一的格式。结构化的患者数据几乎是每个临床研究数据库的关键组成部分,因其提供易访问的,以及可实现跨患者分析的数据点,其对于达成研究目的很有价值。例如,需要将大量数据(影像、传感器数据、基因组)与结构化的患者属性数据(例如,病史、年龄、性别等)联系起来进行数据分析,以确定人群中某一种疾病的诊治结果好与坏的“特征”。用于解释医学影像或传感器数据的人工智能(AI)算法也需要通过临床诊断或发现(例如气胸)进行训练和验证。
对结构化数据进行的研究比对非结构化数据进行的研究要有用得多。例如,当需要建立新的医疗干预有效性的证据时,最有力的工具是随机对照试验(RCT) 1。在随机对照试验中,数据的收集须有前瞻性,并且其所收集的必须是高质量的数据。虽然随机对照试验为医疗干预创造了标准化的环境,但实际作用于患者的内外界因素可能非常的多样化。这些偏差可能会影响疗效,因此对真实世界数据(RWD)和真实世界证据(RWE)的研究在评估医疗产品和干预措施中发挥着越来越重要的作用2。真实世界数据(RWD)的潜在来源包括电子健康记录 (EHR)和保险索赔数据3。
患者数据涵盖的类别非常广泛,如图1所示。结构化患者数据可以以表格形式呈现,并由许多不同的变量组成,例如诊断代码、治疗过程、生命体征或结果数据(例如对治疗的反应或生存时间)。由于医学术语多种多样,变量可能包含数千种不同的属性。系统化医学命名法(SNOMED)可以以最优的方式体现属性,其中包含超过300,000个非同义概念4。原则上,每个系统化医学命名法(SNOMED)中的概念都可能代表了结构化的患者数据变量的某一“属性”。
图1影像数据是构成患者数据的另一个主要类别。数据是通过计算机断层扫描或显微镜等成像方式生成的,其特点是每个患者的数据体量很大。同样,一般情况下,包括心电图在内的传感器数据是在重症监护病房或围手术期环境中收集的。最近,智能手表等可穿戴设备成为传感器数据的另一个来源。基因组数据主要是通过对人体材料(组织)进行测序而产生的。例如,当分析患者的整个基因组时,所得数据集可能非常大。
最后,患者文档中的非结构化数据也是常用的数据类别。如今,电子健康记录系统(EHR)中的大部分临床信息仍然存储在自由文本形式的文档中,例如临床记录和出院信5。非结构化数据没有预定义的数据模型。此类数据仍然包含有价值的医疗信息,但无法直接进行分析。须手动或通过自然语言理解(NLU)算法6将数据提取并置入到结构化数据模型中。
由于其对临床研究的重要性,结构化患者数据在被收集后存储于经过验证的研究数据库中。相比之下,大多数商业电子健康记录系统(EHR)系统目前并非为临床研究而设计,并且大部分内容由非结构化数据5、7组成。因此,出于研究目的,许多数据点是从电子健康记录系统(EHR)系统中以“通过手动的图表审查”的方式提取的,并通过电子病历报告表 (eCRF) 输入研究数据库(参见图2),这一过程费时费力成本高昂,也提高了临床研究的成本8 。 例如,根据普龙克(Pronker)研究团队的估计,他们在三次试验中纠正错误数据所消耗的成本为20万欧元9。
图2新药的开发成本极高(根据DiMasi研究团队测算每个获批上市药物的研发成本为28.7亿美元10),因此该领域通常被大型制药公司所垄断。这些开发成本的很大一部分与临床研究有关,特别是前瞻性介入试验。对研究数据库进行创新设计或改进,将降低每个有效数据点的投入成本,可以提高临床研究的可行性和交付时间。此外,它还可以促进由研究者发起的临床试验(IIT)的发展,这些试验主要是由医疗需求而不是经济利益驱动的。
本研究的目的是回答以下问题:
为了提高数据收集的效率和有效性,研究数据库需要具备哪些一般特征?
在当今的大学医院环境中实施和操作这样一个改进的数据库是否可行?
我们在海德堡大学医院进行了研究以及概念验证,该医院是德国一家主流的三级转诊医院,每年接待约80,000名住院患者和100万以上门诊病人。以此为基础,我们提出了对下一代研究数据库的要求,如我们的第一个目标中概述的那样。为了测试这些要求的实用性和可行性,我们在海德堡大学医院的11个临床科室实施了一个原型。
3.结论
对应于本研究所提出的双重目标,我们的结果也分为两个部分。首先,描述与下一代研究数据库相关的产品需求。这些需求本质上源自用户,涵盖了数据可比性、EHR集成和患者生成数据等各个方面。本节随后将对海德堡大学医院基于这些要求实施的原型软件进行描述。
4.要求
新的研究结果必须与先前的研究结果进行比较并(对差异)进行解释。因此,研究人员应在新研究数据库的设计阶段考虑重(复利)用先前对同一疾病的研究的数据结构。遵循可查找性、可访问性、互操作性和可重用性11的四大数据原则,可以提升对先前研究的结构化元数据(例如 eCRF)的访问效率。以对数据元素的语义注释(为每个数据元素提供清晰的定义)为基础,对元数据的公平访问可以提升新研究和此前研究数据之间的兼容性。
如果预计临床研究会改变医疗实践(例如新的诊断或治疗方法),则需要获得监管机构的批准。这意味着研究数据库必须符合数据可监管的标准。在这种情况下,一个关键要求是:数据点来源须可追溯(审计追踪),以建立对数据的信任,这是由临床数据交换标准联盟(CDISC)审核系统提供的标准。 而许多其他常用的数据收集工具(例如,Microsoft Excel、IBM SPSS Statistics 或类似软件)无法满足数据捕获期间审计跟踪的需求。
理想情况下,电子健康记录系统(EHR)数据应该具有良好的数据结构、可做临床研究之用的高质量。如果确实如此的话,那么EHR可以直接集成临床试验数据采集系统(EDC),两者实现数据互联互通:将EHR数据导入临床试验数据采集系统(EDC)是可以实现的(例如,提取实验室结果),并且导出也应该是可行的。虽然EHR数据包括所有类别的临床数据(另请参见图1),但通常来说,医学研究所需要的数据点比常规临床护理所需要的数据点要多(包括对附加的诊断程序或详细患者随访的说明信息)。因此,从EHR系统中提取、转换和加载(ETL)数据只能为研究数据库贡献一部分数据,现实中往往需要电子健康记录系统(EHR)和临床试验数据采集系统(EDC)数据的组合。
临床试验数据采集系统(EDC)需要针对特定疾病并适配特定的研究环境(例如,有关急性髓系白血病的临床研究)。“国际疾病和相关健康问题统计分类(ICD)” 12中有超过10,000种粗粒度诊断,因此需要一种针对特定疾病系统的,具有可扩展性的软件开发方法,来推动研究数据库的实施。模型驱动的软件开发是一种既定的方法,它支持根据模型的描述生成软件,相比于费时费力且容易出错的手动软件程序编辑(方法)其更具有优势。
为了改善研究结果,临床研究数据库不仅应包含更为全面的、高质量的数据——须全面覆盖所有“医学记录”:包括住院和门诊数据,以及捕获所有医疗保健专业人员生成的数据,此外还应包括患者生成的数据,例如患者报告的结果测量(PROM)13。PROM理应支持对合理检查进行扩展、对数据偏差进行识别以及对诊断和治疗效果进行详细评估。
用于患者护理的研究数据库和临床决策支持系统(CDS)往往是以高质量的结构化数据为基础的。临床研究与日常护理的集成的系统应避免采集冗余数据。考虑到一般性的临床研究和护理的资源限制,每个数据点应仅记录一次,并在必要时重复使用。研究数据库和临床决策支持系统(CDS)可用于提高对医疗指南的遵循度、提升患者安全性,同时推进研究工作流程。
根据所描述的研究数据库的需求,下一代研究数据库应具有以下特征:
通过使用语义注释(包括结构元数据)实现对电子病历报告表(eCRF)的公平访问,并具备向后兼容性;
符合监管数据标准、具备审计跟踪能力;
临床试验数据采集系统(EDC)与电子健康记录(EHR)集成;
临床试验数据采集系统(EDC)可扩展;
将临床团队文档与临床试验数据采集系统(EDC)系统集成;
集成收集患者生成数据的“患者报告的结果测量”(PROM);
利用临床试验数据采集系统(EDC)与电子健康记录 (EHR)集成的数据支持临床决策。
5.原型软件实施
原型实施是以一个符合法规且具有扩展性的临床试验数据采集系统(EDC)软件为基础的。在本研究中,我们使用OpenEDC 14作为基于临床数据交换标准协会(CDISC)操作数据模型(ODM)15的临床试验数据采集系统(EDC)。OpenEDC可以导入临床数据交换标准协会(CDISC)操作数据模型(ODM)格式的电子化病历报告表(eCRF)。此外,医疗数据模型门户16(MDM-Porta)提供了超过25,000个带语义注释的病历报告表(CRF),可以直接导入OpenEDC并根据特定研究适配其文档需求。通过支持在新研究中元素重用——支持重用医疗数据模型门户(MDM)中的病历报告表(CRF)——使临床试验数据采集系统(EDC)的开发更具可扩展性,从而减少流程设计、编程和测试的工作量。由于OpenEDC基于操作数据模型(ODM),因此表单定义的语义注释与调查问卷的调查结果数据也一并包含在最终的数据文件中。
为了在案例研究中提供对具有语义注释的电子化病历报告表(eCRF)的公平访问机会,我们将用于收集病史的电子化病历报告表(eCRF)上传到“医疗数据模型MDM”门户(图3)。所有数据元素均由医生使用统一医学语言系统(UMLS) 17代码进行注释,以提供独立于语言(本身)的语义注释。
图3图4展示了临床试验数据采集系统(EDC)和电子健康记录 (EHR)数据集成的示例:使用iPad完成患者调查问卷采集后,除了将数据存储于临床试验数据采集系统(EDC)数据库中之外,还将PDF报告传送到电子健康记录系统(EHR)系统中。
图4此外,临床试验数据采集系统(EDC)被集成到医院的临床电子健康记录(EHR)工作站中:在电子健康记录 (EHR)系统的患者列表中,我们实现了与临床试验数据采集系统(EDC)的网络链接,以便临床团队在临床试验数据采集系统(EDC)中进行对应的记录(另请参见图1)。该链接包含患者编号、当前临床用户标识和加密散列。选择该链接将打开临床试验数据采集系统(EDC),同时保留从当前电子健康记录(EHR)列表中选择的患者和当前临床用户的关联信息。加密的散列提供了一种登录临床试验数据采集系统(EDC)的安全机制,无需额外输入密码。
内科的患者在随访时往往要填写相同的问卷,每位患者可能要填写多达15次。我们开发了以“患者摘要原型”作为临床决策支持的“示例”。此(患者摘要的)概述页面可显示病症随时间推移的变化过程(从临床数据采集系统/EDC中获取)。随着时间的推移,这些(关于病情随时间推移产生的新)发现与选定的实验室参数相结合(可通过EHR系统的ETL获得),以发挥临床决策支持(CDS)的功能(见图5)。
图56.讨论
如今,临床试验数据采集系统(EDC)和电子健康记录系统(EHR)数据通常没有实现集成。然而,临床护理和大学医院研究中收集的数据密切相关。以海德堡大学医院的19个临床试验数据采集系统(EDC)项目为基础,我们对研究型数据库的功能请求进行了收集、整合和分析,在此基础之上,我们确定了下一代研究数据库的七个特征,并进行了“本地概念验证研究”,以评估这种方法在技术本身及临床上的可行性。为此,我们聘请了11个临床部门参与这项研究,此令我们的研究结果更有可能具有普遍性,也更有可能适用于其他临床环境。总的来说,我们证明了下一代研究数据库在当前的临床环境中是可行的。
我们通过将病史表格上传到医疗数据模型门户(MDM-Porta),展示了公平访问电子化病历报告表(eCRF)的可行性。医疗数据模型门户(MDM-Porta)和OpenEDC通过统一医学语言系统(UMLS)代码提供了数据元素的语义注释,从而满足此标准。尽管公众对临床研究中的公平原则提出了一些要求11 , 18,但目前大部分临床研究并不符合公平原则。在准备本手稿时,Clinicaltrials网站(全球最大临床试验注册库和资料库)列出了超过456,000项研究19,(从体量上来看)满足这一要求(实现临床研究公平原则)实际上是一项大规模挑战。在此前的和新的研究数据库中,“兼容且一致”的数据结构极大地提升了将新旧研究进行数据比较的可行性。(现实中)可用的、可共享的结构元数据(CRF)很少,并且,在Clinicaltrials上仅发布了(数据录入的)资格标准。对于某些研究,可能需要主题级数据,但由于缺乏对数据收集进行解释的相关结构元数据(CRF),数据的有用性受到限制。此类“不公平”研究的一个典型例外是NCBI20的基因型和表型数据库(dbGaP),该库为2,000多项研究提供了描述性和结构性元数据。根据需求,它还可提供患者层面的数据。最近,医疗数据模型(MDM)门户中提供了带有语义注释的dbGaP元数据,可用于585项研究(截至 2023年8月9日)。重复使用经过充分验证的结构元数据(CRF)可以提高研究数据的可比性。数据元素的语义注释有利于与先前研究的数据集成,因为它支持通过匹配语义代码在不同数据源之间映射数据元素。新研究数据的解释必须包括与先前研究结果的比较。为了促进不同研究之间的数据集成,需要映射相应的数据元素,这通过数据元素的语义注释来实现(例如,实验室数据的逻辑观察标识符名称和代码,LOINC 21)。
研究数据库必须符合监管标准,以便能够将前瞻性研究和介入性研究的数据提交给监管机构,例如欧洲药品管理局 (EMA)、美国食品和药物管理局 (FDA)、日本药品和医疗器械管理局 (PMDA)、中国国家药品监督管理局(NMPA)。因此,最好使用这些机构认可的数据格式,以最大限度地减少提交过程中数据准备的工作量。监管机构已就临床数据标准交换联盟(CDISC)发布的标准达成一致。虽然美国食品和药物管理局(FDA)22、日本药品和医疗器械管理局(PMDA)23和中国国家药品监督管理局(NMPA)24已认可临床决策支持系统CDISC标准,甚至要求提交数据,欧洲药品管理局(EMA)正准备采用这些标准25。对于临床试验数据采集系统(EDC),临床数据交换标准协会(CDISC)操作数据模型(ODM)与之特别适配,因为后者被设计为临床元数据和数据交换的标准格式15。临床数据交换标准协会(CDISC)操作数据模型(ODM)还支持审计跟踪,这是在合规前提下收集数据的另一个关键功能(数据点来源可追溯)。
目前,大多数临床试验数据采集系统(EDC)仍与电子健康记录系统(EHR)各自为战。用户一般需要对电子健康记录系统(EHR)图表进行手动审核以验证源数据。电子健康记录系统(EHR)和临床试验数据采集系统(EDC)彼此集成有以下几个好处:临床试验数据采集系统(EDC)数据可用于丰富电子健康记录系统(EHR)数据并避免冗余数据输入,例如,当患者调查问卷从临床试验数据采集系统(EDC)传输到电子健康记录系统(EHR)系统时(可能会产生的冗余数据)。我们的概念验证研究表明,即便是对于历史遗留(之前部署)的电子健康记录系统(EHR),这(避免冗余和丰富)也是能实现的(图4)。从电子健康记录系统(EHR)内部调用临床试验数据采集系统(EDC)数据,既可以简化又可以丰富那些,主要使用电子健康记录系统(EHR)的临床团队的医疗文档。我们已经证明,从临床试验数据采集系统(EDC)访问电子健康记录系统(EHR)数据是可行的,但根据我们的经验,实现这一点,对技术要求更高,因为其需要电子健康记录系统(EHR)和临床试验数据采集系统(EDC)的单点登录功能以及扩展配置功能,以对患者背景信息进行必要的维护。
此外,如果临床试验数据采集系统(EDC)数据也直接用于日常护理,其将发挥更大的效用。如果满足临床试验数据采集系统(EDC)的数据质量标准,则可以将数据(如实验室数据)从电子健康记录系统(EHR)传输到临床试验数据采集系统(EDC)。“观察性医疗结果合作组织”(OMOP)成功地在电子健康记录系统(EHR)内搭建了数据的回顾性分析(系统)26。对于新的诊断方法及治疗方法,我们需要进行前瞻性的临床研究。介入试验的监管,要求我们重视数据质量的验证程序。
临床试验数据采集系统(EDC)软件的开发是复杂的,因为它必须高度逼真地反映临床医学的复杂性。国际疾病和相关健康问题统计分类(ICD)-10 12中的10,000多个诊断主要是与记费需求相对应的。对于每个诊断的使用,临床试验数据采集系统(EDC)往往需要特定的数据元素。系统化医学命名法(SNOMED)等颗粒度更细的术语与临床研究的关联度更为具体(往往关联于临床研究的某个具体方面)。正如 Clinicaltrials网站(全球最大临床试验注册库和资料库)上显示的那样,在进行的数十万项临床研究中,每个研究可能都可能采用不同的数据结构来满足研究方案的某些具体要求。通常,每项研究都会捕获数百个特定疾病的数据元素,这往往会令临床试验数据采集系统(EDC)在设计、开发、维护和质量控制上面临相当大的压力。因此,研究数据库的有效实施是临床研究成功的关键因素。
在临床试验数据采集系统(EDC)开发中,当前大多使用手动的逐个字段的开发的方法。而重复使用先前研究中的电子化病历报告表(eCRF)以及(全/半)自动生成研究数据库(而不是手动编程)可以使临床试验数据采集系统(EDC)更具可扩展性。然而,各种各样的临床试验数据采集系统(EDC)和电子化病历报告表(eCRF)的元数据格式并不支持在不同的临床试验数据采集系统(EDC)之间进行eCRF共享。如果所有临床试验数据采集系统(EDC)都支持导入基于美国食品药品监督管理局(FDA)的数据标准(目前为 CDISC ODM)的元数据,以促进病历报告表(CRF)的重复使用,那对于研究人员来说将是非常理想的。在本研究中,我们使用了OpenEDC 14,因为它是一个开源的临床试验数据采集系统(EDC)系统,可以导入临床数据交换标准协会(CDISC)操作数据模型(ODM)格式的电子化病历报告表(eCRF)。此外,OpenEDC集成到医疗数据模型(MDM)门户中,只需在 医疗数据模型(MDM)门户单击一下(“开始数据捕获”),即可在本地计算机上创建 OpenEDC 数据库,从而实现对医疗数据的即时收集。
医疗保健专业人员在进行医护服务过程中提供的医疗文档是临床试验数据采集系统(EDC)数据的关键来源。虽然常规文档和研究文档之间存在大量语义重叠,但研究文档比电子健康记录系统(EHR)数据更加详细和结构化。因此,将临床试验数据采集系统(EDC)中的临床相关信息的摘要转移到电子健康记录系统(EHR)中应该是可行的。重复使用来自其他系统(例如实验室信息系统)的患者数据还可以避免容易出错的冗余数据的录入。在我们的概念验证研究中,我们展示了通过,对电子健康记录系统(EHR)集成和实验室数据进行“自定义提取、转换和加载(ETL)”,编写患者摘要,在技术上的可行性。从长远来看,涵盖整个“患者旅程”的综合电子病历也将为医学研究提供新的机会。
患者生成的数据(例如病史或患者报告结果 )对于日常临床医护和研究非常重要。我们的概念验证研究表明,使用标准化电子健康记录系统(EHR)接口,通过基于HL7的通信服务器(HL7-MDM 接口)进行PDF传输——在临床试验数据采集系统(EDC)和电子健康记录系统(EHR)系统中,在去冗余的前提下收集这些数据——在技术和临床上都是可行的。由于是患者端完成数据输入,因此在资源有限的环境下无需额外的临床人员即可进行数据收集。收集患者结果报告(PRO)时常见的非技术问题是该报告所使用的表格受“许可证限制”。为每位患者支付患者结果报告的许可费会产生大量财务和管理负担,无法大规模实施。应通过公共举措鼓励免费患者结果报告(PRO)工具的开发。
目前,临床试验数据采集系统(EDC)的数据采集与临床数据收集往往彼此分割,各自为战,因此其所收集的数据无法为临床决策支持做出实际贡献。临床决策支持系统(CDS)往往依赖于实时、高质量的临床数据,有了这些数据临床决策支持系统(CDS)才可以提高临床人员对临床指南的遵守程度,提高诊断的准确性27,减少患者安全风险以及保证治疗质量。因此,电子健康记录系统(EHR)集成临床试验数据采集系统(EDC)可以提供临床决策支持系统(CDS)所需的数据。本研究案例中包括“计算疾病评分”(或指“病情评分计算”)或可为患者28提出的诊断或治疗程序。然而,至少在欧盟,(相关法规规定CDS须)提供超过基本数据点(以外的数据/服务)使临床决策支持系统(CDS)成为了一种医疗器械,必须根据医疗器械法规(MDR)29开发并投放市场。由此产生的工作量往往令软件制造商和软件运营者望而却步。需要进一步的研究来确定基于临床试验数据采集系统(EDC)数据的临床决策支持系统(CDS)是否有必要提供额外的临床益处,以迎合医疗器械法规(MDR)。
许多文献讨论了基于FHIR(Fast Healthcare Interoperability Resources,是一种旨在促进医疗信息系统间数据交换和共享的标准)标准的医疗信息系统的互操作性,(这种互操作性应该)允许在回顾性研究中重复使用电子健康记录系统(EHR)数据。“观察健康数据科学和信息学”(OHDSI) 30社区非常成功地展示了开源系统进行大规模健康数据分析的强大能力。我们建议是:未来应重点关注系统合规方面的工作,以实现改变医疗实践的介入研究(唯有合规才能应用于实践)。
我们的研究有几个局限性:首先,我们的概念验证研究具有“原型”的特征,并且没有对在多中心试验场景中的可扩展性进行评估。我们的研究仅针对单个的电子健康记录系统(EHR),而在其他电子健康记录系统(EHR)中开发类似工作流程的可行性——尚待进一步调查研究。此外,我们的研究仅限于一所大学医院,将我们的方法扩展到其他机构的可行性也仍需进一步的测试。
总之,下一代研究数据库应该建立在可公平访问的、合规的、与电子健康记录系统(EHR)集成的和可扩展的临床试验数据采集系统(EDC)之上。应包括医疗文件和患者生成的数据。临床试验数据采集系统(EDC)应具有临床决策支持能力。我们在概念验证研究中证明,此类系统在技术和临床上都是可行的。
7.方法
我们从德国海德堡大学医院正在进行的研究项目中确定了对更高效和更有效的研究数据库的需求。2021年5月至2023 年7月间,我们收集并分析了代表11个临床学科的数据科学家和临床医生,向当地临床试验数据采集系统(EDC)开发团队提请的,对电子数据采集 (EDC) 系统的110个产品特性和功能需求。
7.1海德堡新一代研究数据库的技术设置
在定义了新一代研究数据库的要求之后,下一个逻辑问题是“在真正的大学医院环境中实施具有这些特征的新一代研究数据库是否可行?如果可行,目前存在哪些限制?”为了回答这些问题,我们在海德堡大学医院进行了概念验证研究。该医院的主要EHR系统是ISHMED。我们使用医疗数据模型门户(MDM-Porta)作为病例报告表(CRF) 的FAIR基础设施。我们选择OpenEDC 14作为案例研究的EDC系统,因为它是开源的(支持自定义扩展和接口)并且符合临床数据交换标准协会(CDISC)操作数据模型(ODM)标准。我们在医院的内联网中安装了OpenEDC作为“客户端-服务器”系统。我们在OpenEDC中捕获了患者数据(使用iPad)和医疗保健专业人员(使用台式电脑)的医疗文档。我们在电子健康记录系统(EHR)系统中创建了针对 OpenEDC(前端集成)的基于web的患者特定超链接。对于从临床试验数据采集系统(EDC)到电子健康记录系统(EHR)的数据传输,我们生成了PDF格式的文件,并将它们发送到带有基于 Health Level 7-版本2的通信服务器的电子健康记录系统(EHR)。海德堡大学医院的医疗数据集成中心(MeDIC) 实现了从电子健康记录系统(EHR)到临床试验数据采集系统(EDC)的数据交换,并为选定的临床数据元素提供了自定义提取、转换和加载(ETL)路径。我们开发了一个临床决策支持系统(CDS)原型作为Web服务。
7.2与EHR集成的数字病史概念验证研究
为了评估下一代研究数据库的技术和临床可行性,我们在海德堡大学医院进行了数字病史与电子健康记录系统(EHR)集成的概念验证研究。在为期11个月的试点阶段(2022年9月至2023年7月),我们从11个临床科室(外科、血液科、儿科、麻醉科、放射肿瘤科、眼科、妇科、皮肤科、胃肠科、心身医学科、精神科)的19个临床试验数据采集系统(EDC)中采集了2,217名患者的数据。在临床试验数据采集系统(EDC)与电子健康记录系统(EHR)集成的条件下推进工作流程,如图6所示。患者在为此任务提供的iPad上回答病史问题。收集的数据同时传输到电子健康记录系统(EHR)系统和研究数据库(CDISC ODM格式)中。
图68.数据可用性
这项研究并非基于电子病历记录。相反,需求获取的基础是来自海德堡大学医院本地GitLab系统,因为这些问题包含机密信息,无法在机构外部获取。
9.代码可用性
OpenEDC容器化版本的代码以及如何运行它的教程可在Github上获取。
10.参考文献
1. Chalmers, T. C. et al. A method for assessing the quality of a randomized control trial. Control. Clin. Trials 2, 31–49 (1981).
2. Eichler, H.-G. et al. Randomized controlled trials versus real world evidence:neither magic nor myth. Clin. Pharmacol. Ther. 109, 1212–1218 (2021).
3. Breckenridge, A. M., Breckenridge, R. A. & Peck, C. C. Report on the current status of the use of real-world data (RWD) and real-world evidence (RWE) in drug development and regulation. Br. J. Clin. Pharmacol. 85, 1874–1877 (2019).
4. Cornet, R. & Keizer, Nde Forty years of SNOMED: a literature review. BMC Med.Inform. Decis. Mak. 8, S2 (2008).
5. Assale, M., Dui, L. G., Cina, A., Seveso, A. & Cabitza, F. The revival of the notes field:leveraging the unstructured content in electronic health records. Front. Med. 6,66 (2019).
6. Li, I. et al. Neural Natural Language Processing for unstructured data in electronic health records: a review. Comput. Sci. Rev. 46, 100511 (2022).
7. Kim, E. et al. The Evolving Use of Electronic Health Records (EHR) for research.Semin. Radiat. Oncol. 29, 354–361 (2019).
8. Alzu’bi, A. A., Watzlaf, V. J. M. & Sheridan, P. Electronic Health Record (EHR) abstraction. Perspect. Health Inf. Manag. 18, 1g (2021).
9. Pronker, E., Geerts, B. F., Cohen, A. & Pieterse, H. Improving the quality of drug research or simply increasing its cost? An evidence-based study of the cost for data monitoring in clinical trials. Br. J. Clin. Pharmacol. 71, 467–470 (2011).
10. DiMasi, J. A., Grabowski, H. G. & Hansen, R. W. Innovation in the pharmaceutical industry: New estimates of R&D costs. J. Health Econ. 47, 20–33 (2016).
11. Wilkinson, M. D. et al. The FAIR Guiding Principles for scientific data management and stewardship. Sci. Data 3, 160018 (2016).
12. International Statistical Classification of Diseases and Related Health Problems.10th ed. (World Health Organization, Geneva, 2004).
13. Payne, T. H., Lehmann, C. U. & Zatzick, A. K. The voice of the patient and theelectronic health record. Appl. Clin. Inform. 14, 254–257 (2023).
14. Greulich, L., Hegselmann, S. & Dugas, M. An open-source, standard-compliant,and mobile electronic data capture system for medical research (OpenEDC):design and evaluation study. JMIR Med. Inform. 9, e29176 (2021).
15. Huser, V., Sastry, C., Breymaier, M., Idriss, A. & Cimino, J. J. Standardizing data exchange for clinical research protocols and case report forms: an assessment of the suitability of the Clinical Data Interchange Standards Consortium (CDISC) Operational Data Model (ODM). J. Biomed. Inf. 57, 88–99 (2015).
16. Dugas, M. et al. Portal of medical data models: information infrastructure for medical research and healthcare.
17. Bodenreider, O. The Unified Medical Language System (UMLS): integrating biomedical terminology. Nucleic Acids Res. 32, D267–D270 (2004).
18. Dugas, M. et al. Memorandum "Open Metadata". Open access to documentation forms and item catalogs in healthcare. Methods Inf. Med. 54, 376–378 (2015).
19. Zarin, D. A., Tse, T., Williams, R. J., Califf, R. M. & Ide, N. C. The ClinicalTrials.gov results database—update and key issues. N. Engl. J. Med. 364, 852–860 (2011).
20. Mailman, M. D. et al. The NCBI dbGaP database of genotypes and phenotypes.Nat. Genet. 39, 1181–1186 (2007).
21. McDonald, C. J. et al. LOINC, a universal standard for identifying laboratory observations: a 5-year update. Clin. Chem. 49, 624–633 (2003).
22. Nelson, B. FDA binding guidance: a pivotal milestone for CDISC standards.Appl.Clin. Trials 25, 42 (2016).
23. Ando, Y. Electronic submission and utilization of CDISC standardized clinical study data in Japan. J. Soc. Clin. Data Manag. 2;
24. CDISC. Global Regulatory Requirements.
25. European Medicines Agency (EMA). Information about the raw data proof-ofconcept pilot for industry. Access to raw data for marketing authorisation and post-authorisation (2022).
26. Overhage, J. M., Ryan, P. B., Reich, C. G., Hartzema, A. G. & Stang, P. E. Validation of a common data model for active safety surveillance research. J. Am. Med. Inform.Assoc. 19, 54–60 (2012).
27. Bundy, D. G. et al. The design and conduct of Project RedDE: a clusterrandomized trial to reduce diagnostic errors in pediatric primary care. Clin. trials (Lond., Engl.) 16, 154–164 (2019).
28. Hendrickson, C. D. et al. Is the climb worth the view? The savings/alert ratio for reducing vitamin D testing. Appl. Clin. Inform. 11, 160–165 (2020).
29. Regulation (EU) 2017/745 of the European Parliament and of the Council of 5 April 2017 on medical devices, amending Directive 2001/83/EC, Regulation (EC) No 178/2002 and Regulation (EC) No 1223/2009 and repealing Council Directives 90/385/EEC and 93/42/EEC. Medical Device Regulation (2017).
30. Hripcsak, G. et al. Observational Health Data Sciences and Informatics (OHDSI):opportunities for observational researchers. Stud. Health Technol. Inf. 216,574–578 (2015).
31. Garza, M. et al. eSource for standardized health information exchange in clinical research: a systematic review. In Improving usability, safety and patient outcomes with health information technology. from research to practice. Vol .257 edited by F. Lau 115–124 (IOS Press, Amsterdam, 2019).
32. Garza, M., Myneni, S., Fenton, S. H. & Zozus, M. N. Spring 2021. J. Soc. Clin. Data Manag. 1; https://doi.org/10.47912/jscdm.66 (2021).