
详情请点击下方:

本篇是潜变量系列文章第8篇

研究摘要
近年来,不断有采用轨迹建模技术研究涌现,多数为医疗领域内纵向数据的挖掘,对人群健康情况随时间的个体内和个体间变异性进行探究。本综述旨将阐述流行病学研究中的各种轨迹建模方法,并概述它们的应用和差异,同时提供如何报告轨迹建模结果的指导。
本文综述的潜类别建模方法包括增长混合模型(GMM)、组轨迹模型(GBTM)、潜类别分析(LCA)和潜转换分析(LTA),并与其他侧重单个数据的统计方法如聚类分析(CA)和序列分析(SA)进行对比。根据研究问题和数据类型不同,可以采用多种方法对纵向研究中的重复测量数据进行轨迹建模,然而目前对于各种潜类别建模方法(GMM、GBTM、LTA、LCA)存在多种不一致的术语,容易引起混淆。报告术语的一致性有助于提高研究人员选择技术时的效率,因此本文将一并对上述建模方法的术语进行统一。
关键词:建模技术,增长混合模型,组轨迹模型,潜类别分析,潜转换分析,聚类分析,序列分析
引言
对测量结果取均值是分析整体或某特定亚组的指标变化最常见的手段,但有一种情况相当普遍,就是存在一批未知的个体,拥有相似的临床症状、行为或医疗模式。真实世界中的整体是由许多个体组成的,因此使用估计的均值来描述整体,实际上是对真实临床环境中复杂的个体内和个体间变异性的过度简化。针对这一情况,轨迹模型应运而生,将个体按特定项目上的相似性区分,并分配到不同的轨迹中。
为什么要对轨迹进行建模?
例如可以根据症状严重程度的不同轨迹(随时间变化的疼痛强度得分)对患者进行重新分组。识别到潜在类别后,所在类别就可以作为一个因变量来识别健康轨迹的预测因子,或作为自变量来探索它们对未来健康结果的影响。如图1所示,与基于样本均值的测量相比,轨迹建模使研究人员能够更好地描述和理解随时间变化的健康结果在个体内和个体间的变异性和模式,它在探索健康状况的异质性、识别需要更好医疗保健的脆弱人群以及识别通往最佳健康结果的轨迹方面非常有用。这样的方法可以提供科学证据,优化针对特定亚群体需求的个性化医疗保健。

上述方法在流行病学领域的使用相对较新,迄今为止,关于轨迹建模的非技术性比较方法论论文发表不多,而且非统计学者在浏览相关文献时会遇到各种挑战。本综述的目的是提供各种轨迹建模技术的概览,并讨论它们的应用和差异,以帮助卫生研究人员选择最适合其研究问题的技术。更具体地说,本文回顾了四种潜在类别建模方法:一种参数法(增长混合模型[GMM]),和三种半参数法(组轨迹模型[GBTM]、潜类别分析[LCA]和潜转换分析[LTA])。
本文超越了之前发表的综述,通过将这些轨迹建模技术与其他以个体为中心的统计方法(如聚类分析[非参数法]和序列分析[非参数法])进行比较。这篇综述的受众是为那些不熟悉高级统计理论的读者,对于本文中回顾的每一种统计方法,我们都将介绍基本概念、处理的数据类型、进行分析所涉及的各个步骤、可用的统计软件包以及一个现实世界的例子,也会讨论如何更好地报告轨迹建模的结果,最是本综述中提出的关键点的总结。
轨迹建模方法
现有的用于检查轨迹模式方法和算法可以分为三种主要类型:非参数法、参数法和半参数法。非参数法不对数据的分布做任何假设,因此个体被分配到一个子类别是基于不相似程度。相比之下,参数法和半参数法假设数据来自有限的混合分布。因此,个体被分配到一个亚组是基于该亚组成员资格的条件概率。
潜类别建模方法
潜类别模型是包括无法直接观察到的随机变量的统计模型,基于个体被观察到的症状或行为,将他们分配到潜在轨迹亚组中。每个亚组由在观察到的行为上有相对类似观察的个体组成。潜类别模型可以应用于纵向或横断面数据,能够处理包括部分缺失数据、离散量表重复测量或时间变化协变量等多种复杂情况。在纵向数据的潜类别模型方法中,为了正确估计,至少需要三个测量时间点,而为了估计涉及立方或二次趋势的更复杂模型,四到五个测量时间点更为理想。纵向潜在类别建模方法不是评估单个时间点或相邻时间点之间的变化,而是识别在整个研究期间具有相似结果模式的受试者子群。
本文论述了四种潜类别模型。三种适用于纵向数据:增长混合模型(GMM)、组轨迹模型(GBTM)和潜转换分析(LTA),而潜类别分析(LCA)适用于横断面数据。时常见到论文作者使用不恰当的术语来指代他们所使用的方法,因此非统计学研究者在选择合适的方法进行自己的研究时会面临困难。为了解决这个问题,本文概述了不同的潜在类别方法,并提供了使用这些统计方法的研究的具体示例,见表1。下面将详细介绍每种方法。

增长混合模型Growth Mixture Modelling (GMM)
1、介绍
GMM是一种用于纵向数据的参数模型,它为每个潜在类别估计一个平均增长曲线,并允许同一类别内部个体之间存在变异。通过在模型中引入随机效应,可以捕捉类别内的异质性,从而估计增长参数(截距和斜率)的方差。因此,随机效应用于表示个体潜在增长参数与人口平均增长参数之间的差异。
在GMM中,协变量(无论其是否随时间变化)的贡献也可以被建模。实际上,某个体属于某一潜类别的概率可能会根据协变量而变化,且协变量可以影响模型系数。一旦确定了轨迹成员身份,它可以被用作因变量或自变量来探索健康轨迹的预测因子及其对未来健康结果的贡献。
GMM用于纵向数据,最初是为研究连续数据而开发的。但后来,它被改进以处理其他类型的数据,比如计数数据(无论是否存在零膨胀)和分类数据。
GMM可以通过迭代程序实施,其实施需要基于研究领域的知识以及统计推断来做出先验决策。
首先,研究领域与方法之间的联系被正式建立。其次,制定一个合适的分析计划。基于研究者对该领域的了解和对原始数据的描述性分析,假设潜在类别的预期数量和每个类别的曲线形态。例如,我们可以预期,接受手术的患者将遵循各种术后疼痛强度的轨迹(轻度、中度或重度疼痛,随后是疼痛的改善或持续)。
在这一步中,可以指定和估计一系列模型。研究人员可能会就增长参数(截距、斜率方差和协方差)以及协变量的添加做出决策。应尽可能采取实质性理论和先前的研究指导这些决策。例如,如果研究人员预期有三个潜在类别,他们可以开始拟合两个、三个和四个类别的模型,决定决定每个轨迹随时间变化的形状应该是线性的、二次的还是三次的,还应决定增长因子方差是否应该对每个类别具体化,类内增长因子协方差是否应该不为零,以及结果残差方差是否应该与类别无关。Frankfurt等(2016)强调正确规定模型以避免基于解释的陷阱的重要性。此外,正确的模型规范能够降低GMM结果解释的复杂性。
GMM可以通过最大似然法或贝叶斯方法估计。
本步骤的目的是确定测试的模型哪一个最能合理地代表观测到的数据。应通过LoMendell-Rubin调整似然比测试(LMR-LRT,p<0.05表示更好的拟合)来比较各个模型的拟合优度,该测试适用于嵌套模型(k+1与k类模型),和/或参数化自助法似然比测试(p<0.05表示更好的拟合),和/或贝叶斯信息准则(BIC)(较小的BIC表示更优的模型)。研究人员还应考虑模型的收敛性、模型提供的类别是否分明(熵接近1)、样本中每个轨迹的比例(建议超过5%)、平均后验概率(接近1)、简约性以及观察到的潜在类别在实践中的实用性。
GMM可以通过Mplus软件和R中的lcmm包来实现。据我们所知,商业统计软件如SPSS、SAS等目前还没有提供GMM软件包。
与所有其他潜在类别建模方法一样,GMM对于处理一些技术方面非常有用,例如处理缺失数据、允许残差相关以及将回归中的残差和混合效应模型中的随机效应视为潜在变量。与其他潜在类别建模方法不同的是,GMM为每个类别估计一个平均增长曲线,并通过估计每个类别的增长因子方差来捕捉围绕这些增长曲线的个体变异。此外,因为GMM估计的参数比其他潜在类别建模方法多得多,结果的解释可能会很复杂,这使得这种方法对许多健康研究人员来说难以接近。
以Pagé等(2019)的研究为例,他们采用GMM检查心脏手术患者术后抑郁和焦虑的轨迹。使用手术前、手术后7天以及3个月、6个月、12个月和24个月时测量的医院焦虑和抑郁量表(HADS)分数,拟合了一个包含围手术期协变量的三条轨迹模型。轨迹建模基于特定的选择标准,如最低的AIC和BIC、最小轨迹亚组中超过5%的患者以及理论上的合理性。然后将轨迹类别用作广义估计方程(GEE)中的分类变量,旨在检查与此类轨迹相关的人口统计学和临床特征。该研究发现了一组患者焦虑持续不缓解的患者,可能预测了持续的、甚至延续到术后2年的疼痛。
原文PDF获取方式:“医学论文与统计分析”公主号回复关键词“原文”
组轨迹模型Group-Based Trajectory Modelling (GBTM)
2、适用数据类型
3、操作步骤
第一步:问题定义和轨迹亚组数量的规定
第二步:模型规范
第三步:模型估计
第四步:模型选择与解释
4、可用软件包
5、优势与局限性
6、GBTM的实际应用
(1)各种统计指标(较低的BIC和AIC,显著的LMR-LRT以及轨迹样本量超过总样本的5%),
(2)潜类别分类的理论意义和概念可解释性。
然后将轨迹亚组作为多项逻辑回归模型中的分类变量,以识别轨迹亚组的预测因子。研究显示,较差的抑郁情绪、症状负担和平静感与健康状况较差的轨迹亚组相关。大多数时间里患者的健康状态变化是平稳的,也就是说在这一期间内,大多数患者的健康状况没有经历剧烈的波动。
原文PDF获取方式:“医学论文与统计分析”公主号回复关键词“原文”
潜转换分析Latent Transition Analysis (LTA)
1、介绍
LTA能够分析多个分类变量随时间的变化(例如,是/否,轻度/中度/重度),以及随时间变化的2x2表或任何列联表的变化。LTA是一种用于纵向数据的半参数有限混合模型,通过一组分类变量的观察数据来定义每个时间点的潜在变量。该模型假设个体随时间可以改变其所在的潜类别。例如,在三个疼痛强度亚组(轻度/中度/重度)中,LTA允许个体从一个时间点的重度亚组转换到下一个时间点的轻度或中度亚组,因此这种方法的主要目标是研究个体从一个时间点的一个类别转移到下一个时间点另一个类别的转换概率。在这个模型中,变化在两个连续时间点之间的转换概率矩阵中被量化。模型估计以下参数:
(1)第一时间点在某潜类别中的概率;
(3)随时间从一个潜类别转移到另一个潜类别的条件概率(例如,给定时间t-1的潜在状态L1,时间t的潜在状态L2的概率);
2、适用数据类型
3、操作步骤
第一步:问题定义和轨迹子群体数量的规定
第二步:模型规定
第三步:模型估计
第四步:模型选择和解释
4、可用软件包
5、优势与局限性
6、LTA的实际应用
Pat-Horenczyk等(2016)使用LTA法评估乳腺癌患者治疗后适应情况的稳定性和转变。通过在治疗后0个月、6个月、12个月和24个月测量的一系列指标,包括困扰和应对策略,基于多个拟合优度指标和类别的可解释性,发现了四种治疗后适应情况:困扰、抵抗、建设性成长和挣扎成长。研究结论是,适应情况之间的大多数转变发生在治疗后6到12个月之间。他们的工作被视为对成长、困扰和应对之间关系理论理解的贡献。
潜类别分析Latent Class Analysis (LCA)
LCA假设存在未观察到的潜在分类变量,这些变量将人群划分为互斥且完整的潜在类别。每个潜在类别代表一组个体,这些个体通过对一组变量的响应类型来进行特征描述。LCA是用于分类横断面数据的半参数模型(即,非纵向版本的LTA)。实际上,在LTA中,每个时间点都使用LCA来确定类别。因此像在LTA中一样,LCA中的参数通过最大化似然或贝叶斯方法来估计。每个类别中还可以模拟协变量的贡献。因此,属于某一类别的概率取决于协变量的值或水平。
2、适用数据类型
3、操作步骤
4、可用软件包
5、优势与局限性
6、LCA的实际应用
Huh等(2011)采用LCA法,以饮食、体育活动和体重感知等方面,识别儿童的不同亚型。使用一组代表肥胖风险维度的横截面指标,得到了一个包括人口统计变量的5类模型。通过较低的BIC和AIC、显著的LMR-LRT以及每个类别的内容和独特性确定了类别数量,然后评估潜在类别成员资格与体重、体重感知和社会人口统计特征等多种变量之间的关联。研究显示,儿童的体重、种族、性别和社会经济地位与潜在类别成员资格相关。最后,作者建议,儿童肥胖相关因素的这些亚型对肥胖干预计划的设计和实施是相关的。
关于潜类别建模方法的进一步说明
a.使用以往的研究和理论来指导建模的类别数量时,可能会遇到困难(缺乏先前的研究)或者在研究的人群中可能不适用。在这种情况下,研究人员应当从建模一个类别开始,然后是两个类别、三个类别等(包括建模他们认为正确的轨迹数量)。然后可以比较模型的拟合优度。 b.潜在类别模型因其灵活性和能够处理随机缺失数据(MAR)而受到重视。当数据非随机缺失(NMAR)时,一些作者提出了对增长模型(如GMM、GBTM和LTA)的扩展,以考虑这类缺失数据。 c.除了前面提到的拟合优度指标外,熵也可以用来评估模型在使用潜在类别建模方法时提供良好分离子群的能力。实际上,如果分析的目的是对研究参与者进行分类(这通常是潜在类别建模的情况),那么就有必要报告这种分类的性能。熵总结了潜在类别的可区分程度以及个体被分配到类别的精确性。它是个体估计后验概率的函数,范围从0到1,数值越高表示类别分离得越好。然而,对于解释没有固定的截止标准。此外,当向潜在类别模型添加协变量时,熵可能会被高估,这会增加对分类的信心。 d.值得注意的是,对于GMM、GBTM、LCA和LTA,底层的轨迹是未被观察到的,也永远无法去观察。因此,在报告和解释结果时,不应该将其描述为已知的轨迹。此外,衍生的轨迹只应在其研究的人群背景下进行解释,它们可能在不同的人群中不适用。 e.一旦确定了轨迹(类别/亚组),就有不同的方法将这些轨迹与先前因素或后续结果关联起来。需要注意的是,评估此类关联的方法可能会产生非常不同的结果。 f.潜类别建模方法对于回答许多类型的研究问题都是有用的。然而研究人员应该意识到,最佳模型可能是单一类别模型,建模的拟合优度可能较差或者无法解释。在这些情况下,研究人员可以使用常见的建模方法,如回归模型,或者使用非参数建模方法,如下一节所述。 原文PDF获取方式:“医学论文与统计分析”公主号回复关键词“原文”
其他建模方法
聚类分析
1、介绍
(1) 划分法:构建多个集群,然后根据特定的标准对这些分区进行评估来对数据进行分类(如k-均值,k-中心点算法)。必须事先确定集群的数量(k);
(3)密度法:依据数据点的密集程度和相互连接性来确定群集;
经典的距离度量包括欧几里得距离、曼哈顿距离和基于相关性的距离(皮尔逊相关距离、Eisen余弦相关距离、Spearman相关距离和Kendall相关距离)。
2、适用数据类型
3、操作步骤
第一步:数据探索
第二步:方法和距离度量的选择
(1)连续数据:使用Minkowski距离;
(3)多余两类的分类数据:根据变量总数和匹配数使用简单匹配系数,或为每种模态创建一个二进制变量并采用二元数据的方法;
第三步:方法实施和结果解释
4、可用软件包
5、优势与局限性
6、聚类分析的实际应用
为了研究导致自发性早产的共同机制和潜在的遗传因素,Esplin等(2015)使用层次聚类分析来识别同质的表型特征配置。利用横截面临床和人口统计变量、每种表型的二元指标、每个表型类别的加权得分和不相似矩阵,找到了一个5聚类模型,可能识别出具有相似遗传风险的自发性早产妇女的子集,然后选择其中一个表型聚类进行了基因关联研究。
序列分析
1、介绍
2、适用数据类型
3、操作步骤
在进行分析之前,必须从原始数据中创建状态序列数据。例如,确保为每个状态选择合适的字母(例如,H代表住院,E代表急诊访问等)。状态序列必须放置在时间轴上,时间周期(每日、每周、每月、每年等)必须明确定义。对于每个时间周期,研究者必须选择一个单一状态。
第二步:距离度量选择
第三步:序列分析及结果解释
4、可用软件包
5、优势与局限性
6、序列分析的实际应用
Vanasse等(2020)使用序列分析来识别慢性阻塞性肺疾病(COPD)首次住院后患者之间的类似护理轨迹。护理轨迹由在一年时间内的医疗利用序列组成,以“周”为时间单位。利用魁北克医疗行政数据中关于医疗就诊和住院情况的信息,基于多种工具和特定选择标准(最佳匹配、汇总距离矩阵、Ward's连接标准和平方和或惯性),发现了五个亚组,形成了新的护理轨迹类型学。随后,患者的特征在护理轨迹亚组之间进行了比较。研究表明,在第三高利用护理轨迹亚组中的患者年龄较大,合并症较多,并且在住院期间病情更为严重。
原文PDF获取方式:“医学论文与统计分析”公主号回复关键词“原文”
如何报告轨迹模型的方法
在科学论文中报告统计方法时,研究者应确保分析描述得足够详细,以便其他研究者能够复现。因此应包含:
(1)数据呈现(确定因变量和可能的协变量,并提及所有数据处理,例如创建新变量,重新编码某些变量以便于分析等);
(2)轨迹建模技术及其使用的理由;
(3)选择轨迹数量的逻辑和标准的规格说明(例如,使用BIC和/或AIC,或用于在聚类分析和序列分析中选择子组的距离度量);
(4)统计软件(例如,指定在SAS中使用的程序,或R上的包等)。之前已发布了关于潜在轨迹研究报告的详细指南(GRoLTS),如GMM和GBTM。
根据我们的审查,轨迹建模技术的完整描述通常不够充分,并且由于某些医学期刊的空间限制,缺乏必要的细节。这影响了研究社区理解、评估适当性以及复制轨迹建模分析的能力。如果稿件长度有限,研究者应考虑增加网络附录以完整描述其建模步骤。这将增强轨迹建模技术的透明度、适当性和可复制性。
如何报告轨迹模型的结果
(1)获得的轨迹/类别数量;
(3)用于选择轨迹数量的标准值(例如,BIC和/或AIC);
(5)一个显示轨迹亚组的图形(例如,使用SAS proc traj进行GBTM时,连续曲线代表观察到的数据,不连续曲线代表所选模型的估计)。
还应解释分配给每个轨迹的标签或名称。
总结
轨迹建模方法已被用于使用不同统计方法预测各种结果。在医疗研究中,它们有助于改善我们对疾病严重程度、干扰、管理和随时间演变的理解。然而,一些问题限制了人们对它们的理解、实用性和解释。事实上,在已发表的科学文献中,用于指代潜在类模型方法的各种术语(如GMM、GBTM、LTA、LCA)使用不一致,经常互换使用。对于描述和报告潜在类模型统计技术结果的空间在科学文章中也是不足的。我们希望这篇叙述性评论将指导研究人员选择最适合其研究问题的技术。我们展示了不同方法如何实施以及结果如何报告,这对非统计学研究人员是有价值的。
原文PDF获取方式:“医学论文与统计分析”公主号回复关键词“原文”

详情请点击下方: