主动脉瘤

首页 » 常识 » 预防 » BMJ丨急性主动脉夹层预后因素及预测模
TUhjnbcbe - 2021/8/21 21:04:00

YanRen,etal.Prognosticfactorsandpredictionmodelsforacuteaorticdissection:asystematicreview.BMJOpen

摘要

目的

我们的研究旨在通过系统性回顾已明确的预后因素或者开发或验证模型来预测急性A型主动脉夹层(AAD)患者的死亡率的方法学特征,这可以指导未来的工作。

设计/背景

系统性回顾已出版的研究。

方法

我们在Pubmed和EMBASE搜索了从最初到年6月的关于急性A型主动脉夹层患者死亡率的预后因素和预测模型文献。两位回顾者独立收集该方法学特征的信息。我们还整理了预测因素和预后模型表现的信息。

结果

共收集了32份研究,其中18份关于预测因子表现,14份开发或验证了预测模型。在32份研究里,23份(72%)是单中心研究;22份(69%)使用电子病历的数据;19份(59%)选择回顾性队列研究设计;26份(81%)没报告丢失预测数据;5份(16%)报告数据丢失,采用完全病例分析。在14份预测模式研究中,只有3份(21%)报告有区分和校正统计数据。在模型开发研究中,3份(27%)没有报告数据模型,3份(27%)仅使用统计显著性阈值选择预测因子,7份(64%)没有报告连续预测因子的处理方法。大多数预测模型都被认为存在很高的偏差风险。预后因素表现出不同区分度,(AUC0.58-0.95),预测模型的表现也有很大差异(AUC0.49-0.91),只有6份研究报告了校正统计数据。

结论

急性A型主动脉夹层病人死亡率预测研究方法——包括预测模型或预测因子研究——都是次优的,并且表现有着很大差异。有必要做出足够的努力来改善这一人群中这些方法的使用。

引言

急性主动脉夹层(AAD)是一种严重威胁生命的心血管疾病,具有发病急、进展快的特点。未经治疗的AAD在症状出现后每小时的死亡率约为1%-2%,住院总死亡率约为27%,病人选择主要取决于并发症和预后。更好地了解疾病的预后,理想的预测严重后果的风险,是非常可取的

几篇已发表的系统综述评估了炎性生物标记物(如C-反应蛋白)和心脏损伤标记物(即肌钙蛋白)与AAD患者死亡率增加的关系。一些研究还开发或验证了AAD死亡率的预测模型,其中包括生物标记物、人口学和临床特征的组合。因此,它们在临床实践中得到了越来越多的使用。

然而,在系统检查预测因子或预测模型的表现方面所做的努力有限。特别是,为了调查已发表的研究--无论是单独的预后因素研究还是预测模型--是否符合临床使用所需的方法学严格性,迫切需要一项全面的评估,因为次优的方法可能会降低风险估计的准确性和可靠性。尤其是AAD,这是一种疾病状况,因此对不利结果的可预测性至关重要。因此,我们进行了一项系统的回顾研究,以确定所有针对个体预后因素的研究之间的方法学差距,或者开发或验证AAD患者死亡率的预测模型。

方法

我们按照预先指定的、未公布的方案进行系统综述。

资格标准

我们在人口、指数预后因素、对照预后因素、结果、时机和环境(PICOTS)指导下制定了资格标准。如果研究包括被诊断为AAD的患者,则符合纳入条件;旨在确定或评估任何影响AAD患者死亡率的预后因素,或开发或验证AAD患者的死亡率预测模型。如果一项研究仅仅是AAD诊断的预测模型,或者该报告是一篇综述、评论、信件或社论、病例报告、方案或会议摘要,我们排除这项研究。

在AAD过程中的任何时间点测量的预测因子都是合格的。研究设置没有限制;去过任何医疗机构的AAD患者都有资格。我们将预测模型定义为多变量模型,通过选定的预测者来预测未来发生的特定结果的风险。

文献检索与筛选

应用计算机检索PubMed和EMBASE从成立到年6月的相关报道,检索英文版的相关报道。我们使用医学主题词条(MESH)和免费文本进行搜索,以确定有关AAD的报道,包括‘主动脉夹层动脉瘤’、‘主动脉夹层动脉瘤’、‘主动脉夹层*’和‘主动脉夹层血肿’。我们使用验证搜索策略来搜索预测模型,该策略被证明具有很高的灵敏度和特异性。完整的搜索策略作为在线补充附录A呈现。两个调查员(YR和SH)独立筛选所有搜索到的报告,并通过与第三个调查员(CL)的讨论来解决任何分歧。我们还从所有选定文章的参考列表中手动搜索其他文章

数据抽取

我们从每项符合条件的研究中收集了以下一般信息,包括第一作者、发表年份、研究目的、研究区域、主动脉夹层类型、年龄和性别比。我们仔细收集了已识别的预后因子或预测模型的表现信息,包括它们的名称和有关辨别、校准、灵敏度和特异性的结果。判别和校准是评价预测因子或预测模型预测表现的两个关键指标。

为了检查这些预测研究中使用的方法,一组受过方法培训、经验丰富的方法学家专门研究了预测研究和预测模型,他们召集起来,通过协商一致的过程制定了一份问卷。他们首先查阅了已发表的陈述和工具(如PROBAST,CharmsChecklist)中有关预后研究的条目,然后集思广益,寻找更多的条目。随后,他们讨论了确定的项目与方法的相关性,并删除了被认为不相关的项目。最后,他们通过小组讨论和协商,就这些项目达成了共识。

本问卷一般由五个领域组成:(1)研究设计(中心数、样本量、事件数、数据来源、流行病学设计),(2)参与者(参与者的定义和选择),(3)预测因素(预测因素的定义和测量),(4)结果(结果的定义和测量)和(5)分析(都是纳入分析的参与者,每个变量的事件数(EPV),选择和处理预测因素的统计方法,缺失数据,研究中使用的模型结构,以及为解决预测因素或预测模型而评估的相关模型表现度量)。调查问卷如网上补充附录B所示。

此外,我们使用了改编自PROBAST工具的偏差风险评估工具来评估预测建模研究的偏差风险。详细的工具和评估标准见在线补充附录C

统计分析

将分类变量表示为出现频率的个数和比例。对于定量变量,根据正态检验,数据按平均值和标准差(SD)或中位数(IQR)汇总。

结果

共鉴定出条记录,其中条进入全文筛选,32篇研究符合条件并进入最终分析(图1)。

纳入研究的一般特征

这32项符合条件的研究在年至年间发表(在线补充附录表1)。5项(15%)是跨国研究,21项(66%)是在美国、中国和欧洲进行的。AAD患者夹层类型以A型为主(n=21,66%),其次为A型和B型混合夹层(n=8,25%)。住院死亡率是最常用的结果(n=24,75%,表1)。

18项研究(56%)旨在评估预后因素的表现。最常见的预后因素是D-二聚体(DD,n=8)、中性粒细胞比率(NLR,n=4)和CRP(n=3)。14项研究(44%)的目的是开发或验证预测模型,其中9项研究在没有任何验证的情况下开发了新的预测模型,2项研究开发了新的预测模型并进行了内部验证,3项研究进行了外部验证(表1)。

模型表现

预测因子的表现表现为从差到强的区分度(AUC0.58到0.95)。单项预后因子AUC为0.58~0.92,联合预后因子AUC为0.77~0.95(DD与CRP:0.95;NT-proBNP与主动脉直径:0.83;Tenascin-C(TNC)与DD:0.95;TNC与CRP:0.91;cystatinC与高敏C反应蛋白:0.88;UA、DD与年龄:0.77,表2)。

从11项研究中开发或验证的模型显示出从差到强的辨别能力(AUC0.49到0.91),只有6个报告的校准,其中5个报告的校准良好(p0.05)。Rampoldi等人开发了一个预测模型,并报告了中度歧视(AUC0.76)。但通过外部验证,Rampoldi等人开发的评分系统显示出较差的区分性(30天死亡率:AUC0.56,手术死亡率:AUC0.62)。Mehta等人(Hosmer-Lemeshow(H-L)检验的p值=0.75)利用国际急性主动脉夹层(IRAD)多国数据开发了一个预测模型,并报告了良好的校正。通过外部验证,IRAD评分显示出中度辨别(AUC0.74),在IRAD评分中加入CRP显著改善了辨别能力(AUC0.89,表2)。

方法学特征

在32项研究中,大多数为单中心研究(n=23,72%)。样本量从35到(中位数,四分位数的间距-),变量的中位数是35(23-72)。13项研究(41%)采用前瞻性队列研究设计,其余19项(59%)采用回顾性队列研究设计,22项(69%)采用电子病历数据,5项(16%)来自队列研究,5项(16%)来自登记表(表3)。

31项(97%)研究清楚地描述了参与者的纳入和排除标准。在所有纳入的研究中,用于定义和测量研究人群中的预测因素的标准是一致的。结果定义和测量的标准在所有研究中都是一致的,除了一项研究(表3)。

22项研究(69%)包含了所有参与分析的参与者。在丢失数据的处理中,30项(94%)研究报告没有丢失结果数据,26项(81%)没有报告丢失的预测数据,5项(16%)报告有一些预测数据丢失,并使用完全病例分析来处理丢失的预测数据(表3)。

在18项预后因素研究中,EPV20者9例(50%),10~20者8例(44%),小于10者1例(6%);15例(83%)报告了差异、敏感性和特异性,其余3例(17%)仅报告差异或敏感性和特异性;11例(61%)选择Logistic回归模型进行分析,5例(28%)采用Cox回归分析,2例(11%)仅使用受试者操作特征(ROC)分析(表3)。

在14项预测模型研究中,仅有3项(21%)EPV20,8项(57%)EPV在10~20之间,3项(21%)EPV10,10项(71%)选择logistic回归模型进行分析,其余4项研究分别采用cox回归、支持向量机、神经网络和roc分析。绩效衡量的报告很糟糕:只有5人(36%)同时报告了歧视和校准统计数据。11项研究(64%)报告了鉴别,以受试者操作曲线的auc衡量,6项(43%)报告了校准,以h-l测试的p值衡量。对于建立预测模型,3个(27%)没有报告任何统计方法,3个(27%)只是使用统计学意义来选择预测因子;7个(64%)没有报告如何处理连续预测因子,4个(36%)报告的连续预测因子被转换为类别(表3)。

偏差风险评估

在大多数研究中,14个预测模型在参与者、预测者和结果领域的偏差风险较低,而在样本量、缺失数据和统计分析领域的偏差风险普遍较高(表4)。由于每个变量的结果数低(EPV10),或者缺乏关于处理缺失数据的方法的信息,研究在样本量和缺失数据领域的偏差风险很高且不清楚。统计分析领域的研究被评为高偏差风险且不清楚的主要原因如下:预测因子是在多变量建模之前基于单变量分析选择的,缺乏关于是否对连续预测因子进行非线性检验以及预测因子组如何分类定义的信息,并且不报告校准或歧视。

讨论

总结研究结果

在这项系统性综述中,我们确定了32项研究,涉及AAD患者的预后因素或死亡率预测模型。正如在这篇综述中注意到的,预后因素或预测模型的表现最常用的评估方法是AUC和H-L检验。对预后因素的大多数评估显示中度歧视。TNC和DD、DD和CRP联合使用的因子具有较强的区分性(AUC0.95)。预测模型显示出较差到较强的区分度(AUC为0.49~0.91)。预测模型欧洲心脏手术风险评估系统(EuroSCOREII)显示出较差的辨别能力(AuC0.49)和较差的校准(H-L检验的p值0.)。一种解释可能是,EuroSCOREII是一种风险模型,允许计算心脏手术后的死亡风险,与AAD患者的预后无关,因为并非所有主动脉夹层患者都接受了手术治疗,其中一些患者还接受了腔内治疗。Mehta等人的模型显示出比EuroSCOREII更好的识别率(0.74)。同时,Mehta等人使用来自多国数据的IRAD进行了良好的校正。通过外部验证,IRAD得分表现为中度辨别(AUC0.74),在IRAD得分中加入CRP显著提高辨别能力(AUC0.89)。因此,AAD死亡率的预测模型应该考虑包括生物标志物作为预测指标,以提高辨别力。

在系统回顾中,我们发现大多数研究的样本量和事件数量较少,来源于单中心研究,并且有较大比例的研究选择了回顾性数据。大多数研究没有描述丢失数据的信息,也没有说明处理丢失数据的适当统计方法。

在开发或验证预测模型时,我们发现大多数研究都被认为存在较高的偏差风险;大多数研究中EPV的数量相对较少,这导致模型的预测表现可能存在偏差。大多数研究没有同时评估判别和校正。几乎所有的研究都报告了预测模型的区分能力,而只有6项研究报告了校正。对于建立预测模型,我们发现一些基于统计显著性的变量选择研究可能会导致次优模型;大多数研究没有报道如何处理连续变量,线性假设可能是不合适的。

对未来研究的启示

虽然一些研究显示良好的辨别力和校正,但我们的研究结果突出了这些研究中重要方法学的局限性。那么结果就有可能是不准确、不可靠的。因此,今后对AAD的预后因素或死亡率预测模型的研究应从多中心环境中纳入大量患者群体,同时考虑队列设计、缺失数据的补充。在评估模型表现时,处理缺失数据的多重补偿技术非常重要。排除丢失数据的情况可能会导致结果有偏差。

AAD死亡率预测模型的研究应考虑变量的选择和连续变量的处理,以及判别和校正的评价方法。参赛者和项目的数量要有计划,EPV的数量至少要有10个。如果项目的数量相对于预测指标的数量较少,惩罚回归可能比标准回归更好。稳定性选择和二次抽样已证明在变量选择一致的基础上产生更稳定的模型,因此它们应在未来的预测模型研究中使用。不应单独报告歧视,因为校准不好的模型可以表现出与完全校准的模型相同的判别能力。强烈建议在评估业绩衡量时同时报告区分和校准。应该考虑对预测模型进行验证,因为模型开发和验证都是建立有用的预测模型的基本过程

一个最适合临床实践的预测模型应该包括相对较少的变量,易于解释,并具有良好的统计表现。除了成熟的IRAD模型外,我们的综述发现,IRAD评分和CRP联合模型使用的变量更少,并且比单独使用IRAD评分显示出更好的区分性。这些特点可以保证联合收割机的日常应用。此外,未来的研究可能会考虑更新IRAD模型,包括其他相关的生物标志物,这可能会进一步改善临床实践中的预后表现。

优势与局限

据我们所知,目前还没有关于AAD死亡率的预测因素或预测模型的方法学特点和表现的系统综述发表。这些现有的预后因子或预测模型是否可以用来指导或改善临床实践仍未得到充分的探索。我们应该寻找更好的预测因素还是预测模型?我们是否应该继续使用和验证这些预测因素或预测模型?评论员们在这个问题上达成了共识。我们应该寻找更好的预后因素或预测模型。在未来的研究中,有必要加强严格方法的使用,以确保表现的准确性和可靠性。

本研究的局限性在于,我们对方法学特征的回顾主要是基于报道。可能有这样的情况,研究人员考虑了方法学问题,但没有清楚地报告。这种情况也强调了完整报道的重要性。

结论

DD、NLR和CRP是最常用的生物标志物,各预后因素的判别能力较差或较强,预测模型差异较大,仅有6项研究报道了校正,其中5项校正良好。同时,许多预测因素或预测模型的方法学薄弱,需要考虑几个重要问题来加强对AAD死亡率的预测,如样本量、缺失数据的处理方法、适当的统计分析方法以及预测模型的校正和判别报告。有必要作出重大努力,改进这些方法的使用,以便更好地照顾这一群体。

译者:梁志超

编辑:*琰

CardiothoracicSurgery

1
查看完整版本: BMJ丨急性主动脉夹层预后因素及预测模