JAMA杂志:工具变量,开展高质量真实世界研究的方法 全球讯息

2023-03-20 23:57:32 来源:医学论文与统计分析
今天我们通过一个案例,来聊聊工具变量法在真实世界临床研究的应用。 在临床研究中,无论是拥有严格质量控制的RCT,还是带有大数据背景的真实世界研究,都离不开对其他协变量的控制。临床研究者一直在努力控制除研究因素以外的其他因素的影响,只有去除了其他因素的影响,才能够探索到研究因素的纯净效应。如下图,只有控制了混杂或协变量,我们才能很好地探索暴露与结局的关系。 假设我们的研究目标比较单一,只是想看暴露于结局的关系,那么剩下的所有需要控制的部分都可以叫做混杂因素。混杂可分为已知混杂和未知混杂,已知混杂就是研究者知道的且在本次研究中测量的混杂变量,未知混杂就是研究者不知道的,或者本次研究中未测量的混杂变量。常用的混杂控制方法有分层分析、个体/群体匹配、多因素回归分析、倾向性评分法、敏感性分析、边缘结构模型、多水平模型等。 如果是已知混杂,那么上述大部分方法都可以使用;那么如果是未知混杂,则上述大部分方法都不用,因为研究者也不知道哪些因素会是混杂因素,更没有对其进行测量。工具变量(Instrumental Variable, IV)法可以较好地解决未知混杂的效应。

2018年8月7日,《JAMA》(IF=157.335)发表题为:Association of Broad-Based Genomic Sequencing With Survival Among Patients With Advanced Non–Small Cell Lung Cancer in the Community Oncology Setting的研究论文。


【资料图】

这项研究利用FlatironHealth数据库的数据,比较了接受广泛基因组测序的晚期NSCLC患者与仅接受EGFR突变和/或ALK重排常规检测的对照组患者的临床结局。结果表明,在肿瘤专科诊所接受治疗的晚期非小细胞肺癌患者中,广泛的基因组测序直接为少数患者的治疗提供了信息,并且与更好的生存率无关。

这篇文章就利用了工具变量和倾向得分方法开展了一系列的评价!

摘要与主要结果

一、摘要重要性 广泛基因组测序正更频繁地用于晚期非小细胞肺癌(NSCLC)患者。然而,关于广泛的基因组测序与晚期NSCLC患者的治疗选择或生存之间的关联知之甚少。 目的 比较接受广泛基因组测序的晚期NSCLC患者与仅接受EGFR突变和/或ALK常规检测的对照组患者的临床结局。 方法 对2011年1月1日至2016年7月31日期间图表确认的晚期非小细胞肺癌患者的回顾性队列研究,这些患者使用Flatiron健康数据库在美国191个肿瘤学专科诊所中的1个接受了护理。患者被诊断为IIIB/IV期或不能切除的非鳞状非小细胞肺癌,并接受了至少1行抗肿瘤治疗。暴露为接受广泛基因组测序或常规检测(EGFR和/或ALKONLY)。广泛基因组测序包括在三线治疗前检查30多个基因的任何多基因小组测序试验。主要结果是从一线治疗开始的12个月死亡率和总生存率。次要结果包括遗传改变的频率和接受的治疗。 结果 在5688例晚期非小细胞肺癌患者中(中位年龄67岁[四分位数范围41-85],63.6%为白人,80%有吸烟史);875人(15.4%)接受了广泛基因组测序,4813人(84.6%)接受了常规检测。在接受广泛基因组测序的患者中,4.5%的患者接受了基于检测结果的靶向治疗,9.8%的患者接受了常规EGFR/ALKT靶向治疗,85.1%的患者未接受靶向治疗。进行广泛基因组测序的患者12个月的未调整死亡率为49.2%,常规检测的患者为35.9%。使用工具变量分析,广泛基因组测序与12个月死亡率之间没有显著关联(12个月时的预测死亡概率,广泛基因组测序为41.1%,常规测序为44.4%;差异为-3.6%[95%CI,-18.4%至11.1%];P=.63)。在倾向评分匹配生存分析中,结果一致(42.0%对45.1%;危险比0.92[95%CI,0.73至1.11];P=0.40)。 结论 在社区肿瘤学环境中接受治疗的晚期非小细胞肺癌患者中,广泛的基因组测序直接为少数患者的治疗提供了信息,并且与更好的生存率无关。 二、研究结果1. 基线特征在研究样本中,5688名晚期非小细胞肺癌患者接受了广泛基因组测序或常规检测;875人(15.4%)接受了广泛基因组测序(表1)。中位年龄为67岁(四分位数范围,41-85),大多数为白人(63.6%vs7.5%vs13.4%未知种族),有吸烟史(79.9%)。 2.生存49.2%的常规患者在12个月时死亡,而接受广泛基因组测序的患者为30.5%(P<.001)。但 使用工具变量分析后,广泛基因组测序和12个月死亡率之间没有统计学的联系(两组之间12个月死亡的预测概率差异:-3.6%[95%CI,-18.4%至11.1%];P=.63;表2)。 全样本中使用Kaplan-Meier生存分析,2个队列在未调整的生存曲线中存在统计学差异(HR,0.69 [95% CI,0.62-0.77]; LogRank P < .001)。基于倾向的匹配产生了519对匹配的配对,具有良好的匹配特征和平衡,患者特征的标准化差异为≤0.10。大多数样本(81.2%)都有完整的数据。两组的免疫治疗使用率均为21.2%。在倾向评分匹配的样本中,使用LogRank检验评估的广基基因组测序队列与常规测试队列的总生存期相比没有统计学差异(P = .50)和Cox比例风险模型(HR,0.92 [95% CI,0.73-1.11]; P = .40)。

设计与统计学方法

一、研究设计P:FlatironHealth数据库2011年1月1日至2016年7月31日期间确诊为晚期非小细胞肺癌的患者,或确诊为早期非小细胞肺癌并随后复发或进展的患者 E/C:接受广泛基因组测序或常规检测(EGFR和/或ALKONLY) O:主要结局是一线治疗开始的12个月死亡率和总生存期。次要结局包括遗传改变的频率和接受的治疗的比例。 S:回顾性队列研究 二、统计方法1.使用 χ2检验比较了广泛基因组测序组和常规测试组之间接受的队列特征和治疗类型的分布。 2.使用 工具变量分析来比较接 受广泛基因组测序与常规检测的患者之间的 19 个月死亡率。工具变量分析用于解释卫生服务研究中未测量的混杂因素。

本文的工具变量为肿瘤诊所接受广泛基因测序的比例

3.使用 线性概率模型确定广泛基因组测序率(分为四分位数)与接受广泛基因组测序测试之间的关联 4.使用 Cox比例风险模型确定广泛基因组测序的检测率与总生存率之间的关联

5.使用以广基基因组测序检验率为工具,以 12 个月死亡率为二分类因变量的双变量泊松回归来估计广基基因组测序对 12 个月死亡率的影响

6.作为敏感性分析, 倾向评分匹配用于解决由于显著不同的队列特征而导致的潜在混淆。

7.采用多变量logistic回归分析估计接受广泛基因组测序的概率(0~1),倾向评分

8.当某些患者特征存在显着的生存偏倚时,设置为精确的协变量匹配;对于缺少数据的变量,使用缺少指标的方法;使用卡尺为 0.1 个标准差的最近邻算法进行一对一匹配

9.通过 Kaplan-Meier方法估计每组的生存结局,并使用 对数秩检验(LogRank)进行比较

10.广泛的基因组测序与生存的关联使用混合效应 Cox 比例风险模型进行测试,其中实践地点作为随机效应。比例风险假设通过图形和统计方式进行了测试,并且使用对数 (-log [生存]) 曲线和Schoenfeld 残差得到了满意的结果

11.使用稳健的 方差估计器报告边际调整风险比和调整后的 95% CI,以说明数据的匹配性质

12.所有统计检验均为2侧,P值为<.05,具有统计学意义。SAS 9.4,Stata版本14(StataCorp LP)和R版本3.3.1用于进行所有分析。

啥是工具变量?

工具变量是指与研究暴露/处理因素相关,和其他混杂因素无关,并且和结局变量无直接关系的一类变量,它仅仅是通过与暴露/处理因素的关系,以及暴露/处理因素与结局变量的关系,来间接影响结局变量。

1、工具变量对于 暴露有因果效应

2、工具变量与混淆因素没有关联

3、从工具变量到 结局之间没有直接因果关系,如果有关系,也只能通过的A100 % mediated

应用工具变量分析方法,最大的挑战在于要找到一个有效合适的、能够同时满足以上条件的工具变量。目前文献中所报道的工具变量种类繁多,各式各样,Journal of Clinical Epidemiology期刊于2011年发表了一篇系统综述,总结了5类在观察性研究中常用的工具变量类型,以供大家进行参考。

1.基于不同地区医疗水平的差异

例如某个地区的医疗水平能够达到进行CT检查或心脏介入治疗的条件,那么该地区的患者则更倾向于接受相关治疗,同时地区因素与患者自身健康特征相关的因素并不相关,因此可以把地区作为一个工具变量。

2.基于医疗机构的临床实践方式,例如以医疗机构使用某种治疗术式或药物使用的比例等作为工具变量(本次推文介绍的JAMA的文章就是如此)。

3.基于医生层面,例如以医生的处方偏好等作为工具变量。

4.基于时间特性的工具变量,例如在评估流行性感冒疫苗疗效的研究中,以患者的痛风病史时间作为工具变量。

5.基于以上变量综合起来的多个工具变量。

不过总的来说,工具变量的寻找是仍然是一件比较讲究的事情。好的工具变量非常难以寻觅,寻找它的逻辑和数据挖掘过程充满艰辛、难以驾驭,甚至往往需要研究者的灵感。

本篇论文的工具变量

本篇JAMA论文用了两种方法评价了广泛基因测序对肺癌患者生存的影响。一种是工具变量法;另外一种是倾向得分匹配作为敏感性分析。 工具变量分析:z工具变量:诊所患者广泛接受基因检测的比例 A暴露:是否接受广泛基因检测比例 Y结局:肺癌生存

由于诊所患者广泛接受基因检测的比例带有随机性,所以他基本上除了和暴露因素有关,和其他因素无关,和结局也只能通过暴露因素发生作用,所以被认定为工具变量。

工具变量分析前后结果变化:

49.2%的常规患者在12个月时死亡,而接受广泛基因组测序的患者为30.5%(P<.001)。但 使用工具变量分析后,广泛基因组测序和12个月死亡率之间没有统计学的联系(两组之间12个月死亡的预测概率差异:-3.6%[95%CI,-18.4%至11.1%];P=.63;表2)。 倾向得分方法分析倾向得分方法是敏感性分析方法,采用倾向得分匹配后,其结果和工具变量分析结果相似。在倾向评分匹配的样本中,使用LogRank检验评估的广基基因组测序队列与常规测试队列的总生存期相比没有统计学差异(P = .50)和Cox比例风险模型(HR,0.92 [95% CI,0.73-1.11]; P = .40)。 最近几年在医学领域,利用工具变量较多的研究文章是孟德尔随机化方法,由于篇幅,此处就不先介绍了。后续有文献再和各位交流。

更多实战课程

2022年以来,我们召集了一批富有经验的高校专业队伍,着手举行短期统计课程培训班,包括R语言、meta分析、临床预测模型、真实世界临床研究、问卷与量表分析、医学统计与SPSS、临床试验数据分析、重复测量资料分析、结构方程模型、孟德尔随机化等10门课。如果您有需求,不妨点击查看:

标签:

滚动