郑老师的因果推断教程02|混杂偏倚,观察性研究必须跨越的障碍
源自风暴统计网一键统计分析与绘图的网站上一篇我们讲到观察性研究由于分组不均衡暴露组和对照组在基线天然存在差异。这些差异可能扭曲暴露与结局之间的真实因果关系这就是我们常说的混杂偏倚。今天我们就来深入解剖这个“混淆者”——什么是混杂偏倚如何判断一个变量是不是混杂因素分组不均衡意味着什么以及最重要的我们该如何控制混杂医学研究中的误差来源在正式讨论混杂偏倚之前我们先要理解医学研究中的误差从哪里来。医学研究中的误差可以分为两类1.随机误差是由于抽样误差所引起的其大小可用统计学方法进行估计。样本量越大随机误差越小。2.系统误差即偏倚是指研究结果系统地偏离了真实情况。偏倚又分为三种类型选择偏倚选择样本无法代表总体信息偏倚获得的资料不正确混杂偏倚由其他干扰因素造成数据分组呈现出不均衡状态。我们今天要重点讨论的就是第三种——混杂偏倚。什么是混杂偏倚让我们从一个简单的案例开始。假设你想研究一种新药对肿瘤患者生存率的影响。患者可以自主选择用药于是你根据用药情况将他们分为新药组和传统药组。数据收集完成后你发现选择新药的群体中70%是60岁以下中青年患者选择传统药物的群体中只有40%是60岁以下中青年患者。再看生存率新药组3年生存率30%传统药组3年生存率10%。你正准备下结论说新药效果更好但一个问题出现了你观察到的生存率差异到底是药物带来的还是年龄带来的还是两者共同作用的结果这就是混杂偏倚——暴露因素与疾病结局之间的相关程度受到了其他因素的混淆。在这个例子中年龄就是混杂因素它扭曲了药物与生存率之间的真实关系。观察性研究中常见的错误做法观察性研究的一个常见错误是只做简单的差异性比较就下因果结论。比如一项回顾性队列研究比较常规治疗组与中药治疗组的有效率两组患者的有效率采用卡方检验差异有统计学意义P0.01该论文就认为中医药治疗效果较好。这种做法忽略了混杂因素的存在。实际上观察性研究中的统计结果可能存在混杂偏倚包括现况调查的不同组别某项指标比较现况调查研究的两变量相关分析病例对照研究的OR值卡方检验——病例对照分组不均衡队列研究的RR值卡方检验——暴露和不暴露分组不均衡生存时间的logRank差异性分析这些情况下如果只做简单的差异性分析而不控制混杂因素结论很可能是错误的。如何判断一个变量是不是混杂因素一个变量要成为混杂因素需要同时满足三个条件。这三个条件缺一不可。第一个条件这个变量与研究因素存在相关或因果关系。怎么判断我们可以用单因素分析方法来检验比如t检验、卡方检验、方差分析、秩和检验。如果P0.05说明这个变量与研究因素存在关联。第二个条件这个变量与结局存在因果关系。同样我们可以用单因素分析方法来检验比如线性回归、logistic回归、Cox回归。如果P0.05说明这个变量与结局存在关联。第三个条件这个变量不在研究因素与结局的因果关系链上。也就是说它不是中介变量。这一点主要依靠专业判断而不是统计检验。举个例子分析接种疫苗对住院率的影响我们想判断年龄是不是混杂因素。按照是否接种人群被被分为两组。第一步检验条件1。我们用卡方检验比较不同接种状态的人群年龄分布发现P0.05。接种人群中老年人比例更高不接种人群中中年人比例更高。这说明年龄与接种状态相关。第二步检验条件2。我们用单因素logistic回归检验年龄对住院率的影响发现P0.05。老年人住院率更高。这说明年龄与住院率相关。第三步专业判断条件3。年龄是不是疫苗影响住院率的中介变量显然不是。疫苗不会通过改变年龄来影响住院率。三个条件都成立结论很明确年龄是混杂因素。分组均衡性与潜在混杂因素在RCT研究中研究对象被随机分为试验组和对照组。随机化保证了试验组和对照组的人群基线特征相似我们称之为分组均衡可比。正因为两组在已知和未知的混杂因素上都可比所以我们可以直接将结局差异归因于干预措施。但在观察性研究中情况完全不同。研究对象根据暴露情况或结局情况自然分组不随机化人群特征往往不相似这就是分组不均衡。观察性研究中常见的分组不均衡包括病例对照研究病例组和对照组除了暴露因素之外其他因素分组不均衡。比如研究食道癌和饮酒的关系食道癌患者和健康者年龄分布是不均衡、不可比的。队列研究暴露组和对照组其他因素分组不均衡。比如研究疫苗和住院的关系接种组和不接种组者年龄分布是不均衡、不可比的。分组不均衡意味着什么它意味着组间的均数、率、构成比存在统计学差异。而差异即相关——变量与变量之间存在相关。相关也就意味着混杂变量的第1条件或者第2条件成立。需要注意的是造成分组不均衡的因素不一定是真正的混杂因素但它可以被认为是潜在混杂因素。例如我们前面提到的案例。那么如何鉴定潜在混杂因素方法一检验是否与研究因素存在相关或因果关系采用单因素关联性方法t检验、卡方检验、方差分析、秩和检验同时结合专业判断确认是否不在因果链上。方法二检验是否与结局存在因果关系采用单因素关联性方法线性回归、logistic回归、Cox回归同时结合专业判断确认是否不在因果链上。统计学常见的分析思路通常不会严格鉴定是否混杂而是挑选出潜在混杂因素或从专业知识上直接判断。随机对照研究通过干预组与对照组基线数据分组均衡性比较可证明无混杂偏倚观察性研究通过简单关联性分析发现潜在混杂因素。控制混杂的两道防线面对混杂偏倚我们并不是束手无策。控制混杂因素有两种策略设计阶段的“事先控制”和分析阶段的“事后控制”。1.事先控制在设计阶段就把问题挡在门外第一种是随机分组。这是RCT的核心也是最强大的武器——它能够同时控制已知和未知的混杂因素。正因为如此RCT才被称为因果推断的“黄金标准”。第二种是限制。简单来说就是把研究对象的范围收窄从而消除某些混杂因素的变化。比如如果你想控制年龄的混杂可以只研究某个年龄段的人。这样做的好处是简单直接但缺点是研究结果的推广范围会受限。第三种是配对。在对照组中寻找与暴露组在某些关键特征上相似的人就像找“双胞胎”一样。通过这种方式让两组在重要的混杂变量上保持平衡。2.事后控制在分析阶段进行补救如果设计阶段没能做好控制或者数据已经收集完了我们还有补救的机会——在分析阶段通过统计方法进行控制。对于已测混杂也就是我们已经测量到的混杂变量可以用三种方法一是回归分析通过统计模型同时调整多个混杂因素这是目前最常用的方法。二是分层分析将数据按混杂因素分成不同的层在每一层内分别分析暴露与结局的关系。三是倾向得分方法它的核心思想是降维——把多个混杂变量压缩成一个倾向得分然后通过匹配或加权来构造两组可比的人群。这个方法在国内2015年后开始广泛应用。对于未测混杂也就是我们没测量到、甚至还没意识到的混杂因素处理起来更棘手但也有一些方法可以应对比如工具变量法、阴性对照法、敏感性分析。案例分析吸烟悖论让我们通过一个经典案例来理解混杂控制的实际应用--流行病学史上著名的“吸烟悖论”。吸烟是心血管疾病的危险因素但在1968年Weinblatt等人报告了一个奇怪的现象在急性心肌梗死患者中吸烟者的住院期间死亡率反而低于不吸烟者。这个现象被称为“吸烟悖论”。难道吸烟对心梗患者有保护作用一些研究认为这可能由混杂因素导致与不吸烟者相比吸烟者年龄更低合并病更少。2020年4月一篇发表在心血管领域顶级期刊JACC的论文系统分析了这个问题。该研究是基于临床试验对象进行的二次分析属于队列研究。研究对象为接受PCI治疗的STEMI患者临床随访时间至少6个月以上。研究因素暴露因素为近期吸烟状态当前吸烟或确诊前3个月内吸烟为吸烟组当前不吸烟或确诊前3个月已戒烟为不吸烟组。随访终点包括1年内全因死亡、心力衰竭住院、复发性心肌梗死。第一步均衡性比较研究者首先比较了两组在各项基线指标上的分布。结果显示年龄、性别、糖尿病、高血压、高脂血症、陈旧性心肌梗死、肌酐、白细胞计数在吸烟组和不吸烟组人群中分布不均衡——这些是潜在混杂因素。而IS心肌梗死面积、MVO微血管阻塞、LVEF左室射血分数无论单因素还是多因素线性回归P值均大于0.05因此上述三者不是混杂因素。第二步单因素分析未控制混杂研究者采用单因素Cox回归分析吸烟与结局的关系未控制任何混杂因素。结果显示与不吸烟者相比吸烟者的全因死亡风险1.0% vs 2.9%P0.001和死亡或心力衰竭住院风险3.3% vs 5.1%P0.009更低而在心力衰竭住院风险2.5% vs 2.7%P0.64和复发性心肌梗风险2.0% vs 2.3%P0.17上相似。这个结果印证了“吸烟悖论”——如果不控制混杂你会认为吸烟对心梗患者有保护作用。第三步多因素分析控制混杂研究者构建了3个多因素Cox回归模型逐步控制混杂因素模型②纳入吸烟和年龄控制年龄产生的混杂偏倚模型③纳入吸烟、年龄、性别、糖尿病、左冠状动脉前降支阻塞、首次设备检出症状的时间模型④在模型③基础上增加IS协变量随着控制变量的增加吸烟的效应估计值逐渐发生了变化。这个案例告诉我们如果不控制混杂因素我们可能会得出完全相反的结论。这里需要解释一个关键概念什么是Adjusted在统计分析中Unadjusted指未调整、未控制混杂因素Adjusted指调整后、控制混杂因素。一旦采用多因素回归就意味着控制了一定的混杂因素的影响。为什么多因素回归能剔除混杂已知单因素线性回归公式Y α βX₁ ε多因素线性回归公式Y α β₁X₁ β₂X₂ … βₙXₙ ε在单因素回归中吸烟的效应估计值β包含了年龄等其他因素的干扰。而在多因素回归中年龄造成的偏倚被纳入β₂、β₃等系数中吸烟的效应被独立出来成为β₁。因此β₁更准确地反映了吸烟对结局的真实影响。本章总结今天我们讨论了混杂偏倚的核心内容什么是混杂偏倚暴露与结局之间的关联受到其他因素的干扰。观察性研究由于分组不均衡天然存在这一风险。如何判断混杂因素需同时满足三个条件与研究因素相关、与结局相关、且不是中介变量。前两个通过统计检验判断第三个依赖专业知识。如何控制混杂设计阶段可采用随机分组、限制、配对分析阶段已测混杂可通过回归分析、分层分析、倾向得分方法控制未测混杂则可借助工具变量法、阴性对照法、敏感性分析。吸烟悖论的启示若不控制混杂因素可能得出完全相反的结论。下一篇我们将进入第三部分因果推断理论与常见方法。敬请期待关于郑老师团队及公众号郑老师团队统计服务为医学生、医护工作者学术研究提供统计支持1.医院数据真实世界研究影响因素分析与焦点因素分析策略倾向性评分方法匹配、逆概率加权IPTW、重叠加权及后续效应值估计亚组分析交互作用P值及森林图中介交互分析、因果中介分析限制性立方样条、阈值效应分析、区段回归分析2.临床预测模型二分类及生存基于回归方法的预测模型构建与验证绘制列线图机器学习预测模型构建与验证可解释性SHAP绘图缺失数据下的预测模型预测模型在线网站建设动态预测模型影像组学预测模型3.纵向数据分析重复测量ANOVA、混合线性模型LMM、广义估计方程GEE、广义线性混合效应模型GLMM、潜增长曲线模型LGCM群组轨迹模型(GBTM)/潜类别增长模型(LCGA)、潜类别混合增长模型(GMM/LGMM)、多轨迹模型GBMTM聚类分析时依协变量模型多状态模型4.高级因果推断方法实践参数G方法、双重稳健估计进行因果推断目标最大似然估计TMLE机器学习、超级机器学习进行因果推断治疗效果异质性分析HTE与因果森林5.公共数据库数据挖掘NHANES数据挖掘、CHARLS等老年库数据挖掘、MIMIC数据挖掘多变量孟德尔随机化MR、中介MR、肠道菌群MR、药靶MR、网络药理学结合MR、单细胞RNA测序分析结合MR需以上统计服务请联系郑老师团队微信sas555777