《Heart Rhythm》:Development and Validation of a Novel Machine Learning-Based Algorithm to Predict Incident Atrial Fibrillation – A Multicohort Analysis
编辑推荐:
房颤风险预测模型研究显示,基于机器学习的种族无偏见模型在区分度和校准方面优于传统CHARGE-AF评分,并减少临床偏见。研究纳入多队列数据,验证模型在预测房颤发生和减少种族差异方面有效性,为临床提供公平风险工具。
马修·W·塞加尔(Matthew W. Segar)|尼尔·凯什瓦尼(Neil Keshvani)|拜伦·雅格尔(Byron Jaeger)|安娜·罗森布拉特(Anna Rosenblatt)|梅赫迪·拉扎维(Mehdi Razavi)|穆罕默德·赛义德(Mohammad Saeed)|卡洛斯·J·罗德里格斯(Carlos J. Rodriguez)|萨迪亚·S·汗(Sadiya S. Khan)|大卫·高(David Kao)|安巴里什·潘迪(Ambarish Pandey)
美国德克萨斯州休斯顿市德克萨斯心脏研究所(Texas Heart Institute)心脏病学系
摘要
背景
现有的心房颤动(AF)风险预测模型将种族作为协变量,系统性地低估了黑人患者的AF风险,可能加剧了医疗保健方面的差异。
目的
开发并验证基于机器学习(ML)的、不考虑种族差异的风险评分,以预测AF风险,并评估其与CHARGE-AF评分在风险分层和偏见方面的差异。
方法
研究队列包括16,719名基线时无AF的参与者(ARIC研究,2011-2013年;CHS研究,1989-1990年);验证队列包括13,928名参与者(来自MESA、Framingham Offspring和Generation 3研究)。主要结果是5年内的AF发病率。模型性能通过C指数、Brier分数和预测准确性指数进行评估。偏见通过差异影响(differential impact)、平等机会差异(equal opportunity difference)和Theil指数进行评估。计算了各种族群体的归因风险百分比。
结果
在5年的随访期间,研究队列中有507名(3.0%)参与者发生AF,验证队列中有262名(1.9%)参与者发生AF。机器学习模型的表现优于CHARGE-AF模型,具有更好的区分能力(C指数:0.83 [95% CI, 0.80-0.85] vs 0.77 [95% CI, 0.74-0.79];P<0.001)和更优的校准效果(Brier分数:1.82 vs 1.92;P<0.001)。关键预测因素包括年龄、临床因素(心电图参数、心脏生物标志物、血压)和教育水平。归因风险分析显示,不同种族群体在AF风险贡献方面存在显著差异(非西班牙裔黑人:14.3% vs 白人参与者:34.6%)。机器学习模型在所有指标上都减少了算法偏见。
结论
不考虑种族差异的机器学习模型在预测性能上优于CHARGE-AF模型,并减少了偏见,有望改善临床风险分层,促进健康公平。
部分内容摘录
引言
心房颤动(AF)是一个日益严重的全球健康问题,与高发病率和医疗保健成本相关,预计到2030年其患病人数将从2010年的500万增加到约1200万。1, 2, 3 一旦患者被诊断为AF,其1年死亡率比普通人群高出20%以上。4 在AF的患病率和结果方面存在显著的种族差异,自报为白人的成年人中AF的患病率更高(11.3%)。
研究人群
我们从美国国立卫生研究院(NIH)生物样本和数据存储库协调中心(BioLINCC)获取了多个队列研究的去标识化参与者数据。研究队列包括动脉粥样硬化风险社区研究(ARIC)和心血管健康研究(CHS)的数据。验证队列还包括来自三个额外研究的数据:多民族动脉粥样硬化研究(MESA)、Framingham Offspring研究和Framingham研究。
结果
在排除了基线时有AF或至少20%协变量缺失的参与者后,研究队列共有16,719名参与者(补充图1)。ARIC和CHS分别贡献了13,134名和3,585名参与者。外部验证队列在排除相关参与者后共有13,928名参与者(MESA:n=6,705;FOS:n=3,226;FHS G3:n=3,997)。在最长5年的随访期间,研究队列和验证队列中分别有507名(3.0%)和262名(1.9%)参与者发生了AF事件。
基线数据
讨论
通过对5项描述详尽的观察性研究进行个体参与者级别的分析,我们开发并验证了新的AF预测模型,这些模型在不使用种族作为预测变量的情况下仍能取得更好的性能。通过整合生物标志物和SDOH数据,我们的机器学习模型显示出比现有的CHARGE-AF风险评分更好的区分能力和校准效果,而我们的简化整数模型则保持了类似的区分能力并提升了校准效果。
致谢:
资金支持:美国心脏协会“评估临床模型中的种族因素”项目(#23ARCRM1077164)提供资助