基于机器学习的患者偏好预测:概念验证
《NEJM AI》:Machine Learning–Based Patient Preference Prediction: A Proof of Concept
【字体:
大
中
小
】
时间:2025年09月23日
来源:NEJM AI
编辑推荐:
患者偏好预测模型(PPP)在无法表达意愿时基于人口数据预测CPR意愿,瑞士SHARE数据集构建了基本、临床、个性化三模型。结果显示个性化模型(61特征)准确率70.6%优于基线,但存在数据不平衡、依赖年龄性别等非自主特征问题。
在医疗决策过程中,尊重患者的自主权是一项核心伦理原则。然而,当涉及到关乎生命存亡的关键决策时,许多患者由于缺乏决策能力而无法表达自己的意愿。这种情况下,通常需要依靠替代决策者(surrogate decision-makers)来代表患者做出选择。然而,现有研究表明,替代决策者在预测患者真实意愿方面存在较大困难,准确率往往低于70%。这种局限性在临终医疗决策中尤为明显,尤其是在护理机构或老年患者群体中,有相当比例的决策涉及无法表达自己意愿的个体。此外,随着全球人口老龄化趋势的加剧,神经退行性疾病和神经精神疾病的发生率上升,使得这一问题更加复杂。因此,如何在不侵犯患者自主权的前提下,准确预测其医疗意愿,成为当前医疗伦理和临床实践中的一个重要议题。
为了解决这一问题,一些生物伦理学家提出利用自动化患者偏好预测模型(Patient Preference Predictor, PPP)来辅助决策。PPP基于人群数据,通过机器学习技术,能够更准确地识别患者的潜在意愿。这种方法在某些情况下可能比依赖替代决策者更具优势,尤其是在患者无法表达自己意愿的情况下。然而,目前尚未有研究明确展示PPP模型在实际临床环境中的应用效果。因此,本研究旨在开发并评估一个基于大规模人群数据的PPP模型,探索其在预测患者是否愿意接受心肺复苏(CPR)方面的可行性。
本研究使用了瑞士分支的欧洲健康、老龄化与退休调查(Survey of Health, Ageing and Retirement in Europe, SHARE)数据集。SHARE是一项长期的人口队列研究,自2002年起每年收集50岁以上人群的健康、社会经济状况和社交网络信息。在第八轮调查中,研究人员特别关注了参与者对临终医疗决策的偏好,包括是否愿意接受心肺复苏。通过对这些数据的分析,研究团队构建了三个不同类型的PPP模型:基础模型(Basic)、临床模型(Clinical)和个性化模型(Personalized)。这些模型分别基于不同层次的数据,从简单的社会人口学信息到更复杂的临床和心理特征,以评估其在预测患者意愿方面的表现。
基础模型仅使用了九项人口统计学特征,如性别、年龄、是否有子女、婚姻状况、工作状态等。这些特征虽然简单,但却是最容易获取的信息,适用于资源有限的医疗环境。临床模型则整合了电子健康记录中可能获取的医疗数据,如是否曾接受过癌症筛查、是否住院治疗、是否患有慢性疾病等。这些数据反映了患者的健康状况和医疗行为,有助于更全面地理解其潜在的医疗偏好。个性化模型则引入了更多与患者价值观和偏好相关的变量,如对临终护理的重视程度、个性特征(如外向性、尽责性、开放性等)、宗教信仰(如祈祷频率)以及是否讨论过临终护理的意愿。个性化模型的构建依赖于更详细的数据,但这些数据可能并不总是容易获得,特别是在实际临床环境中。
研究团队使用了多种机器学习算法,包括逻辑回归、支持向量机、随机森林和XGBoost模型,以评估它们在预测患者CPR偏好方面的表现。最终,XGBoost算法因其在处理数据异质性、内置缺失值处理机制以及与可解释性框架(如SHAP)的兼容性而被选为最佳模型。通过在训练集和测试集上的比较,XGBoost在所有三个模型中表现最佳,尤其是个性化模型,其五折交叉验证的平均准确率为70.6%,显著优于基础模型和临床模型的66.2%。此外,个性化模型在精确度、召回率和F1分数上均优于其他两种模型,表明其在预测患者真实意愿方面具有更高的可靠性。
然而,尽管个性化模型在准确率上表现突出,但其在实际应用中仍面临诸多挑战。首先,数据的不平衡性是一个重要的技术问题。在本研究中,患者倾向于接受CPR的比例为60.3%,而拒绝的比例为39.7%。这种不平衡可能导致模型在预测某些类别时出现偏差,尤其是在临床实践中,错误地预测患者的意愿可能会带来严重的后果。因此,研究团队在模型评估过程中不仅关注准确率,还考虑了精确度、召回率和F1分数等指标,以更全面地衡量模型的性能。此外,由于患者的临终意愿并非固定不变,模型的预测结果可能无法完全反映当前的医疗决策需求,特别是在患者自身意愿发生变化的情况下。
在模型的可解释性方面,研究团队利用SHAP(SHapley Additive exPlanations)框架对三个模型的特征重要性进行了分析。SHAP能够帮助理解模型在预测患者意愿时所依赖的关键因素。例如,基础模型主要依赖于人口统计学特征,如年龄、性别和是否有子女,而临床模型则强调了患者的健康行为和医疗记录。个性化模型则揭示了更多与患者价值观和偏好相关的因素,如对临终护理的重视程度、个性特征和宗教信仰等。这些发现表明,虽然基础模型和临床模型在预测患者意愿方面有一定的效果,但个性化模型能够更准确地捕捉到患者深层次的医疗偏好,从而为替代决策者提供更有参考价值的依据。
然而,PPP模型的应用也引发了伦理和法律层面的讨论。一些学者认为,仅仅依靠预测模型可能无法充分尊重患者的自主权,因为这些模型无法完全反映患者的真实意愿,也无法提供足够的伦理指导。此外,模型的预测结果可能会被误用,尤其是在医疗决策过程中,错误的预测可能导致不必要的医疗干预或放弃治疗。因此,在部署PPP模型之前,必须慎重考虑其在伦理和法律层面的适用性,并确保所有相关方(包括患者、替代决策者、医疗提供者和伦理委员会)都充分参与决策过程。
尽管如此,PPP模型仍然具有重要的现实意义。在实际医疗实践中,替代决策者往往面临巨大的心理压力,特别是在涉及生命存亡的决策时,他们可能会感到焦虑和内疚。而PPP模型能够提供一种更为客观和系统化的决策支持工具,减少替代决策者的决策负担,并提高医疗决策的准确性。此外,PPP模型还可以作为补充工具,用于辅助替代决策者做出更符合患者意愿的决策,尤其是在缺乏明确的预先指示(如预先医疗指示)的情况下。
本研究的局限性也值得进一步探讨。首先,数据集的来源仅限于SHARE调查,可能无法完全代表所有医疗环境下的患者群体。其次,虽然个性化模型在预测准确率上表现最佳,但其构建依赖于详细的个人数据,这些数据在实际临床环境中可能难以获取。此外,PPP模型的预测结果可能会受到数据质量的影响,因此在实际应用中需要确保数据的完整性和准确性。最后,由于患者的医疗偏好具有一定的动态性,PPP模型的预测结果可能无法完全反映当前的医疗决策需求,因此在使用时需要结合其他信息,如患者的当前健康状况和替代决策者的主观判断。
综上所述,PPP模型为临终医疗决策提供了一种新的可能性,但其在实际应用中仍需克服诸多技术、伦理和法律上的挑战。未来的研究可以进一步探索PPP模型在不同医疗环境中的适用性,并结合更多的临床数据和个性化信息,以提高其预测的准确性和可靠性。同时,还需要建立一套完善的伦理框架,确保PPP模型的使用不会侵犯患者的自主权,并能够为医疗决策提供合理的支持。通过持续的技术改进和伦理探讨,PPP模型有望成为辅助医疗决策的重要工具,为患者和替代决策者提供更科学、更人性化的决策支持。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号