
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于模糊概率树(FPT)的临床诊断辅助:提升可解释性人工智能在甲状腺结节与慢性肾病中的应用
【字体: 大 中 小 】 时间:2025年09月17日 来源:BMC Medical Informatics and Decision Making 3.8
编辑推荐:
为解决临床决策支持系统(CDSS)中AI模型缺乏透明度的问题,研究人员开展了模糊概率树(FPT)建模研究,将模糊逻辑与概率树结合,提升了模型的可解释性与不确定性处理能力。实验表明,FPT在甲状腺结节良恶性分类和慢性肾病(CKD)进展风险预测中均表现出较高的敏感性,为临床提供了直观、可验证的决策支持工具,符合欧盟《人工智能法案》(AIA)对高风险医疗AI系统的透明度要求。
在人工智能(AI)日益渗透医疗领域的今天,一个尖锐的矛盾愈发凸显:虽然AI系统在诸多医疗任务中展现出甚至超越人类专家的准确性和效率,但其“黑箱”特性却成为临床应用的巨大障碍。医生无法理解模型的决策逻辑,患者无法获得 meaningful 的解释,而欧盟《通用数据保护条例》(GDPR)和《人工智能法案》(AIA)等法规更是明确要求高风险AI系统必须具备透明度和可解释性。在医疗这一高风险领域,缺乏可解释性不仅关乎信任,更直接关系到患者的生命健康与合法权益。
传统的可解释AI(XAI)方法多采用事后解释(post hoc)技术,试图在模型训练完成后一窥其内部决策机制,这如同在迷宫建成后才开始绘制地图,始终隔了一层。而可解释AI(IAI)则追求模型的先天可解释性(a priori interpretable),其决策过程从一开始就是人类可直观理解和验证的。与此同时,医疗数据本身充满了不确定性、模糊性和歧义性。诸如“年轻”与“年老”、“小结节”与“大结节”、“高烧”(体温39°C算,那38.9°C呢?)等概念,其边界是渐变的,而非传统二值逻辑所能精确刻画。这种不确定性若用生硬的阈值(crisp thresholds)处理,往往会丢失关键信息,甚至引入人为的 artifacts。
为了解决上述问题,由Giulia Capitoli、Marco S. Nobile等人组成的研究团队在《BMC Medical Informatics and Decision Making》上发表了一项研究,提出了一种名为模糊概率树(Fuzzy Probabilistic Trees, FPT)的新型可解释AI建模方法。该方法巧妙地融合了概率树(Probabilistic Trees, PTs)的清晰因果结构与时延40余年之久的模糊集(Fuzzy Sets)理论处理不确定性的能力,旨在为临床医生提供一个既能处理数据模糊性,又能完全透明、可验证的决策支持工具。
为了开展这项研究,研究人员主要应用了几项关键技术:首先是概率树(PT)建模框架,它用节点表示过程状态,用弧表示概率转移和因果依赖,能直观地结构化和可视化决策问题;其次是模糊集理论,通过定义隶属度函数(membership functions)将如“50Plus”、“Large Nodule”等临床模糊概念数学化,允许部分隶属(0到1之间),更贴合人类推理;再者是设计了FPT预测算法(Algorithm 1和2),该算法能遍历树结构,结合隶属度进行加权概率计算,并能通过findExistingConditions函数处理训练集中未出现过的患者数据,增强了模型的泛化能力;最后,团队开发了一个基于PyQT5的图形用户界面(GUI)工具,使临床专家能以交互方式输入患者信息、查看预测概率、并进行反事实(counterfactual)推理测试。研究基于两个真实的临床队列数据:一是来自意大利ASST Monza的401例经细针抽吸活检(FNA)的甲状腺结节患者数据;二是来自欧盟多中心前瞻性研究、包含2599例慢性肾病(CKD)患者的数据。
研究结果
甲状腺结节案例研究
研究人员将FPT应用于甲状腺结节良恶性分类。构建的PT模型包含了结节组成、回声性、形状、边界、 echogenic foci、患者年龄(转换为“50Plus”语言变量)和结节尺寸(转换为“大结节”语言变量)等特征。性能评估显示,FPT的准确率(Accuracy)达96.9%(95% CI: 94.1-99%),特异性(Specificity)为98.3%(95% CI: 95.7-100%),敏感性(Sensitivity)为83.2%(95% CI: 55.6-100%),略优于传统PT模型(敏感性82.2%)。与逻辑回归(LR)和决策树(DT)等可解释基准模型相比,FPT在敏感性这一关键医疗指标上表现最佳,表明其更擅长识别恶性病例。
慢性肾病案例研究
在预测CKD患者2年内进展至终末期肾病(End Stage Renal Disease, ESRD)的风险中,FPT模型包含了年龄、糖尿病、血清肌酐(serum creatinine)、贫血(血红蛋白)、肾小球滤过率(GFR)、蛋白尿(proteinuria)、磷酸盐(phosphate)等特征,并将其中多个连续变量转换为模糊语言变量。结果表明,FPT的准确性(77.2%)较PT(76.9%)有轻微提升。其敏感性(62.2%)显著高于PT(56.7%),意味着FPT能多识别出约5.5%的实际会进展为ESRD的患者。尽管逻辑回归(LR)在准确性和特异性上更高,但其敏感性(52.2%)较低,说明LR模型更保守,容易漏诊。FPT在保持可解释性的同时,提升了对高风险患者的识别能力。
可解释性分析
研究从概念上区分了可解释性(IAI)与事后可解释性(XAI),并论证了FPT作为一种IAI模型的优势。其决策过程可直接转化为“如果...那么...”形式的自然语言规则,并输出概率而非硬性分类,这与临床决策的复杂性更匹配。虽然引入模糊概念增加了轻微的认知负荷,但其为处理不确定性提供的数学框架使其更贴近人类医生的推理模式。
FPT方法的潜力(反事实推理)
研究强调了FPT在反事实推理(counterfactual reasoning) 方面的独特潜力。医生可通过GUI工具模拟“如果患者服用了RASI药物(一种肾保护药物,但可能引发高钾血症),其ESRD进展风险会如何变化”等假设性问题。这种思考 alternate realities 的能力是人类智能的核心,FPT使其能与大数据分析相结合,为临床干预策略评估提供了强大工具。
临床医生工具
团队开发了一个用户友好的GUI工具,它允许临床医生输入患者信息后,实时查看FPT模型给出的风险概率以及推理路径。医生可以交互地修改或过滤某些条件,观察其对预测结果的即时影响,从而进行假设检验和反事实分析,极大地增强了工具的实用性和医生的信任度。
结论与讨论
本研究提出的模糊概率树(FPT)成功地将模糊集理论与概率树相结合,创造出一种先天可解释的AI建模方法。它在两个截然不同的临床场景(甲状腺结节分类和CKD进展预测)中均验证了其有效性,特别是在提高模型敏感性方面展现出优势。FPT更好地捕捉了医疗变量中固有的模糊性和不确定性,其决策过程与人类推理方式更加契合,并且具备支持反事实推理的潜力,符合欧盟AIA等法规对高风险AI系统的严格要求。
尽管FPT的性能显示出其应用前景,但研究者也坦言,在当前数据集上其绝对性能尚未达到足以完全依赖的临床决策水平。未来的工作将包括在更大规模的外部队列中验证FPT、研究结合元启发式优化(meta-heuristics optimization)的PT自动生成与特征选择方法,以及扩展FPT以支持非二值目标变量。总之,这项研究为开发既强大又透明的临床决策支持系统迈出了重要一步,为实现人机协同的智能医疗未来提供了新的思路和工具。
生物通微信公众号
知名企业招聘