
-
生物通官微
陪你抓住生命科技
跳动的脉搏
全脑MRI去标识化的双重隐患:扩散模型带来的重识别风险与研究价值折损
【字体: 大 中 小 】 时间:2025年09月21日 来源:Computers in Biology and Medicine 6.3
编辑推荐:
本研究针对MRI数据共享中广泛使用的去标识化(defacing)技术,揭示了其在深度生成模型时代面临的两大挑战。研究人员开发了一种基于级联扩散概率模型(DPMs)的 refacing 流程,成功从去标识化MRI中恢复出高保真度的面部图像,证明现有隐私保护措施存在被攻破的风险。同时,研究还发现去标识化操作会显著削弱从头面部MRI预测腹部、大腿和胫骨肌肉放射密度(CT-derived skeletal muscle radiodensity)的能力,Spearman相关系数显著降低(p ≤ 10?4),凸显了其对非脑区有价值研究信息的破坏。该研究警示,单纯依赖去标识化技术既不能有效保护隐私,又会损害数据的科研潜力,对医学影像数据的共享策略具有重要指导意义。
在当今大数据驱动的生物医学研究时代,共享大规模医学影像数据已成为推动科学进步的关键。然而,这是一条布满荆棘的道路,其中最尖锐的刺莫过于如何平衡数据开放与患者隐私保护。对于高分辨率的全脑磁共振成像(MRI)而言,这个问题尤为突出,因为清晰的图像不仅能让研究者窥见大脑的奥秘,也可能让别有用心者识别出患者的容貌。为此,去标识化(Defacing)——一种通过算法去除或模糊MRI中面部体素的技术——已成为数据共享前一道标准的“安检程序”,被UK Biobank、人类连接组计划(HCP)等众多国际知名数据库所采用。
但这道安检真的牢不可破吗?被丢弃的“面部垃圾”真的只是隐私的废料,而没有丝毫科研价值吗?近年来,深度生成模型的迅猛发展,尤其是扩散模型(Diffusion Probabilistic Models, DPMs)在图像生成领域展现出的惊人能力,让第一个问题充满了悬念。而越来越多的证据表明,头颅的非脑区,如眼部结构、颞肌、脑膜等,蕴藏着与中风、癌症预后、衰老等多种生理病理过程相关的重要信息,这让第二个问题同样值得深究。
为了彻底审视去标识化技术在这两个维度上的有效性,一个由Chenyu Gao和Bennett A. Landman等来自范德比尔特大学(Vanderbilt University)的研究团队开展了这项严谨的研究。他们的成果表明,我们可能过于信赖去标识化这把“隐私锁”,而低估了它对我们科研“视力”造成的永久性损伤。该研究发表于《Computers in Biology and Medicine》期刊。
本研究采用了两种核心的技术路线来回答两个关键科学问题。首先,为评估重识别风险,研究人员构建了一个基于级联扩散概率模型(DPMs)的refacing技术流程,该流程包含一个3D模型(用于从下采样的去标识化图像中生成低分辨率修复图像)和一个2.5D模型(用于以 slab 方式实现超分辨率增强)。该模型在来自Kirby-21和OASIS3数据集的180名受试者的T1加权(T1w)MRI上进行训练,并在15名内部测试受试者和469名来自BLSA(Baltimore Longitudinal Study of Aging)数据集的外部测试受试者上进行了验证,测试集涵盖了FSL_deface、MRI_Deface、Pydeface和Quickshear四种主流的去标识化方法处理后的图像。其次,为评估去标识化对科研价值的影响,研究利用了BLSA队列中拥有配对头部T1w MRI和腹部、大腿、胫骨单层CT图像的948-990名受试者,使用3D残差神经网络(ResNet)从原始及四种去标识化后的MRI面部体素中预测经年龄和性别校正后的肌肉放射密度(muscle radiodensity),并通过Spearman相关系数等指标比较预测性能的差异。
研究结果主要分为两大部分,分别对应两个研究目标。
1. Cascaded diffusion models for refacing defaced MRI
本研究开发的重建流程能够有效地从经过各种去标识化处理的MRI中,生成高分辨率3D图像,其中包含的面部与原始面部高度相似。评估采用平均绝对表面距离(MASD)作为量化指标,其数值与面部是否属于同一个人的感知印象基本一致。关键结论如下:
与线性对齐的人群平均脸(由mri_reface生成)相比,DPMs重建出的面部与原始面部的MASD显著更小(p < 0.05),表明其相似性更高。在内部测试集上,从MRI_Deface处理图像重建的面部MASD最小,为0.34 mm;在外部测试集上,其MASD为0.38 mm。
去标识化越激进,重建挑战越大,MASD也相应增大。例如,在外部测试集上,从去标识化范围较大的Pydeface处理图像中重建的面部,其MASD为0.67 mm。
在完全去除颅骨和面部结构的 skull-stripped( skull-stripped)图像上,DPMs无法重建出有意义的、与原始面部相似的面部结构,证明模型的生成严重依赖于未被破坏的颅骨等解剖结构提供的条件信息。
尽管DPMs重建面部的感知相似性更高,但其在面部区域的峰值信噪比(PSNR)和结构相似性指数(SSIM)通常低于线性对齐的人群平均脸。研究者将此归因于训练数据规模(180名受试者)有限以及DPMs在推理时无法访问原始面部信息。
2. Estimation of skeletal muscle radiodensity from facial voxels
本研究通过预测肌肉放射密度,实证了面部体素中包含的具有普遍意义的研究价值,并证明去标识化操作会破坏这种价值。主要发现包括:
使用原始(未去标识化)MRI图像时,从面部体素预测腹部、大腿和胫骨肌肉放射密度(已校正年龄和性别因素)的预测值与真实值之间存在显著的Spearman相关关系。
在使用任何一款去标识化方法(FSL_deface, MRI_Deface, Pydeface, Quickshear)处理后的图像进行预测时,所得到的Spearman相关系数均显著低于使用原始图像的结果(p ≤ 10?4)。
更为重要的是,这种相关性的统计显著性也因去标识化而丧失。对于腹部肌肉,使用原始图像时相关性显著(p < 0.05),而使用FSL_deface、MRI_Deface和Pydeface处理后的图像时,相关性则变得不显著(p > 0.05)。对于胫骨肌肉,其头-身相关性仅在使用了原始图像时才具有统计学意义。
结果表明,去标识化不仅移除了身份信息,也移除了与全身性生理指标(如肌肉质量)相关的有价值信息,从而限制了从头部MRI中发掘潜在生物标志物的能力。
在讨论中,研究者深入分析了上述结果背后的机制与深远影响。关于重识别风险,DPMs的成功源于其学习了训练数据中的颅面解剖统计先验,并利用被试个体未被破坏的颅骨等结构作为强条件指导生成过程,从而实现个性化重建,而非简单生成平均脸。这揭示了去标识化技术在面对现代AI技术时存在的固有脆弱性。
关于科研价值的折损,本研究通过肌肉放射密度预测这一具体实例,强有力地证明了常被去除的非脑区体素蕴含着超越局部区域的、关乎全身健康状态的宝贵信息。去标识化在抹去身份信息的同时,也无可挽回地擦除了这些信息,对数据潜在的研究范围构成了不必要的限制。
基于这些令人担忧的发现,研究者对未来的数据共享策略提出了两项核心建议:其一,在必须公开共享时,可考虑共享 skull-stripped 图像,并附上在 skull-stripping 前提取的颅面特征测量值(如颅内体积),但需明确承认这种做法本身会牺牲大量的研究潜力;其二,更推荐的方案是,在通过严格的政策限制和访问控制来确保隐私的前提下,共享未更改的原始图像。
综上所述,这项研究发出了一个明确的警示:在全脑MRI数据共享中广泛使用的去标识化技术,既不能在现代AI面前可靠地保护隐私,又会在不经意间扼杀数据中蕴藏的众多科研可能性。它呼吁科研界、伦理审查委员会(IRB)和数据管理机构重新审视和制定更加精细、有效且能够兼顾隐私保护与数据效用最大化的数据共享范式。
生物通微信公众号
知名企业招聘