高分辨率眼底图像助力眼科组学与心血管疾病早期预测研究

《Scientific Data》:High-resolution fundus images for ophthalmomics and early cardiovascular disease prediction

【字体: 时间:2025年04月04日 来源:Scientific Data 5.8

编辑推荐:

  心血管疾病(CVDs)是全球主要死因,颈动脉内膜中层厚度(CIMT)是评估心血管风险的重要指标。为解决高质量眼底图像与 CIMT 测量相关数据集缺乏的问题,研究人员构建 China - Fundus - CIMT 数据集。实验发现多模态模型结合临床信息可提升预测性能,该数据集为 CVDs 早期筛查模型研发提供重要资源。

  心血管疾病如同隐藏在暗处的 “杀手”,在全球范围内肆虐,每年夺走约 1860 万人的生命,是导致人类死亡的主要原因之一。其中,动脉粥样硬化作为许多心血管疾病的潜在病理,悄无声息地发展,一旦引发血管严重狭窄或堵塞,就会导致心肌梗死、中风等严重后果。因此,早期发现心血管疾病并及时干预至关重要。颈动脉内膜中层厚度(CIMT)是评估动脉粥样硬化和心血管风险的关键生物标志物,其数值的微小变化都与心血管疾病风险密切相关,比如 CIMT 每增加 0.1mm,死亡风险就会升高 1.12 倍。然而,传统测量 CIMT 的 B 超方法存在设备昂贵、需要专业人员操作、耗时久且普及性差等问题,难以在日常筛查中广泛应用。
与此同时,视网膜血管的结构和功能与多种全身疾病,如动脉粥样硬化、高血压等密切相关。作为颈内动脉分支的视网膜中央动脉,与颈动脉关系紧密,颈动脉的血流动力学变化会直接影响视网膜血管,使其出现动脉变窄、微血管密度降低等特征性病理改变,这些在眼底图像中都有所体现。所以,眼底图像中的微血管结构异常可作为颈动脉病变的成像生物标志物,为心血管疾病的早期预警提供依据。但眼底图像细节丰富、特征复杂,传统诊断方法难以准确识别细微病变,而深度学习技术在分析大量图像数据、捕捉微小病变特征方面具有强大优势,在早期病变检测和预测领域潜力巨大。

遗憾的是,目前利用眼底图像预测 CIMT 的研究较少,且缺乏高质量的公开数据集,严重阻碍了相关研究的进展。为了填补这一空白,安徽医科大学第二附属医院等机构的研究人员开展了一项具有重要意义的研究,相关成果发表在《Scientific Data》上。

研究人员构建了 China - Fundus - CIMT 数据集,该数据集包含 2903 例患者的双侧高质量眼底图像、CIMT 测量值以及年龄、性别等临床信息。研究人员首先对数据进行了细致的预处理。在图像方面,通过 Python 脚本去除眼底图像中的黑色区域,并将图像裁剪为 512×512 像素的标准分辨率,同时依据左右眼标识对图像进行重命名;由两位经验丰富的临床专业人员按照标准化质量评估标准对图像进行评估,从视网膜结构清晰度、曝光度、有无遮挡和伪影、视网膜视野覆盖完整性四个方面进行考量,将图像分为高质量和低质量两类,存在争议的图像由资深眼科医生协商解决,随后构建了自动眼底图像质量分类模型,对图像进行进一步筛选和处理;对于超声报告数据,利用正则表达式自动提取 CIMT 信息,并由两位研究人员独立验证,确保数据的准确性。

在技术验证环节,研究人员开展了一系列实验。首先建立了基于单个眼底图像的基线模型,分析了不同图像处理策略以及多模态临床信息(年龄和性别)对模型性能的影响。为了研究 CIMT 边界值对模型性能的影响,构建了包含边界值和不包含边界值的两个实验模型。结果发现,CIMT 边界值对单模态模型的整体性能影响有限,包含边界值和不包含边界值的模型在预测准确性等指标上差异较小,这表明单模态模型具有一定的稳健性。

此外,研究人员还探究了多模态临床信息对模型预测性能的影响。在基线模型的基础上,加入年龄和性别等临床变量作为补充输入特征,与图像数据在全连接层融合构建多模态融合模型,并与仅使用图像数据的单模态模型进行对比。结果显示,多模态模型在预测准确性和泛化能力方面表现显著优于单模态模型。在验证集上,多模态模型的整体预测准确率达到 80.50%,比单模态模型高 2.5%,AUC - ROC 值为 86.01%,比单模态模型高 3.22%;在测试集上,多模态模型的整体预测准确率为 81.00%,比单模态模型高 6%,AUC - ROC 值达到 90.41%,比单模态模型高 7.83%。

综上所述,本研究成功构建了 China - Fundus - CIMT 数据集,为心血管疾病的研究提供了宝贵的资源。实验结果表明,多模态模型在预测 CIMT 增厚方面具有显著优势,整合临床信息能够大幅提升模型的预测性能。这一研究成果为基于眼底图像的心血管疾病早期筛查模型的开发和验证奠定了坚实基础,有望推动心血管疾病早期诊断技术的发展,在资源有限的环境中也具有重要的应用潜力,为全球心血管疾病的防治提供了新的思路和方法。不过,该数据集也存在一定的局限性,如缺乏高血压、糖尿病等详细病史信息,未来研究可进一步纳入这些临床变量,以提高预测性能。

下载安捷伦电子书《通过细胞代谢揭示新的药物靶点》探索如何通过代谢分析促进您的药物发现研究

10x Genomics新品Visium HD 开启单细胞分辨率的全转录组空间分析!

欢迎下载Twist《不断变化的CRISPR筛选格局》电子书

单细胞测序入门大讲堂 - 深入了解从第一个单细胞实验设计到数据质控与可视化解析

下载《细胞内蛋白质互作分析方法电子书》

相关新闻
    生物通微信公众号
    微信
    新浪微博

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号