基于机器学习的高近视眼豹纹状眼底病理改变早期筛查模型构建与验证
《Graefe's Archive for Clinical and Experimental Ophthalmology》:Development and validation of machine learning for pathological changes in high myopia patients with tessellated fundus: a cross-sectional study
【字体:
大
中
小
】
时间:2025年10月04日
来源:Graefe's Archive for Clinical and Experimental Ophthalmology 2.4
编辑推荐:
本研究针对高近视眼豹纹状眼底早期病理改变难以识别的问题,通过整合生活方式与临床参数,开发了多种机器学习模型(如XGBoost、随机森林)。结果显示模型AUC最高达0.839,校准曲线和决策曲线分析证实其良好校准能力与临床适用性,为基层医疗机构提供了有效的早期筛查工具。
随着全球近视患病率的持续攀升,预计到2050年将有约47.58亿人罹患近视,其中高度近视患者达9.38亿。高度近视可能进展为病理性近视(Pathological Myopia, PM),引发后巩膜葡萄肿、近视性黄斑病变、牵引性黄斑病变等不可逆损伤,成为亚洲人群(12-27%)和欧洲人群(7%)低视力和盲目的主要诱因。豹纹状眼底(Tessellated Fundus)作为近视性萎缩性黄斑病变的早期特征,在临床实践中常被忽视,特别是在缺乏光学相干断层扫描(OCT)等影像设备的基层医疗机构,早期识别与干预面临巨大挑战。传统影像学方法对早期病变检测能力有限,而现有深度学习模型虽在PM检测中表现优异,却存在模型参数异质性大、可解释性不足等问题,且多数研究未聚焦于豹纹状眼底这一特定高危群体。
为解决这一临床痛点,研究人员开展了一项横断面研究,旨在开发并验证基于生活方式和临床参数的机器学习模型,用于早期识别高近视眼豹纹状眼底患者的病理改变。该研究纳入广西医科大学第一附属医院2023年5月至2024年7月就诊的529只眼,通过LASSO回归筛选关键变量,构建了随机森林(Random Forest, RF)、支持向量机(Support Vector Machine, SVM)、线性支持向量机(Linear Support Vector Machine)和XGBoost四种机器学习模型。研究结果显示,这些模型在测试集中曲线下面积(AUC)分别达到0.834、0.815、0.765和0.839,表现出优异的判别能力、校准特性和临床适用性。
关键技术方法包括:通过问卷调查收集人口学特征、用眼习惯等生活方式数据;使用IOL-Master测量眼轴长度等生物参数,Pentacam测量角膜厚度等结构参数;基于宽视野眼底照相量化视盘周围萎缩(Peripapillary Atrophy, PPA)面积、最大半径、视盘倾斜比等影像学指标;采用LASSO回归与五折交叉验证进行变量筛选;构建多种机器学习模型并通过ROC曲线、校准曲线和决策曲线分析评估性能。
研究共纳入529只眼,男性141只,女性388只,平均年龄27.08±9.51岁。其中病理性近视(PM)组329只眼,非PM组200只眼。训练集(370只眼)与测试集(159只眼)在人口学特征和临床参数上均衡可比。两组在教育水平、每日iPad使用时间、阅读时间等生活方式参数,以及等效球镜(Spherical Equivalent)、眼轴长度(Axial Length)、角膜厚度(Corneal Thickness)等生物测量指标上均存在显著差异。
LASSO回归分析筛选出14个关键建模变量:教育水平、每日iPad使用时间、每日阅读时间、每日卧位阅读时间、灯具光源、每日户外活动时间、等效球镜、眼轴长度、角膜厚度、晶状体厚度、PPA累及范围、PPA最大半径、视盘水平径和视盘倾斜比。这些变量涵盖了生活方式、眼用习惯和眼部结构参数等多个维度。
基于选定变量构建的机器学习模型在训练集中表现出色:XGBoost模型的AUC高达0.996(95% CI: 0.992-0.999),随机森林、支持向量机和线性支持向量机的AUC分别为0.862、0.922和0.833。校准曲线显示模型预测概率与观察概率高度一致,决策曲线分析表明模型在较宽阈值范围内具有正向净收益。
在测试集中,模型性能保持稳定:XGBoost模型AUC为0.839(95% CI: 0.776-0.902),随机森林、支持向量机和线性支持向量机分别为0.834、0.815和0.765。灵敏度与特异性分析显示,XGBoost模型在保持较高灵敏度(0.743)的同时,特异性达到0.815。校准曲线和决策曲线进一步证实了模型在独立数据集中的可靠性与临床实用性。
变量重要性排序显示,眼轴长度对模型贡献最大,其次为等效球镜和PPA最大半径。相关性热图分析发现眼轴长度与等效球镜呈中度正相关(r=0.6),其他变量间相关性较弱或无显著性。这一发现与临床认知高度吻合,凸显了眼轴延长在病理性近视发生发展中的核心地位。
与既往研究相比,本研究的创新点在于将筛查窗口前移至豹纹状眼底阶段,通过整合多维度的可解释变量,构建了适用于临床实践的早期筛查工具。模型性能与现有基于眼底图像的深度学习模型相当,但更具临床可行性和推广价值。研究发现的高教育水平、长时间近距工作、户外活动时间不足等风险因素,与近视发生发展的环境因素理论高度一致。眼部生物测量参数的分析进一步证实了眼轴延长、PPA扩大、视盘倾斜等形态学改变与PM的密切关联。
研究的局限性包括单中心设计、样本量有限以及部分影像参数可能存在的设备间差异。未来需通过多中心大样本数据进一步验证模型的泛化能力,并探索将原始图像特征与临床参数融合的建模策略。
综上所述,该研究成功开发了一套基于机器学习的高近视眼豹纹状眼底病理改变早期筛查模型,通过整合生活方式习惯、眼用习惯和可解释临床参数,为临床医生提供了有效的辅助诊断工具。这一模型有望在基层医疗或资源有限地区优化随访策略,提高PM早期检出率,从而降低致盲风险。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号