
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于乳腺X线影像组学与临床特征预测BI-RADS 4A类病灶随访转归的列线图模型研究
【字体: 大 中 小 】 时间:2025年09月22日 来源:International Journal of Women's Health 2.5
编辑推荐:
本刊推荐:本研究创新性地构建了融合乳腺X线影像组学特征与临床指标的列线图模型(Nomogram),用于预测BI-RADS 4A类病灶的良恶性进展。该模型通过LASSO回归筛选出4个关键纹理特征,结合临床触诊阳性和乳腺手术史等预测因子,在训练集和验证集中分别达到0.923和0.904的AUC值,为降低不必要活检提供了量化决策工具,对实现乳腺癌精准筛查具有重要意义。
研究背景与意义
乳腺癌已成为全球女性健康的首要威胁,据GLOBOCAN 2022数据显示,其年新发病例达230万,位居女性恶性肿瘤第二位。乳腺X线摄影结合BI-RADS(Breast Imaging Reporting and Data System)分类系统已成为乳腺癌筛查的核心策略。其中BI-RADS 4A类病灶被定义为恶性风险2%-10%的可疑病变,需组织活检确认。然而国家乳腺摄影数据库(NMD)数据显示,仅有7.6%的4A类病灶最终确诊为恶性,这意味着大量良性病变患者承受了不必要的侵入性活检。因此,精准识别4A类病灶中的真实恶性病例成为优化医疗资源配置的迫切需求。
研究方法设计
本研究采用单中心回顾性队列设计,经广州中医药大学第二附属医院伦理委员会批准(审批号:ZE2021-111)。研究纳入了2010年1月至2020年10月期间接受≥2次乳腺X线检查且间隔≥6个月的104例患者,包含56例恶性和48例良性病例,共计202幅图像。所有患者基线检查均被评估为BI-RADS 4A类病灶,且最终检查显示影像学进展(病灶大小增加≥20%或恶性形态学征象增加)。排除标准包括图像质量不达标(乳腺密度分类≥C或病灶边界模糊)、6个月内病灶区域接受抗癌治疗或手术、以及临床数据关键变量缺失>10%的情况。
图像采集与处理
患者常规接受头尾位和内外斜位投照,由两位具有15年以上经验的乳腺放射科医师独立进行图像质量评估。基于2019年WHO分类系统,三位资深放射科医师对病灶进行BI-RADS分类,确认为4A类的病灶纳入分析。使用ITK-SNAP软件(v3.6.0)由两位放射科医师盲法勾画病灶感兴趣区域(ROI),最终共勾画202个ROI(94个良性,108个恶性),按7:3比例随机分为训练集(n=140)和测试集(n=62),并分层保证良恶性比例平衡。
影像组学特征工程
采用AK软件(v3.0.1)提取了1316个定量特征,包括14个形态学特征(体积、表面积、球形度等)、18个一阶统计特征(能量、熵、偏度、峰度等)以及1284个纹理特征(灰度共生矩阵GLCM、灰度游程长度矩阵GLRLM、灰度区域大小矩阵GLSZM、灰度依赖矩阵GLDM和邻域灰度差异矩阵NGTDM)。所有特征经过Z-score标准化消除量纲差异。通过Spearman等级相关系数和层次聚类树(距离=1-|ρ|)去除高度相关特征(|ρ|>0.9)的冗余性,最终采用10折交叉验证的LASSO回归确定λ值,保留非零系数特征。
模型构建与验证
基于逻辑回归分析构建放射组学模型,并生成放射组学评分(radscore)。将radscore与独立临床预测因子纳入多变量模型,构建临床-影像融合模型。使用R语言rms包(v6.2-0)绘制列线图,并通过Bootstrap法(1000次重采样)进行内部验证,结合受试者工作特征曲线下面积(AUC)、校准曲线和决策曲线分析(DCA)评估模型的区分度、校准度和临床实用性。
统计分析方法
采用SPSS软件(22.0版)进行统计分析。通过单样本Kolmogorov-Smirnov检验评估方差正态性,正态分布连续变量以均值±标准差表示并使用Student t检验比较,非正态分布连续变量以中位数和IQR描述并使用Mann-Whitney检验比较。分类变量以频数和百分比报告,使用卡方检验或Fisher精确概率法检验。通过ROC分析评估模型分类性能,采用DeLong检验比较AUC差异。所有统计检验均为双侧,P值<0.05认为具有统计学意义。
研究结果分析
104例患者中位年龄50岁(范围27-89岁),恶性病理包括导管原位癌/小叶原位癌、非特殊性浸润癌、特殊类型癌(小管癌、乳头状癌、黏液癌)和浸润性小叶癌共57例(54.8%);良性病理包括乳腺腺病/增生、伴不典型增生的纤维囊性乳腺病、纤维腺瘤、叶状肿瘤和硬化性腺病共47例(45.2%)。单因素分析显示,良恶性组在年龄、肿瘤家族史、初潮时间、绝经状态、生育史、初产年龄、哺乳史和腺体类型方面无显著差异(P>0.05),但手术史(P=0.025)和临床触诊阳性(P=0.026)存在显著差异。
图像标注重现性验证显示两位放射科医师的观察者间和观察者内一致性均较好(ICC 0.882-0.986)。通过LASSO回归筛选出四个关键纹理特征:lbp-3D-m2_glrlm_RunLengthNonUniformityNormalized、wavelet-LLH_glrlm_RunLengthNonUniformity、original_glrlm_Run-Entropy和wavelet-LLH_gldm_SmallDependenceLowGrayLevelEmphasis。训练组单因素和多因素分析显示,手术史和临床触诊阳性是乳腺恶性的独立预测因子(均P<0.05)。
模型性能比较显示,放射组学模型和放射组学-临床融合模型在训练组的AUC值分别为0.858和0.860,测试组分别为0.923和0.904。DeLong检验显示两个模型在训练组(P=0.096)和测试组(P=0.494)的AUC均无显著差异。校准曲线显示预测概率与观测概率具有良好一致性,DCA决策曲线表明当风险阈值为10%-95%(训练组)和20%-95%(验证组)时,融合模型具有良好临床实用性。列线图显示radscore的重要性显著优于其他临床特征。
讨论与展望
本研究开发的融合列线图模型整合了影像组学特征和临床特征(触诊阳性和乳腺手术史),用于预测BI-RADS 4A类病灶的良恶性进展。虽然两个模型间无统计学显著差异,但融合模型在训练和测试队列中均表现出更优的预测性能。研究的创新点在于不仅关注4A类病灶的良恶性鉴别,还预测其随访期间的进展趋势,这对临床决策具有重要意义。
本研究筛选的四个影像组学特征均属纹理特征,能够反映病灶区域的粗糙度和平滑度,间接体现病灶区域不同的遗传、分子和蛋白质组成。良性恶性病变的早期表现和间质完全不同,不同恶性病变类型的间质也可能完全不同,因此这些特征在预测4A类病灶良恶性方面表现良好。与既往研究一致,纹理特征在预测BI-RADS 4A类病灶良恶性结局方面仍具有重要价值,展现了其挖掘深层信息反映乳腺病变内部异质性的优异能力。
临床特征中,触诊在鉴别良恶性病变中作用最为显著,触诊阴性常提示良性病变,而触诊区域可触及增厚或肿块可能提示恶性病变。值得注意的是,虽然阳性临床检查显著提高乳腺癌预测效能,但应警惕高级别(3级)肿瘤的诊断复杂性。文献表明此类肿瘤因不典型影像特征(如边界模糊、无钙化或异质强化)可能与良性病变重叠,且缺乏典型触诊特征可能进一步增加首次诊断的误诊风险。乳腺手术史也被发现是良恶性病变的显著差异因素,文献报道良恶性乳腺肿瘤手术史均可增加同侧或对侧乳腺癌风险,已成为某些风险预测模型的预测因子之一。母乳喂养对乳腺癌的保护作用已获公认,既往研究证明哺乳可降低腔面型和三阴性乳腺癌风险,但无法降低HER2阳性乳腺癌风险。
研究的局限性包括单中心回顾性设计带来的选择偏倚,样本量有限需后续多中心前瞻性研究验证;仅纳入乳腺X线二维图像而未包括断层图像或其他影像数据,限制了结果应用的广度。未来工作将进一步整合术中病理特征(如Ki-67指数或分子分型),构建覆盖全诊断过程的多模态决策系统,以更精确地指导个体化治疗。
总结而言,本研究开发的基于影像组学和临床特征的融合列线图模型在预测BI-RADS 4A类病灶良恶性进展方面表现出良好潜力,有望为4A类病灶的临床风险评估提供更精准的辅助工具,从而减少不必要的手术,提高患者生活质量。
生物通微信公众号
知名企业招聘