基于信息熵与轮盘赌选择的双重剪枝方法在乳腺癌诊断不平衡数据中的应用研究

【字体: 时间:2025年09月21日 来源:Knowledge-Based Systems 7.6

编辑推荐:

  本文提出RE-SMOTEBoost方法,通过结合信息熵(Entropy)和轮盘赌选择(Roulette Wheel Selection)实现双重剪枝(Double Pruning),有效解决医学数据中的类别不平衡(Class Imbalance)和重叠问题。该方法在边界区域生成高质量合成样本,提升分类器性能,实验显示准确率提高3.22%,方差降低88.8%,为乳腺癌诊断提供可靠解决方案。

  

亮点

• 提出RE-SMOTEBoost方法,通过双重剪枝(Double Pruning)同步处理多数类与少数类样本,结合信息熵(Entropy)评估与轮盘赌选择(Roulette Wheel Selection),提升边界样本生成质量。

• 引入双重正则化惩罚(Double Regularization Penalty)控制合成样本位置,避免重叠并增强决策边界捕捉能力。

• 集成熵过滤器(Entropy Filter)剔除噪声样本,保留高信息量数据,显著提升分类器鲁棒性。

• 实验证明该方法在极端不平衡场景下仍保持优异性能,准确率提升3.22%,方差降低88.8%。

结论

本研究提出了一种新型双重剪枝方法,有效解决类别不平衡(Class Imbalance)与数据重叠的联合挑战。通过并行剪枝、熵驱动样本筛选与边界导向合成,显著提升了分类模型的性能与可靠性。在多样化数据集上的实验验证了该方法的通用性与有效性,为医学诊断(如乳腺癌检测)提供了可扩展且高效的解决方案。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号