综述:基于深度学习的脑肿瘤分割与检测的系统性回顾:过往的研究成果、当前的技术以及未来的发展趋势
《Computational and Theoretical Chemistry》:A Systematic Review on Deep Learning based Brain Tumor Segmentation and Detection using MRI: Past Insights, Present Techniques and Future Trends
【字体:
大
中
小
】
时间:2025年10月03日
来源:Computational and Theoretical Chemistry 2.8
编辑推荐:
结核分枝杆菌耐药性预测研究利用集成机器学习模型(投票、Bagging、Stacking)分析gyrA、gyrB、inhA、katG、pncA和rpoB六种基因的序列及结构特征,评估对四大抗结核药物耐药性的预测性能,发现模型在特定基因上准确率差异显著(66%-95.6%),但数据规模和多样性不足需进一步验证。
A.T Subalakshmi|Arundhati Mahesh
摘要
结核病(TB)仍然是一个全球性的健康危机,2023年有1080万新病例和125万人死亡。耐药性结核病的出现使治疗变得更加复杂,而传统的诊断方法在速度、成本和准确性方面存在局限性。本研究探讨了利用机器学习(ML)模型通过基因组变异来预测耐药性的方法,提供了一种更快、更全面的解决方案。
我们汇编了一个包含来自TBDReaMDB、GMTV、WHO和CARD等数据库的与耐药表型相关的变异和突变的综合数据集。对于每个突变,我们提取了基于序列的特征(例如,理化性质变化、Provean评分)和基于结构的特征(例如,疏水性、灵活性、可访问表面积)。我们评估了集成ML模型(堆叠、装袋和投票分类器)预测关键抗结核药物(氟喹诺酮类、利福平、异烟肼和吡嗪酰胺)耐药性的能力。
研究结果表明,这些模型在六个结核病耐药基因(gyrA、gyrB、inhA、katG、rpoB、pncA)上的表现各不相同,准确率从66%(gyrA堆叠)到95.6%(rpoB投票)不等,ROC值从0.69(gyrA装袋)到0.92(pncA堆叠)不等。装袋模型在gyrA、gyrB和rpoB上的表现最好,而堆叠分类器在inhA上的表现也不错。投票分类器在katG和pncA基因上的表现最为出色。选择表现最好的模型强调了针对特定基因的策略以最大化耐药性预测的准确性。
这项研究表明,由全面特征集支持的特定基因集成模型可以提供关于M. tuberculosis耐药性的有价值预测。尽管结果很有前景,但这些发现仍处于概念验证阶段,需要在更大、更多样化的临床数据集上进行进一步验证后才能应用于临床实践。
章节摘录
引言
结核病(TB)是一种由Mycobacterium tuberculosis引起的传染病,主要影响肺部。根据世界卫生组织2023年的数据,该疾病仍然是全球主要的健康威胁,2023年报告了1080万新病例和125万人死亡。耐药菌株的出现,包括多重耐药结核病(MDR-TB)和广泛耐药结核病(XDR-TB),进一步增加了控制结核病的难度,导致治疗时间更长、费用更高。
结果
准确率量化了正确分类样本的比例。精确度评估了阳性预测的准确性,而召回率检查了检测所有阳性病例的能力。F1分数则在精确度和召回率之间提供了平衡。详细的结果见表3,其中包含了每个分类器和类别的准确率、精确度和召回率以及F1分数。
ROC(接收者操作特征)曲线是分类器区分不同类别能力的图形表示。
讨论
本研究评估并比较了三种集成学习技术(投票、装袋和堆叠分类器)在Mycobacterium tuberculosis的六个关键耐药相关基因(gyrA、gyrB、inhA、katG、pncA和rpoB)上的表现。这些基因对于识别对氟喹诺酮类、异烟肼、吡嗪酰胺和利福平的耐药性至关重要,因此准确且泛化的模型对于快速诊断和治疗计划非常重要。
本研究使用了基于序列的特征
局限性
本研究的局限性在于每个基因可用的数据集规模较小且不平衡,某些耐药标签(如katG和pncA)是基于ΔΔG预测而非直接表型验证得出的。此外,依赖于一些过时的策划数据库也可能限制数据的多样性和泛化能力。模型性能评估采用了80:20的分割方式,并没有进行正式的统计测试来比较各种分类器,因此应对结果进行适当解释。
结论
本研究证明了集成机器学习算法在预测Mycobacterium tuberculosis六个重要基因的耐药性方面的有效性。通过比较投票、装袋和堆叠分类器,发现每种技术根据基因集的不同性质具有相对优势。在耐药模式明确的基因(如gyrA和rpoB)中,装袋分类器的效果非常好;而在katG和pncA基因中,投票分类器的泛化能力更强。
未来方向
未来的研究应通过扩展针对不同Mycobacterium tuberculosis谱系的突变数据集来提高耐药性预测模型的稳健性和临床实用性。扩大数据集将有助于提高分类器的泛化能力,并识别出罕见但具有临床意义的突变。此外,通过整合结构、功能和进化基因信息来改进特征工程也有助于进一步提升模型性能。CRediT作者贡献声明
A.T Subalakshmi: 方法论、数据整理。Arundhati Mahesh: 写作——审阅与编辑、监督。
写作过程中使用生成式AI和AI辅助技术的声明
在准备本文的过程中,作者使用了ChatGPT和Grok工具来提高手稿的清晰度和连贯性。使用这些工具/服务后,作者根据需要对内容进行了审阅和编辑,并对发表文章的内容负全责。
利益冲突声明
作者声明没有已知的财务利益冲突或个人关系可能影响本文的研究结果。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号