
-
生物通官微
陪你抓住生命科技
跳动的脉搏
综述:人工智能整合多组学在乳腺癌中的作用
【字体: 大 中 小 】 时间:2025年09月21日 来源:Revista de Senología y Patología Mamaria 0.3
编辑推荐:
本综述系统探讨了人工智能(AI)技术在整合多组学数据(如基因组、转录组、蛋白组等)于乳腺癌(BC)精准医疗中的应用。文章重点分析了机器学习(ML)与深度学习(DL)模型在解读复杂遗传数据、预测患者预后及个性化治疗(如PARPi靶向治疗)中的潜力,同时强调多组学整合对克服肿瘤异质性和优化临床决策的重要性。
在精准肿瘤学时代,基因组检测已成为乳腺癌管理的关键环节。尽管胚系(germline)突变、体细胞突变及基因表达检测等技术已广泛应用于临床,但基因组数据解读与海量肿瘤信息整合仍面临挑战。人工智能(AI),尤其是机器学习(ML)和深度学习(DL)模型,能够解析复杂遗传(genetic)数据、预测患者结局并个性化制定治疗方案。本文综述了AI整合多组学在乳腺癌领域的当前作用。
基因组检测是乳腺癌(BC)患者管理的基石,涵盖从胚系致病突变筛查到体细胞“驱动”突变靶点识别等多重用途。胚系检测有助于识别遗传性癌症风险,而体细胞检测聚焦获得性突变,两者共同优化预后评估并指导靶向治疗。然而,乳腺癌是一种复杂疾病,常由多基因组特征而非单一驱动突变主导。尽管DNA变异具有临床价值,但精准预后与治疗仍需补充RNA表达分析等生物学信息。多基因RNA表达检测可通过分子内在分型提供预后与预测信息,但随着组学技术(如基因组、表观基因组、转录组、蛋白组和代谢组)的不断发展,整合多组学方法已成为全面解析癌症生物系统复杂性的必要手段。
约5–10%的乳腺癌患者携带遗传性胚系突变(如BRCA1/BRCA2),其识别不仅影响手术决策,更可指导聚腺苷二磷酸核糖聚合酶抑制剂(PARPi)等靶向治疗。类似地,晚期激素受体阳性(HR+)患者中,PI3K/AKT通路突变或ESR1突变的检测能导向选择性雌激素受体降解剂(SERDs)等精准治疗。基因表达平台(GEPs)如21基因复发评分(Oncotype)或PAM50可辅助早期患者化疗或延长内分泌治疗选择。此外,免疫组化(IHC)等病理学检测仍是乳腺癌初评的核心。
随着新技术与药物获批,生物标志物需求日益增长。单一组学仅能提供肿瘤生物学的局部视角,因此需整合多组学甚至临床非结构化数据,以实现真正个性化癌症医疗。近年来,人工智能(AI)与基因组学的融合变革了乳腺癌诊疗。机器学习(ML)通过组合既定特征进行预测(如基于年龄、肿瘤大小和生物标志物的复发风险),而深度学习(DL)作为ML的高级分支,通过多层神经网络自动从大数据中学习模式,无需人工定义特征,为癌症研究与治疗带来新机遇。
新型AI技术推动了从传统“浅层”ML向“深度”学习的转变。DL模拟人脑工作方式,通过多层神经网络自动识别数据模式并决策。其分层处理机制从简单特征提取逐步升级至复杂模式识别,依托大规模数据训练提升预测精度,尤其在处理多组学整合任务中展现强大潜力。
基于DL的复杂模式识别能力,AI在多组学数据整合中发挥核心作用,提供肿瘤生物学及其演化的全局视角。通过融合基因组(如DNA修复突变或APOBEC签名)、基因表达和肿瘤微环境(TME)特征,AI模型无需人工特征优先即可生成预测洞察。多项AI/DL模型已在乳腺癌个性化精准医疗中展现应用前景,例如:
HER2DX assay:通过ML整合临床病理与基因组变量,为早期HER2+患者提供长期预后和病理完全缓解(pCR)概率双评分,指导抗HER2治疗(如曲妥珠单抗、帕妥珠单抗或T-DM1)的降级或升级。
TNBCDX:针对早期三阴性乳腺癌的基因组测试,整合临床变量与肿瘤免疫相关因子,通过ML输出风险评分和pCR评分,目前正处于验证与标准化阶段。
DNADX:基于ctDNA的ML多基因签名分析,可捕获肿瘤细胞增殖、ER通路激活、RB-LOH状态、TP53激活状态及DNA基础内在分型等表型特征,预测内分泌治疗(ET)联合CDK4/6抑制剂后的不良结局。
这些工具彰显了AI在融合临床与基因组数据以优化患者护理方面的价值。尽管现有方法推进了治疗个性化,但其依赖预设特征的限制仍仅提供肿瘤生物学的局部视图。为全面捕捉乳腺癌异质性,需采用DL等整合策略分析海量非结构化数据,挖掘隐藏模式。
尽管新技术与治疗策略前景广阔,仍面临多重挑战:
数据依赖与标准化:AI性能取决于数据质量与完整性,需确保数据集多样性与标准化以避免偏差。
伦理与安全:隐私保护、责任监管及算法透明度需同步完善。
临床整合:AI工具需通过随机试验验证并适应动态临床环境,同时降低计算资源门槛以提升可及性。
多组学与AI的协同进化将推动乳腺癌医疗向动态、个性化及预防性模式转变。
肿瘤学进展伴随经济负担加剧,对资源有限的医疗系统构成压力。多组学数据整合使治疗策略定制成为必然。基因组学与转录组学的融合增强了对肿瘤生物学的理解,减少过度治疗并优化资源利用,为个性化、经济高效的医疗铺平道路。AI正从依赖预设特征的ML模型转向DL驱动全面数据整合,通过自动模式识别支持临床决策,最终实现乳腺癌精准医疗的范式转型。
本综述未接收外部资金。
本研究基于已发表文献合成,未直接涉及人类受试者,因此无需特定伦理审批。
RGB、BW与ES共同撰写文稿,所有作者参与规划与修订。
作者声明无相关利益冲突。
生物通微信公众号
知名企业招聘