《Journal of Translational Medicine》:CHI3L1: a key driver in gastritis-to-cancer transformation
编辑推荐:
为解决胃癌(GC)发病机制及早期诊断难题,研究人员开展了胃炎转癌相关研究。他们利用数据集和机器学习,构建早期诊断模型,确定 CHI3L1 为关键驱动基因。这为胃癌早期诊断和治疗提供了新方向和潜在靶点。
在全球范围内,胃癌(Gastric Cancer,GC)都是一种极具杀伤力的恶性肿瘤。它的发病过程犹如一场复杂的 “接力赛”,从慢性非萎缩性胃炎开始,逐步发展为慢性萎缩性胃炎、肠上皮化生、不典型增生,最终演变成胃癌。这一过程中,众多 “选手”(基因和细胞变化)参与其中,然而目前人们对从胃炎发展到胃癌的主要驱动基因和基本病理机制却知之甚少。与此同时,现有的胃癌早期诊断方法也存在局限性,比如内镜筛查虽然能发现早期病变,但因其具有侵入性,让很多人对它望而却步。所以,寻找新的早期诊断生物标志物和深入了解胃癌的发病机制迫在眉睫。
在这样的背景下,北京中医药大学的研究人员勇挑重担,开展了一项意义重大的研究。他们试图揭开胃炎向胃癌转变过程中的神秘面纱,找到关键的驱动基因,为胃癌的早期诊断和治疗开辟新道路。最终,他们发现 CHI3L1 是胃炎转癌进程中的关键基因,这一发现意义非凡,为胃癌的防治带来了新的希望。该研究成果发表在《Journal of Translational Medicine》上。
研究人员在这项研究中用到了多个关键技术方法。首先,从公共数据库(如 Gene Expression Omnibus Database,GEO)获取胃炎转癌和胃癌相关的基因表达谱数据,包括 GSE55696、GSE66229 和 GSE79973 等数据集。然后,运用加权基因共表达网络分析(Weighted Gene Co-Expression Network Analysis,WGCNA)和差异基因表达(Differential Gene Expression,DGE)分析等生物信息学方法筛选诊断生物标志物。还利用随机森林(Random Forest,RF)、支持向量机(Support Vector Machine,SVM)等多种机器学习算法构建胃癌诊断模型。
下面来看看具体的研究结果:
- 识别胃炎转癌的生物标志物:研究人员通过对 GC 数据集 GSE66229 进行分析,筛选出 364 个差异表达基因,同时运用 WGCNA 方法分析 GSE55696 数据集,最终确定了 12 个驱动基因(PLA2G7、CXCL1、CXCL6、CHI3L1 等)。这些基因与免疫细胞趋化反应、趋化因子活性以及癌症相关通路密切相关。
- 构建早期胃癌诊断模型:基于 4 种机器学习算法(RF、SVM、XGBoost 和 GLM)对 12 个候选基因进行分析,发现 SVM 方法构建的模型表现最佳,其残差和反向累积值最低,准确性最高(AUC = 0.98)。研究人员进一步选取了重要性得分最高的 5 个基因(CHI3L1、MMP12、CXCL6、IDO1 和 CCL20),重新评估诊断模型的效能,结果显示模型准确性优秀(AUC = 0.941)。
- 确定关键驱动基因:研究人员为每个胃炎转癌阶段构建诊断模型,通过分析残差、反向累积值和 ROC 曲线,确定 CHI3L1 是整个疾病演变过程中的核心驱动基因。在不同阶段的诊断模型中,CHI3L1 都展现出重要的诊断价值,且在胃癌前病变(Gastric Precancerous Lesions,GPL)和胃癌组织中,CHI3L1 的表达水平均高于正常组织。
- CHI3L1 相关通路及机制研究:通过对 CHI3L1 基因的富集分析和蛋白质 - 蛋白质相互作用(Protein - Protein Interaction,PPI)网络构建,发现 CHI3L1 与 Wnt/β catenin 信号通路相关。在大鼠胃癌前病变模型中,验证了 CHI3L1 及相关通路蛋白的表达变化。在细胞和类器官模型中,证实 CHI3L1 能激活 CD44-β catenin 通路,促进细胞恶性增殖和迁移,该信号通路在 GPL 类器官中高度活跃。
- CHI3L1 分泌细胞类型及预后分析:利用单细胞 RNA 测序和多重免疫组化技术,研究人员发现 CHI3L1 主要由成纤维细胞和树突状细胞分泌。对胃癌患者生存结果的分析表明,CHI3L1 高表达与患者预后不良相关,低表达患者的总生存率(Overall Survival,OS)、无病生存率(Disease-Free Survival,DFS)和疾病特异性生存率(Disease-Specific Survival,DSS)均优于高表达患者。
研究结论和讨论部分进一步强调了研究的重要意义。CHI3L1 作为胃炎转癌的关键基因,通过激活 CD44-β catenin-c-Myc 通路促进癌细胞的恶性行为。检测血清或体液中的 CHI3L1 水平,有望改善早期胃癌的检测和干预。抑制 CHI3L1 的分泌或阻断其下游信号通路,可能是预防胃癌恶性进展的有效策略。不过,目前基于机器学习的核心基因获取算法还有提升空间,未来研究可进一步优化算法,整合多种模型,提高诊断系统的准确性,从而更好地服务于胃癌的早期诊断和治疗,为更多患者带来希望。
下载安捷伦电子书《通过细胞代谢揭示新的药物靶点》探索如何通过代谢分析促进您的药物发现研究
10x Genomics新品Visium HD 开启单细胞分辨率的全转录组空间分析!
欢迎下载Twist《不断变化的CRISPR筛选格局》电子书
单细胞测序入门大讲堂 - 深入了解从第一个单细胞实验设计到数据质控与可视化解析
下载《细胞内蛋白质互作分析方法电子书》