# 量化和解读肿瘤微环境中具有生物学意义的空间特征研究进展
肿瘤的发生、发展是一个极其复杂的过程,受到多种因素的共同调控。肿瘤微环境(Tumor Microenvironment,TME)作为肿瘤细胞生长的 “土壤”,在肿瘤的发展进程中扮演着关键角色。近年来,随着空间分析技术的飞速发展,肿瘤微环境中的各类空间特征逐渐被揭示,为深入理解肿瘤的生物学机制和开发更有效的治疗策略提供了新的视角。本文将围绕肿瘤微环境空间特征的研究进展展开详细阐述。
一、肿瘤微环境空间特征研究的必要性
TME 是一个高度复杂且结构化的生态系统,由癌细胞、多种非恶性细胞以及细胞外基质(Extracellular Matrix,ECM)等共同构成。这些组成部分之间通过复杂的空间相互作用,深刻影响着肿瘤的生长、转移以及对治疗的反应。
传统的单细胞技术虽然能够解析 TME 的细胞组成,但在组织解离过程中丢失了关键的空间信息,无法全面揭示细胞间的相互作用。而对 TME 中细胞的空间定位、生物标志物的空间表达模式、相邻细胞间的相互作用以及细胞群落的组成进行深入研究,则能够更全面地量化 TME,为肿瘤的研究和治疗提供至关重要的信息。尤其在肿瘤侵袭前沿等区域,不同的空间特征与肿瘤的进展密切相关。此外,肿瘤内部不同亚区域的细胞组成和分子功能存在差异,特定细胞类型的空间聚集会导致肿瘤内异质性,进而影响患者的预后。对于免疫细胞而言,其空间组织和浸润模式对于理解组织行为和免疫治疗反应至关重要,免疫表型可作为肿瘤复发和免疫治疗反应的预测指标。然而,目前 TME 的空间特征研究仍处于起步阶段,缺乏清晰的定义和系统的框架。
二、空间组学数据的获取与预处理
(一)空间组学技术平台
空间蛋白质组学平台 :原位蛋白质组学主要通过基于抗体的靶向方法实现。多种用于多重蛋白质组学的技术,其原理大多是基于类似显微镜检测的抗体染色实验流程。这些技术的差异主要体现在与抗体连接的基团(如荧光团、酶、DNA 寡核苷酸和金属同位素等)以及检测方式(如质谱、光谱、荧光或显色剂沉积等)上。例如,基于抗体偶联条形码和荧光杂交核苷酸的循环荧光成像技术应用较为广泛,其中 CODEX(CODetection by indexing)技术可同时检测 100 多种抗体。成像质谱细胞术(Imaging Mass Cytometry,IMC)和多重离子束成像(Multiplexed Ion Beam Imaging,MIBI)技术则是将不同抗体与金属结合,通过质谱成像进行检测,二者在质量测量方式和分辨率上有所不同,且能以高信噪比常规量化约 50 种不同物质。此外,质谱成像技术还可用于表征小生物分子的空间代谢组,但由于样本制备和技术限制,难以与其他空间基因组、转录组或蛋白质组分析在同一切片上进行。
空间转录组学平台 :组合荧光原位杂交(Fluorescence In Situ Hybridization,FISH)结合单分子成像技术可对组织特定区域的 mRNA 分子进行计数。原位测序(In Situ Sequencing,ISS)技术是 FISH 的衍生技术,其中靶向 ISS 能够精准识别特定 RNA 分子,非靶向 ISS 则无需预先设计探针组,可测量剪接异构体、突变和整个转录组。近年来,出现了多种商业化的单细胞分辨率的空间转录组分析平台,如基于单分子荧光原位杂交(Single-Molecule Fluorescence In Situ Hybridization,smFISH)的 NanoString CosMx 平台、利用多重误差稳健荧光原位杂交(Multiplexed Error-Robust Fluorescence In Situ Hybridization,MERFISH)的 Vizgen MERSCOPE 平台以及 10X Genomics Xenium 平台等,这些技术还能同时对少量到数十种蛋白质进行成像分析。另外,一些空间条形码技术可通过固定在载玻片上的探针捕获大量样本的整个转录组,不同技术的空间分辨率有所差异。DBiT-seq 技术则利用基于微流控的条形码和图案化连接,高效捕获整个转录组和数十种蛋白质,分辨率可达 10μm。新兴的 Slide-tags 技术通过已知位置的 DNA 条形码珠子分离单细胞并保留空间条形码信息,便于进行多模态分析。
空间基因组学平台 :许多用于多重原位杂交的方法经改进后可用于同时识别大量染色体位点。MERFISH 和 seqFISH 技术能够在约 1000 个位点的规模上区分基因组位点,广泛表征从亚结构域到跨染色体相互作用的染色质特征。ISS 技术也被应用于染色体组织的定位和追踪,如 OligoFISSEQ 技术将 DNA FISH 探针与条形码区域杂交到不同染色体位点,再通过 ISS 化学方法或探针杂交读出条形码信息。还有非靶向原位基因组测序方法可标记单细胞中的随机基因组位点,并且 DBiT-seq 技术进一步扩展到染色质可及性和组蛋白修饰的表观基因组分析领域。
(二)原始数据预处理
由于基于成像和基于测序的空间技术产生的原始数据类型不同,其预处理流程也有所差异。
基于成像的数据预处理 :基于成像的空间技术(如荧光成像或质谱成像)产生的原始数据是描绘蛋白质或 RNA 转录本空间表达模式的多维图像,数据量庞大且易出错。首先需要进行质量控制和数据校正,包括去除噪声、确定点检测阈值以及成像轮次间的信号配准等。此外,基于图像的数据包含像素信息,需要使用各种成熟方法将其分割成单个细胞,后续准确注释细胞类型也是一大挑战。对于 CODEX 数据,研究人员已对不同的数据归一化和聚类策略进行了比较,并开发了新的计算流程用于细胞亚型的注释。鉴于各平台和实验设置的参数不同,研究人员使用商业或预优化协议生成的预处理数据进行分析更为可行。
基于测序的数据预处理 :基于测序的空间技术产生的原始数据易受多种噪声源影响,且常存在信号丢失问题。在预处理阶段,需要重点关注噪声处理、数据清洗和归一化操作,可通过考虑 mRNA 捕获灵敏度和 mRNA 检测空间精度等重要质量指标来实现。此外,可采用插值技术处理缺失的基因表达值。当空间分辨率低于单细胞水平时,进行细胞类型特异性分析会变得困难,研究人员可利用解离的单细胞 RNA 数据,通过反卷积算法估计每个空间位置不同细胞类型的相对比例。
经过预处理后,原始空间数据转化为带有空间坐标信息的细胞 / 点与分子矩阵,为后续挖掘有意义的空间特征奠定了基础。
三、多尺度空间特征
对预处理后的数据进行空间统计分析,可进一步挖掘分子和细胞水平的空间特征。当这些通过计算定义的特征呈现出特定的空间分布、细胞或分子组成以及在执行生物学功能中发挥特定作用时,可将其称为 “空间特征”。根据特征复杂性,空间特征可分为单变量、双变量和高阶三个尺度,它们从不同角度增强了我们对肿瘤生物学的理解。
(一)单变量分布模式
单变量空间分析聚焦于单个变量的空间分布,不考虑其与其他变量的关系。
分子水平 :研究单个基因或蛋白质空间表达偏好的常用方法是利用空间采样技术或手动划定不同空间区域进行比较分析。例如,通过激光捕获显微切割(Laser Capture Microdissection,LCM)技术分离不同位置的基质区域并进行质谱分析,发现与 ECM 重塑相关的蛋白质(如 COL11A1 和 POSTN)在肿瘤基质中显著上调。利用 GeoMx 平台对早期结直肠癌(Colorectal Cancer,CRC)患者不同组织学区域进行空间转录组学分析,发现先天免疫感应等基因特征在 CRC 转化区域早期已上调,髓系细胞和免疫抑制性巨噬细胞的浸润从正常组织到发育异常组织再到 CRC 逐渐增加。随着空间实验技术的发展,研究人员开始关注连续梯度变化。在肿瘤进展过程中,组织功能紊乱会呈现特定的分子梯度。例如,肝癌中缺氧相关信号从肿瘤周边区域到肿瘤边缘突然降低,而从肿瘤边缘到肿瘤核心则显著增加;导管癌的光学代谢成像揭示了细胞代谢的空间梯度,反映了肿瘤细胞的代谢异质性。通过更先进的计算方法,能够检测到具有表达梯度的空间可变基因(Spatially Variable Genes,SVGs),如在胶质母细胞瘤中,空间转录组分析发现缺氧反应基因(如 VEGFA)和糖酵解代谢基因(如 SLC2A1)的表达梯度随着与坏死区域距离的增加而降低,而与氧依赖途径和 T 细胞受体信号相关的基因则在坏死区域被排除。
细胞水平 :细胞亚型的空间定位通常不均匀。恶性细胞亚型在特定空间区域富集,非实质细胞(如癌相关成纤维细胞(Cancer-Associated Fibroblasts,CAFs)和 T 细胞)也具有空间分布偏好。例如,肌成纤维细胞样 CAFs(myofibroblastic CAFs,mCAFs)常富集于侵袭性癌区域或在肿瘤边界充当免疫屏障,而免疫调节性 CAFs(immunomodulatory CAFs,iCAFs)则分散在侵袭性癌、基质和肿瘤浸润淋巴细胞(Tumor-Infiltrating Lymphocytes,TILs)聚集区域。T 细胞的空间分布和整体免疫浸润是关键特征,泛癌分析揭示了 TILs 的四种不同空间模式。在不同亚型的肿瘤中,CD8+ T 细胞的定位存在差异,如在 Epstein-Barr 病毒阳性的胃食管腺癌(Gastroesophageal Adenocarcinoma,GEA)中,CD8+ T 细胞主要位于肿瘤中心,而在染色体不稳定的 GEA 中,这些细胞在浸润边缘更为丰富。此外,细胞的形态特征(如核取向和染色质强度)也表现出空间异质性,这些特征可通过计算全切片图像中不同空间斑块的图像特征来揭示,具有独特形态特征的区域通常意味着存在多种潜在分子梯度和独特的临床风险。
(二)双变量空间关系
细胞和基因在复杂的通讯网络中发挥作用,双变量关系主要研究两种不同生物元素在空间上的相互关系,包括细胞 - 细胞回避或共定位、配体 - 受体(Ligand-Receptor,LR)对的共表达以及空间梯度相关性等。
细胞间空间关系 :原位映射细胞亚型可揭示它们之间空间关系的规律。空间回避现象通常发生在功能不同的细胞亚型之间,例如 iCAFs 和 mCAFs 这两种常见的 CAF 亚型,iCAFs 高表达趋化因子,主要在免疫相关功能中发挥作用,mCAFs 高表达 ECM 重塑基因,参与血管生成和 ECM 重塑,泛癌空间研究观察到 iCAFs 和 mCAFs 高密度区域在空间上相互排斥。而空间共定位往往表明组织功能存在潜在的相互作用,如在 CRC 和肝细胞癌(Hepatocellular Carcinoma,HCC)中,成纤维细胞和 SPP1+ 巨噬细胞在肿瘤边界共定位,促进免疫排斥结构的形成,限制免疫细胞浸润,这类患者从抗 PD-L1 治疗中获益较少。
基因空间共表达 :通过计算不同空间位置数据的皮尔逊相关系数,可评估基因的共表达关系。结合空间平滑和层次聚类分析,能够发现功能基因模块。贝叶斯方法(如 SPATA)可用于表征基因表达的空间重叠。若要推断基因对之间的因果关系,则需要使用监督模型(如 GCNG),该模型利用已知的配体 - 受体相互作用作为训练数据。
细胞间通讯 :目前理解细胞间通讯(Cell-Cell Interactions,CCIs)在空间背景下的机制变得愈发重要。大多数 CCIs 推断方法聚焦于特定空间范围内配体和受体的共表达,并结合距离约束或权重。一些工具(如 Giotto 和 SpaTalk)需要预先注释细胞类型,SpaTalk 还考虑了配体 - 受体 - 靶标的共表达;而 stLearn 和 SOAPy 等工具无需细胞类型注释,通过基于邻域表达计算非定向配体 - 受体得分,在单细胞或斑点水平提供 CCIs 结果。然而,这些工具使用的置换检验计算成本较高。SpatialDM 引入了零分布的解析推导,提高了分析数百万细胞的可扩展性。此外,一些新方法(如 COMMOT)更新了生物学假设,考虑了不同配体和受体之间的竞争;DeepLinc 和 Spacia 则不依赖预定义的配体 - 受体数据库,直接从空间数据中学习细胞间相互作用的潜在表示,对不完善或不完整的空间转录组数据集具有重要意义。
(三)高阶结构
超越成对关系的表征,多个变量可形成高阶组织结构。在分子层面,表现为具有相似空间表达模式的多个基因模块;在细胞层面,则表现为空间上连续的区域,即 “细胞群落”“生态位” 或 “空间域”。
典型生态位示例 :三级淋巴结构(Tertiary Lymphoid Structures,TLS)是许多癌症的预后指标,它是由免疫细胞聚集形成的结构,类似于二级淋巴器官中的淋巴滤泡,内部为 CD20+ B 细胞,周围环绕着 CD3+ T 细胞。TLS 中还包含多种树突状细胞(Dendritic Cells,DCs)和巨噬细胞等。血管生成生态位围绕血管形成,富含内皮细胞和成纤维细胞,成纤维细胞分泌的血管内皮生长因子(Vascular Endothelial Growth Factor,VEGF)和血小板衍生生长因子(Platelet-Derived Growth Factor,PDGF)可促进内皮细胞的增殖和迁移,在肺癌脑转移患者中,该生态位还包含周细胞和免疫细胞等。
其他特殊生态位 :在多种癌症中还发现了其他特殊的生态位。例如,在胶质瘤的 CODEX 数据中观察到增殖性簇,富含增殖的少突胶质细胞前体样细胞和少突胶质细胞样细胞,周围被分化程度较高的非增殖性星形胶质细胞样细胞包围;在胰腺导管腺癌(Pancreatic Ductal Adenocarcinoma,PDAC)中,通过 LCM 分离的导管区域可分为三种主要的形态和功能亚型;在原发性三阴性乳腺癌(Triple-Negative Breast Cancer,TNBC)中存在静止癌细胞生态位,癌细胞激活 HIF1α,周围免疫细胞浸润较少且 T 细胞耗竭;肿瘤前沿的纤维化生态位由成纤维细胞组成,可阻止免疫细胞浸润。此外,通过聚类邻域窗口或图神经网络(Graph Neural Networks,GNNs)等方法,还发现了富含特定免疫细胞群体的免疫生态位,不同癌症中的免疫生态位组成有所差异,且部分免疫生态位由抑制或功能失调的免疫细胞构成。
四、空间特征的计算方法
为从多维空间数据中提取有意义的空间特征,研究人员开发了多种计算方法,主要包括空间统计方法、基于图的方法和机器学习技术。
(一)单变量分布模式计算方法
分析单变量空间分布时,通常需要根据病理特征或分割方法定义感兴趣区域(Regions of Interest,ROIs)或空间域,然后直接比较这些预定义区域的差异分布模式。对于连续变量(如基因表达值),常用 t 检验或 Wilcoxon 检验来确定区域间是否存在统计学显著差异;对于计数数据(如细胞数量),卡方检验或 Fisher 精确检验更为合适。对于涉及相关数据的更复杂比较,可使用线性混合模型,将个体变异或空间自相关效应视为随机效应。
经典统计指标(如 Moran’s I、Geary’s C 和 Getis-Ord Gi)最初用于测量变量与位置之间的空间自相关,它们从不同方面捕捉空间依赖性,且统计特性各异。为解决空间过程异质性导致的全局指标结论不可靠问题,引入了局部空间自相关统计量(如局部 Moran’s I、局部 Geary’s C 和局部 Getis-Ord Gi),这些局部指标可计算每个空间位置的自相关值,并通过显著性图等技术可视化空间模式,有助于更细致地理解空间异质性。此外,Ripley’s 函数(包括 F、L 和 G 函数)可提供空间点模式在不同空间尺度上的密度和聚类特征信息。
为检测 SVGs,研究人员开发了多种方法。Trendsceek 使用标记点过程和置换检验,该非参数方法灵活性高,但对于大型数据集计算成本较高;SpatialDE 采用参数化方法,将基因表达建模为多元正态分布,提高了计算效率,但对空间数据中的均值 - 方差依赖性鲁棒性较差;SPARK 直接对原始计数数据使用过分散泊松分布进行建模,优化后的 SPARK-X 避免了对计数分布的假设,采用非参数协方差检验,提高了算法稳定性和对多种空间转录组技术的适用性;STAMarker 利用图注意力自动编码器捕捉基因间的相互依赖关系,通过基于分类器的空间域预测识别 SVGs,但计算效率有所降低。不同的 SVG 检测方法对同一数据集可能产生差异较大的结果,用户在选择方法时需谨慎评估其潜在假设,并考虑数据特征,同时遵循推荐的数据预处理流程进行基因过滤、归一化等操作。
(二)双变量空间关系计算方法
细胞 - 细胞共定位分析 :常用的方法是通过置换检验检查细胞 - 细胞连接,以揭示复杂组织环境中细胞类型之间的空间关系。基于置换的方法(如 histoCAT)通过将观察数据与零分布进行比较,识别非随机共定位模式。细胞 - 细胞连接可基于邻域半径简单定义,也可使用更复杂的空间关系(如 Delaunay 三角剖分),Giotto 和 Squidpy 等计算工具箱中采用了此类技术。为评估细胞类型的浸润情况,G-cross 函数通过计算群体间的空间距离分布,用曲线下面积(Area Under the
继续,如果完毕请记得以】结束 为评估细胞类型的浸润情况,G-cross 函数通过计算群体间的空间距离分布,用曲线下面积(Area Under the Curve,AUC)表示特定细胞类型在给定空间环境中的浸润水平。SPIAT 则结合了一套全面的互补指标,包括基于邻近度的测量、归一化混合得分和 Ripley’s 函数等,能够对多种空间模式进行稳健表征,如识别肿瘤簇周围的免疫细胞 “环” 或量化免疫细胞浸润水平。 2. 基因空间共表达分析 :提取不同空间位置的数据后,可计算皮尔逊相关系数评估基因共表达关系,还可结合空间平滑和层次聚类分析发现功能基因模块,如 Giotto 中的方法。贝叶斯方法(如 SPATA)可用于表征基因表达的空间重叠。若要推断基因对之间的因果关系,需使用监督模型(如 GCNG),其利用已知的配体 - 受体相互作用作为训练数据。 3. 空间背景下的细胞通讯分析 :目前理解细胞间通讯(Cell-Cell Interactions,CCIs)在空间背景下的机制变得愈发重要。大多数 CCIs 推断方法聚焦于特定空间范围内配体和受体的共表达,并结合距离约束或权重。一些工具(如 Giotto 和 SpaTalk)需要预先注释细胞类型,SpaTalk 还考虑了配体 - 受体 - 靶标的共表达;而 stLearn 和 SOAPy 等工具无需细胞类型注释,通过基于邻域表达计算非定向配体 - 受体得分,在单细胞或斑点水平提供 CCIs 结果。然而,这些工具使用的置换检验计算成本较高。SpatialDM 引入了零分布的解析推导,提高了分析数百万细胞的可扩展性。此外,一些新方法(如 COMMOT)更新了生物学假设,考虑了不同配体和受体之间的竞争;DeepLinc 和 Spacia 则不依赖预定义的配体 - 受体数据库,直接从空间数据中学习细胞间相互作用的潜在表示,对不完善或不完整的空间转录组数据集具有重要意义。
(三)高阶结构计算方法
空间组学技术的进步使得同时检测多个分子在空间中的表达成为可能,从而能够识别更复杂的组织模式或区域(即 “空间域”)。传统聚类方法(如 ScanPy 中的 Louvain 和 Leiden 算法)虽能有效区分细胞类型差异,但忽略了空间连续性。目前,识别空间域的常用方法可分为随机场模型、基于图神经网络(Graph Neural Networks,GNNs)的深度学习方法和其他方法。
随机场模型 :以隐藏马尔可夫随机场(Hidden Markov Random Field,HMRF)模型为例,其在 Giotto 和 smfishHmrf 等工具中得到应用,将空间域识别问题转化为对隐藏空间域标签的条件概率分布估计任务。BayesSpace 采用全贝叶斯统计方法,结合基因表达矩阵的低维表示对空间聚类进行建模,并引入 Potts 马尔可夫随机场作为空间先验,促使相邻位置属于同一空间域簇。BASS 同样利用 Potts 模型,增加了中间层来明确建模每个空间域内的细胞类型组成,可将空间域定义为具有独特细胞类型特征的区域,还能对同一解剖区域的多个组织切片测量的空间转录组数据进行整合分析,提高空间域识别的准确性。
深度学习方法(主要基于 GNNs) :GNNs 能够对生物数据中的空间依赖性进行建模,不同方法的关键差异在于学习捕获潜在空间结构的低维潜在嵌入的方式。SpaGCN 和 SpaceFlow 在整合基因表达数据和空间坐标时,提供了纳入组织学信息(如 H&E 图像)的选项,但添加 H&E 数据并不总是能提升模型性能,有时甚至会引入噪声。STAGATE 在编码器和解码器之间的中间层采用注意力机制,对具有细胞或亚细胞分辨率的空间转录组数据表现更优。NCEM 的学习任务是通过考虑生态位组成的影响来重建细胞表达矩阵,从而推断细胞 - 细胞依赖性,并将学习到的细胞表示用于空间域聚类。值得注意的是,大多数基于 GNNs 的方法依赖数百或数千个基因的表达作为输入特征,更适用于全转录组空间技术,而一些新开发的方法(如 SPACE-GM、CellCharter 和 CytoCommunity)则适用于具有较少特征的数据(如空间蛋白质组学数据)。
其他方法 :这些方法的关键创新往往体现在最终的无监督聚类步骤之前。例如,ClusterMap 通过联合聚类 RNA 分子的物理密度和基因身份,利用密度峰聚类划定核边界,避免了细胞分割;stLearn 利用空间形态基因表达对数据进行去噪和插值,但需要用户提供组织学信息(如 H&E 图像);MULTILAYER 将空间基因表达模式视为可分割的图像,构建图结构,其中节点代表过表达基因,边反映空间共表达,通过 Louvain 算法为用户提供空间相关基因及其表达模式的排名列表;UTAG 通过消息传递将用户提供的特征矩阵(分子信息或形态特征)与空间位置信息相结合,然后进行聚类,可应用于多种具有单细胞分辨率的成像数据;lisaClust 将每个分割的细胞建模为多类型泊松点过程,使用 K 和 L 函数量化细胞类型之间的空间关系,计算局部空间关联指标(Local Indicators of Spatial Association,LISA)曲线反映细胞在空间中的聚集或分散情况,最后应用聚类算法分配区域标签。
不同空间平台(如基于条形码的 10X Visium 技术和基于成像的 MERFISH 技术)在捕获特征和空间分辨率方面各有特点,现有空间域算法在不同平台上的性能存在差异。研究表明,非空间聚类方法(如 Louvain 和 Leiden)表现不佳,在 10X Visium 数据集上,GraphST、BASS 和 BayesSpace 展现出预期的层次结构和良好的聚类准确性;在 MERFISH 数据集上,BASS 和 SpaceFlow 更值得推荐。此外,下游特定分析任务也会影响方法的选择,若需要更详细的组织结构,具有良好归一化互信息(Normalized Mutual Information,NMI)和同质性分数的 SpaceFlow 在基于成像的空间数据集中可能更受青睐;若需要更平滑的边界,连续性分数更好的 BASS 可能是更好的选择,且事后空间平滑步骤可改善空间域的预测结果。
五、空间特征的临床意义
随着空间实验技术和计算方法的不断发展,越来越多的研究揭示了不同尺度下影响肿瘤发生和进展的空间特征,有助于深入理解影响肿瘤发病机制和进展的位置特异性因素,为临床治疗提供了更有价值的信息。
(一)与生存相关的空间特征
肿瘤细胞的异质性使其能够招募其他细胞形成各种局部微环境,这些微环境对患者的生存具有重要影响。在 PDAC 中,根据组织学特征(如细胞与非细胞成分的比例和基质细胞形态)可识别出三种复发性亚 TME 表型,这些亚 TME 表现出区域免疫异质性和不同的 CAFs 状态,且它们在同一肿瘤内的共存异质性与患者生存的关联比亚 TME 类型本身更为密切。在 HCC 患者中,具有完整血管和较少明显恶性特征的正常样区域与较好的预后相关,而增殖性肿瘤区域则与较差的预后相关,该区域存在潜在的不规则血管生成、高度激活的细胞周期、MYC 活性、缺氧信号和炎症信号。
对于非实质细胞的空间研究,CAF 和 T 细胞是重要类型。在非小细胞肺癌中,IMC 数据识别出 11 种空间上不同的 CAF 表型,每种表型都与不同的预后患者群体相关。在乳腺癌中,只有一种包含增殖性波形蛋白产生成纤维细胞的低凝聚力基质生态位与较差的无病生存期和总生存期独立相关。免疫表型方面,根据 CD8+ T 细胞的空间分布可定义炎症、改变和沙漠等表型,其中非小细胞肺癌患者的炎症表型是疾病特异性生存和复发时间的独立预后因素。此外,一些由多种细胞与 T 细胞共定位组成的细胞邻域(Cell Neighborhoods,CNs)也与抗肿瘤免疫和临床行为相关,不同类型的 CNs 在不同组织学亚型中的预后意义存在差异。
(二)免疫治疗的空间生物标志物
尽管先前的组学研究已发现许多免疫治疗的生物标志物,但空间测量进一步揭示了能够预测治疗效果和解释免疫逃逸机制的空间生物标志物。例如,通过多重免疫组织化学(Multiplex Immunohistochemistry,mIHC)或多重免疫荧光(Multiplex Immunofluorescence,mIF)测量肿瘤内 / 肿瘤周围区域的 CD8+ 细胞密度或 T 细胞激活的共表达标志物,可用于预测免疫治疗的反应。CODEX 技术能够更精细地量化细胞亚型的空间分布,如在接受 pembrolizumab 治疗的皮肤 T 细胞淋巴瘤患者中,应答者和非应答者的效应 PD-1+ CD4+ T 细胞和免疫抑制性 Tregs 的空间分布存在差异。
免疫细胞与癌细胞之间的空间关系也与免疫治疗反应相关。例如,通过 mIHC 或 mIF 测量 T 细胞上的 PD-1 与肿瘤细胞上的 PD-L1 的接近程度,比肿瘤突变负荷或 PD-L1 表达具有潜在优势。在 TNBC 的随机新辅助免疫检查点阻断试验中,增殖的 CD8+ TCF1+ T 细胞和 MHC II+ 癌细胞的比例是治疗反应的主要预测指标,癌细胞与 B 细胞、癌细胞与颗粒酶 B+ T 细胞之间的空间相互作用也有重要影响。在接受过继细胞治疗的黑色素瘤患者中,应答者的肿瘤胰岛和基质区域内,CD8+ 或 CD8+ PD-1+ TILs 与 CD11c+ 细胞的相互作用更多。在晚期肾细胞癌(Renal Cell Carcinoma,RCC)患者中,免疫治疗后配体 - 受体对 COL4A1 和 ITGAV 的空间共表达显著增加,有助于阐明免疫反应机制。
多细胞空间组织也为免疫治疗提供了新的见解。TLS 是一种有前景的预测免疫治疗反应的生物标志物,它形成离散的 TME,为抗原呈递和细胞因子介导的信号传导提供场所。在 RCC 中,TLS 阳性肿瘤表现出较高频率的产生 IgG 的浆细胞,与免疫治疗的改善结果相关。此外,一些新定义的免疫表型(如 “炎症” 和 “免疫枢纽”)也与治疗反应密切相关,在 TNBC 中,通过全切片染色定义的不同免疫表型具有不同的预后,转录组分析表明这些免疫表型具有不同的 T 细胞免疫逃逸模式。
六、当前挑战与未来研究方向
尽管空间分析技术为肿瘤研究带来了新的突破,但该领域仍面临诸多挑战,未来研究可从以下几个方面展开。
(一)分子机制尚未完全揭示
生物组织结构的空间特征往往反映其内在的分子生物学过程,但目前由于技术灵敏度的限制,难以全面捕获不同生物分子(如转录本、蛋白质、磷酸化蛋白质、代谢物等)的空间变化。新兴的多组学空间分析技术通过共测序染色质可及性和基因表达或组蛋白修饰,实现了表观基因组和转录组的联合分析,为揭示空间调控机制提供了多模态数据。计算空间伪时间的方法也取得了一定进展,有助于从单个时间点的空间图谱推断动态分子过程。为验证因果关系,高通量扰动实验和计算机虚拟扰动成为有力工具。未来,需实现单细胞分辨率下在同一组织切片上对表观基因组和转录组进行无偏的全基因组联合测定,更好地利用福尔马林固定石蜡包埋(Formalin-Fixed Paraffin-Embedded,FFPE)样本。同时,鉴于不同生物系统空间组织的明显异质性,开发能够综合分析空间数据复杂模式的计算工具至关重要。此外,肿瘤内异质性可能影响组织微阵列(Tissue Microarrays,TMAs)的有效性,对于某些具有位置依赖性表达的生物标志物(如缺氧标志物),使用 TMAs 时应谨慎,可通过进行大型 TMA 研究增加样本量以减少采样误差,或使用增殖标志物 Ki-67、肿瘤微血管密度等异质性标志物来研究肿瘤内异质性。
(二)常见空间特征模式未充分揭示
尽管疾病发生的机制和过程存在个体差异,但组织中关键细胞类型和群落的空间排列具有一定的共性。然而,由于空间技术成本较高,目前大多数空间分析集中在特定样本上,主要反映特定情况下的组织结构特征,且数据可能存在明显的批次效应,这些因素会掩盖真实的生物信号,增加数据解释和整合的复杂性。目前虽有一些整合多个数据集的方法,但难以确定哪种工具在整合后的所有数据对中具有最佳的整体聚类性能。使用 TMAs 在一定程度上可缓解成本和批次问题,未来应倡导更多的项目合作和数据公开,支持建立组织空间数据图谱,同时开发更强大的整合工具,使其对大型数据集具有良好的扩展性,能够合并来自不同来源或条件(如不同解剖区域或发育阶段)的数据,增强数据的稳健性,揭示单个数据集中不明显的共同模式。
(三)罕见细胞群体分析困难
对于分辨率有限的空间组学技术,通常通过反卷积算法或特征基因评分来推断罕见细胞的位置,但结果往往包含大量噪声。尽管越来越多的单细胞水平空间技术不断涌现,但这些技术每个细胞只能捕获数十到数百个分子,可能无法涵盖感兴趣的罕见细胞类型。在对罕见细胞类型先验知识有限的情况下,研究人员可能需要优先选择全切片捕获作为主要方法,因为 TMA 的核心区域可能无法充分捕获这些细胞,从而影响统计效应的表征和空间分布的研究。未来,先进的空间组学技术和匹配算法有望更好地挖掘罕见细胞亚型。
(四)空间特征与生物学功能及临床意义关系不明
大量研究发现肿瘤组织中不同的细胞群落或空间分布特征与临床预后显著相关,表明空间特征可能对肿瘤的发生和发展具有重要影响。然而,空间特征与肿瘤生物学之间的因果关系尚未准确确定。未来,需要对不同计算方法发现的空间特征进行进一步验证,这需要更多针对不同方法的基准研究。更大的样本队列有助于通过提高统计功效发现新的具有临床意义的关联。动态时间序列和扰动实验可跟踪肿瘤进展过程中空间特征的变化,通过人为调节这些特征对肿瘤的影响,更清晰地确定它们之间的因果关系。
综上所述,肿瘤微环境空间特征的研究在技术、方法和临床应用等方面取得了显著进展,但仍面临诸多挑战。未来,通过多学科交叉融合,不断优化技术和算法,深入挖掘空间特征与肿瘤生物学及临床治疗的关系,有望为肿瘤的精准诊断和治疗开辟新的道路。
打赏
下载安捷伦电子书《通过细胞代谢揭示新的药物靶点》探索如何通过代谢分析促进您的药物发现研究
10x Genomics新品Visium HD 开启单细胞分辨率的全转录组空间分析!
欢迎下载Twist《不断变化的CRISPR筛选格局》电子书
单细胞测序入门大讲堂 - 深入了解从第一个单细胞实验设计到数据质控与可视化解析
下载《细胞内蛋白质互作分析方法电子书》