综述:共聚焦拉曼显微光谱技术在疾病相关光谱病理特征的空间分辨组织表征中的应用

【字体: 时间:2025年09月27日 来源:Clinical and Translational Medicine 6.8

编辑推荐:

  本综述系统探讨了共聚焦拉曼显微光谱(Confocal Raman Microspectroscopy)技术在生物医学领域的应用价值,重点介绍了其在疾病相关光谱病理特征的空间分辨组织表征中的突破性进展。文章详细阐述了该技术通过分子振动光谱实现无标记(label-free)、高特异性生化分析的工作原理,并结合癌症(如乳腺肿瘤TNM分期、前列腺癌IDC-P鉴别)与心血管疾病(如胸主动脉瘤aTAA生物标志物发现)的具体案例,展示了其在揭示疾病特异性时空生物分子特征方面的独特优势。作者同时指出该技术临床转化面临标准化缺失与参考数据库不足等挑战,并强调未来需结合稳健的计算方法(如机器学习与多组学整合)以提升复杂生物系统的分析能力。

  

引言:拉曼光谱的技术原理与生物医学价值

拉曼光谱技术通过探测分子振动(与化学键相关)来获取分子结构、组成及分子间相互作用的信息。振动频率(入射光与散射光之间的频率差,以拉曼位移cm?1表示)对应的拉曼谱带具有分子特异性,其强度与产生谱带的分子浓度成正比。核酸、蛋白质、脂质和碳水化合物中拉曼活性官能团的光谱轮廓可为细胞、生物流体和组织样本的生物学成分提供丰富信息。拉曼光谱通常以拉曼位移(cm?1)为x轴,强度(常为任意单位)为y轴呈现。通过提供多重分子信息,该技术可生成生化指纹图谱,用于指示疾病存在与否甚至疾病进展阶段。
与化学计量学数据分析相结合,拉曼光谱成为一种强大且精准的技术,可用于检测多种恶性疾病的癌前和癌生化变化。例如,该技术已用于基于特定光谱特征区分正常、良性和恶性乳腺组织。拉曼光谱还在发现新生物标志物方面具有巨大潜力,有助于临床筛查疾病易感性和确定发病率。与传统化学分析技术相比,拉曼光谱具有非破坏性、快速、高重复性、环境友好、样本制备最小化乃至无需制备,以及适用于小样本等优势。
对于复杂样本(如细胞、生物流体、组织),观测到的拉曼光谱是各生化成分光谱的叠加,任务在于解码这些复杂的光谱特征。需注意,氨基酸相关谱带应解释为复合信号;在复杂组织中,自发拉曼通常不能仅通过谱带位置或强度区分游离氨基酸与蛋白质中的氨基酸,因此谱带归属反映了特定实验背景下的主要贡献者。生物样本的拉曼光谱分为三个谱区:指纹区(600–1800 cm?1),富含蛋白质、脂质和DNA相关信息;高波数区(2500–3800 cm?1),对应脂质、蛋白质和水的分子振动;沉默区(1800–2500 cm?1),通常无生物分子贡献。

主要拉曼散射技术与数据分析方法

拉曼散射技术包括自发拉曼散射、受激拉曼散射(SRS)、相干反斯托克斯拉曼散射(CARS)、表面增强拉曼散射(SERS)和针尖增强拉曼散射(TERS)。自发与相干拉曼散射过程已有详细理论阐述。自发拉曼散射强度弱(每108个散射光子中约有一个),但适用于生物样本的无标记成像。SRS和CARS等相干过程信号更强,适用于高速生物分子成像。SERS通过等离激元纳米结构(如金或银纳米颗粒)将信号增强高达1011倍,适用于痕量DNA和病原体检测。TERS结合拉曼光谱与扫描探针显微镜,可实现纳米级空间分辨率(10–30 nm),适用于单链DNA/RNA成像。
拉曼数据分析方法涵盖预处理(去噪、基线校正、宇宙射线去除、缩放方法)、模式识别(无监督与有监督方法、定量方法)和验证(交叉验证、置换检验、混淆矩阵、受试者操作特征曲线)。深度学习在拉曼光谱分析中的应用日益增多,包括使用卷积神经网络(CNN)进行光谱预处理和非共振背景去除,以及利用生成对抗网络(GAN)结合CNN进行病原体分类等。

共聚焦拉曼显微光谱的组织表征优势

共聚焦拉曼显微光谱将光学显微镜与拉曼光谱相结合,可在组织样本中空间解析生化变化。该技术通过将激光聚焦于样本内微小点,并经由针孔过滤拉曼散射光确保收集光子来自焦平面,从而生成结合空间与光谱信息的超光谱数据立方体。共聚焦拉曼显微镜的关键组件包括激光源(如532和785 nm)、物镜(通常具有高数值孔径)、共聚焦针孔、光谱仪和CCD探测器。物镜数值孔径决定横向分辨率,针孔尺寸影响分辨率和对比度。
尽管自发拉曼效应 inherently 弱且采集时间较长,但自发拉曼显微镜系统的成像速度近年来显著提高。例如,多线照明共聚焦拉曼显微镜技术可并行检测不同样本区域,实现约10分钟/百万像素的快速自发拉曼成像,拓展了拉曼显微镜在生物医学领域的应用。
共聚焦拉曼显微光谱的优势包括基于振动模式的化学特异性无需标记、高空间分辨率、光学切片和三维成像能力、样本几乎保持完整、最小化样本制备以及与水性环境兼容。劣势包括信号强度弱导致采集时间长、荧光可能掩盖拉曼信号、对痕量分析物检测效果较差、仪器复杂昂贵以及高分辨率空间映射速度慢。

精选应用案例:从疾病生物标志物到肿瘤分级

胸主动脉瘤的光谱生物标志物

Sugiyama等人利用共聚焦拉曼显微光谱和多变量数据分析(真成分分析TCA、主成分分析PCA和多元曲线分辨率MCR)识别了小鼠和人类胸主动脉瘤(aTAA)的特异性光谱生物标志物。PCA揭示了野生型(WT)、Fbln5KO和Fbln4SMKO组织之间的光谱差异。MCR将拉曼光谱分解为亚成分(弹性纤维Ce1–Ce16和胶原纤维Cc1–Cc12)。免疫荧光染色和组织学分析进一步验证了拉曼成像性能。
研究识别了五个主要光谱成分,分别对应弹性纤维、胶原纤维、细胞核、脂质和残余细胞外基质。弹性纤维在528、957和1108 cm?1显示与锁链素和异锁链素相关的特征谱带。胶原纤维在817 cm?1(C-C伸缩)以及855、878、921和938 cm?1(脯氨酸和羟脯氨酸)和1670 cm?1(酰胺I)处有拉曼谱带。这些光谱被用作后续TCA的参考光谱。
拉曼成像显示WT主动脉含有坚实的天然弹性纤维,而Fbln5KO弹性纤维出现 disruption。Fbln4SMKO主动脉中胶原纤维从外膜扩展至中层,且聚集蛋白聚糖显著积累。免疫荧光实验显示Fbln4SMKO主动脉在内膜和中层有强信号,阿尔新蓝染色显示Fbln5KO和Fbln4SMKO中蛋白聚糖大量积累,而WT中无此现象。PCA得分图显示所有基因型聚类,PC-4在WT与Fbln4SMKO及Fbln5KO之间存在显著差异,对应分子差异显示胶原相关的脯氨酸和羟脯氨酸(862和944 cm?1)以及酰胺III(1670 cm?1)谱带。
MCR分析发现Ce1在Fbln4SMKO中与WT和Fbln5KO有显著差异,Ce1被归属于弹性纤维的非弹性蛋白相关亚结构。Cc6仅在Fbln4SMKO中检测到,表明异常分子修饰;Cc6光谱包含氨基酸残基,如苯丙氨酸、酪氨酸、色氨酸、半胱氨酸、天冬氨酸和谷氨酸。在人类aTAA样本中,Ce1与对照组有显著差异,Cc6在人类动脉瘤中增加(与小鼠动脉瘤类似)。MCR进一步分解弹性纤维和胶原纤维成分,识别了人类aTAA中动脉瘤特异性分子特征:Ce1源自与动脉瘤病变相关的异常蛋白质(仅在aTAA和Fbln4SMKO中可检测),Cc6(类蛋白质成分)光谱以多个氨基酸残基的高强度为特征,表明胶原分子组成变化。Ce1和Cc6具有作为主动脉瘤诊断生物标志物的高潜力。该研究凸显了拉曼显微光谱检测病变特异性生化差异的敏感性。

乳腺癌的TNM分期与分级

Zhang等人基于肿瘤进展过程中的分子和功能变化(产生 distinct 生物分子指纹)进行了拉曼乳腺癌评估,从而将拉曼光谱与TNM系统联系起来。样本包括健康、导管原位癌(0期)和浸润性导管癌(IDC,I、II和III期;每期1-3级)组织切片。
主要光谱特征峰包括754 cm?1(色氨酸)、1003 cm?1(苯丙氨酸)、1158 cm?1(β-胡萝卜素)、1450 cm?1(脂质)、1518 cm?1(β-胡萝卜素)、1585 cm?1(核酸)、1664 cm?1(蛋白质和脂肪酸)和2930 cm?1(脂质、脂肪酸和多肽蛋白质的饱和键)。研究发现癌症组中色氨酸、核酸和蛋白质的光谱强度较高,而健康组中苯丙氨酸、β-胡萝卜素和脂质的光谱强度较高。
具体而言,当乳腺组织从健康转变为晚期癌症时,色氨酸(754 cm?1)的归一化峰强度在健康与癌症样本间呈上升趋势,然后在肿瘤进展后缓慢下降,这可能与肿瘤细胞增殖的调控有关。苯丙氨酸峰(1003 cm?1)呈现与色氨酸峰相似的变化模式,但在肿瘤进展期间下降趋势更为显著。两个β-胡萝卜素峰(1158和1518 cm?1)强度 uniformly 下降,可能归因于类胡萝卜素的自由基氧化。早期癌症组中1664和2930 cm?1处蛋白质和脂肪酸的强度变化显著低于健康组织。癌症组脂质含量减少可能与脂褐素和脂质过氧化有关。相反,早期癌症中核酸(1585 cm?1)强度显著高于健康组织。
应用MCR-ALS解释从健康组到晚期癌症的乳腺癌生化组成变化。苯丙氨酸(1003 cm?1)和β-胡萝卜素(1158和1518 cm?1)(成分1)见于健康和早期癌症组。成分3在中晚期癌症中更为显著,包含色氨酸(754 cm?1)、脂质(1450 cm?1)、核酸(1585 cm?1)以及蛋白质和脂肪酸(1664 cm?1)。为获得与病理过程可靠的光谱相关性(单峰分析因光谱特征重叠不足以进行分期/分级),执行了广义判别分析以识别乳腺癌的分期和分级状态。早期、中期和晚期癌症多类区分的受试者操作特征曲线下面积分别为0.976、0.947和0.991。
拉曼成像实验中,k均值聚类分析可视化导管结构 evolution:随着癌症进展,肿瘤细胞浸润并破坏导管结构。在肿瘤细胞簇中,754、1585和1664 cm?1(色氨酸和核酸)的光谱强度最高,而在癌周区域,1003、1158和1518 cm?1的峰较高(表明β-胡萝卜素 concentrated 于这些区域)。该研究证明了共聚焦拉曼显微光谱在识别乳腺癌进展期间生化变化并将这些变化与TNM分期和分级状态联系方面的实用性。

前列腺癌与导管内癌的多中心研究

Grosset等人进行了一项共聚焦拉曼显微光谱研究,利用来自三个多机构队列(CHUM、UHN和CHUQc-UL)的483名患者的组织微阵列切片,旨在区分前列腺癌(PC)与良性前列腺上皮,以及区分前列腺导管内癌(IDC-P)与PC和良性前列腺上皮,包括高级别前列腺上皮内瘤变(HGPIN)。IDC-P的精确诊断对病理学家而言是一大挑战,因为临床上无特异性生物标志物可靠识别这种侵袭性PC组织学变体。
作者表明拉曼光谱结合机器学习可用作IDC-P的特异性分子生物标志物。机器学习模型使用CHUM队列训练,并在UHN和CHUQc-UL队列上验证以避免数据泄漏并提高临床稳健性。开发了四个模型:(i)识别前列腺组织内的淋巴细胞簇,(ii)良性 versus 恶性前列腺上皮细胞,(iii)IDC-P versus 浸润性癌,以及(iv)HGPIN versus IDC-P。第一个模型作为性能基准,由于组织学区分清晰(淋巴细胞 vs. PC细胞;准确度98%,灵敏度99%,特异度98%),在UHN和CHUQc-UL队列上表现相似。
对于第二个模型,UHN和CHUQc-UL队列的结果分别为准确度84%、灵敏度84%、特异度82%,以及准确度86%、灵敏度87%、特异度81%。识别了32个重要的拉曼光谱差异,其中10个拉曼峰对分类贡献最大。与良性组织相比,PC中1450和1484 cm?1处的峰显著增加;这些峰的生化成分主要来自DNA和RNA,以及蛋白质和脂质的骨架。PC组织还显示 several 氨基酸(脯氨酸、酪氨酸、缬氨酸、苯丙氨酸、色氨酸)水平降低。结果证实了拉曼显微光谱检测PC的诊断潜力,表明良性与癌性前列腺上皮细胞之间的分子区别,特别是在核酸和蛋白质组成方面。
对于第三个模型,UHN和CHUQc-UL队列的结果分别为准确度91%、灵敏度88%、特异度93%,以及准确度85%、灵敏度85%、特异度86%。IDC-P显示DNA和RNA骨架以及蛋白质二级结构(α-螺旋和β-折叠,特别是酰胺III峰)增加。酪氨酸、脯氨酸、缬氨酸和苯丙氨酸在IDC-P中也升高,而鸟嘌呤、色氨酸、脂肪酸和来自蛋白质α-螺旋的酰胺I峰降低。从与IDC-P相关的拉曼峰中,两个先前被证明与晚期去势抵抗性PC(1171和1247 cm?1)相关。由于IDC-P与去势抵抗性PC之间的关联已 well established,结果支持了分类模型的价值。对于第四个也是最后一个模型,IDC-P可与HGPIN以>97%的准确度区分。五个主要峰贡献最大;HGPIN具有较高的腺嘌呤水平,而IDC-P具有增加的苯丙氨酸(1003 cm?1)和β-折叠二级结构(1242 cm?1)。HGPIN与IDC-P之间的区分对于 refine 诊断和治疗分层至关重要。该研究利用了三个独立非重叠队列,与早期研究相比,该设计极大地增强
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号