
-
生物通官微
陪你抓住生命科技
跳动的脉搏
MRS-Sim:开源框架实现高仿真体内磁共振波谱模拟,推动代谢谱分析方法发展与验证
【字体: 大 中 小 】 时间:2025年09月18日 来源:NMR in Biomedicine 2.7
编辑推荐:
本刊推荐:这篇研究介绍了MRS-Sim——一个开源的磁共振波谱(MRS)模拟框架,能够生成高度逼真的体内(in vivo)合成数据。该框架整合了线性组合模型中常用的谱线组分,并创新性地加入了三维B0场不均匀性模拟器和半参数化残差水及基线信号生成器。其模块化设计支持从原始多线圈瞬态信号到预处理后数据的全流程模拟,为MRS方法开发(如深度学习DL模型训练)、谱拟合验证及可重复性分析提供了关键工具,尤其适用于真实数据稀缺或存在隐私限制的场景。
磁共振波谱(MRS)是一种非侵入性的磁共振模态,能够提供活体组织的代谢谱分析,广泛应用于神经发育性疾病、神经退行性疾病、先天代谢错误、脑肿瘤及年龄相关变化等病理研究。然而,开发与验证MRS方法亟需大量真实、体内般的合成数据,且需包含已知真实值作为基准。现有合成数据模拟方法存在两大挑战:一是缺乏能充分模拟体内复杂性的物理模型;二是缺乏公开、透明的参数化标准与开源工具。
MRS-Sim应运而生,它是一个强大、开源的框架,旨在模拟高度逼真的体内MRS数据。与以往仅模拟理想化谱或基函数的方法不同,MRS-Sim直接模拟从扫描仪获取的原始体内谱数据,其核心创新在于引入了两个新组件:一个用于模拟B0场不均匀性的3D场图模拟器,以及一个用于模拟残差水信号和宽谱基线的半参数化生成器。该框架支持从多线圈瞬态到预处理后数据的全阶段模拟,其模块化架构便于定制和社区持续开发。
MRS-Sim的物理模型通过逆向工程谱拟合过程,复现实际数据采集序列。模型方程整合了振幅缩放、线型畸变(Voigt线型,即洛伦兹与高斯线型组合)、频率偏移、相位偏移、涡流效应、B0不均匀性、噪声及半参数化基线与残差水信号等关键元素。模型参数包括代谢物浓度缩放因子、线型变量( Lorentzian线宽与Gaussian线宽)、时间向量、代谢物特异性频移、全局零阶和一阶相位偏移、涡流振幅与时间常数、B0不均匀性、信噪比(SNR)等。
仿真流程始于模拟适当的基函数集(使用MARSS软件生成),随后依次进行振幅调制、线型应用、B0场不均匀性应用、频率偏移、信号求和,继而添加噪声、基线偏移和残差水信号,最后施加相位偏移与涡流效应。若模拟瞬态信号,则需进一步处理多线圈或多次平均带来的SNR缩放、线圈灵敏度权重及频漂与相漂。
采用MARSS模拟默认代谢物基函数,对应GE 3T PRESS TE=30ms序列。基函数模拟时考虑了体素内空间分布(128点/方向),以准确捕获RF脉冲和层选梯度的空间特性,支持包括代谢物、大分子和脂质在内的多种脑代谢物参数化共振。
振幅缩放因子反映代谢物浓度,取值范围基于Gudmundson等人的meta分析,涵盖生理与病理值。浓度单位默认为mM,可直接用作缩放因子,也可转换为相对浓度(以任一代谢物为参考)。
谱线线型主要受弛豫值、磁场均匀性及组织微环境影响。MRS-Sim采用Voigt线型(LCModel、TARQUIN、jMRUI、Osprey等常用),为每个代谢物分配单独的Lorentzian值,整体应用一个Gaussian值,大分子和脂质可另设Gaussian值。代谢物弛豫值源自Gudmundson和Wyss等人的研究。
体内采集始终存在磁场不均匀性。MRS-Sim通过模拟B0场体积并应用于基函数,统一建模高斯展宽、信号阻尼和频移。场图由四个变量定义:ΔB0,x、ΔB0,y、ΔB0,z(各轴从体素中心起的B0变化的一半)及B0,mean(体素均值)。假定线性梯度,但可通过新函数实现不同梯度分布。
质子MRS易受谱基线和残差水污染,但目前无基于物理的模型。MRS-Sim提出一种平滑、有界伪随机游走生成器(Algorithm 1),通过可配置参数生成多样化的基线和残差水信号,经重采样匹配ppm范围后,按量级缩放并添加90°相移的复分量,最终与谱结合。
噪声模型采用高斯分布,SNR定义为实部最大峰高与噪声标准差之比。噪声实部与虚部假定不相关,分别采样,但也可关联采样。
零阶相位偏移导致吸收与色散谱混合,应用复指数于时域。一阶(线性)相位偏移为频率依赖的线性偏移,通常以水峰(4.65 ppm)为参考点,于频域应用复指数。
除全局频移(主要由B0平均偏移引起)外,MRS-Sim允许各基函数具独立频移(如温度、pH效应所致)。参数范围可参考Wermter等人研究的温度诱导频移数据。
采用FID-A的二参数模型(振幅A、时间常数τ)模拟一阶涡流,参数范围源自FID-A。短τ值确保涡流效应完全出现在回波内,否则表现为全局频移。
“瞬态”指多线圈单次平均信号或多次平均信号。模拟时需考虑:各瞬态SNR按√N改善,但引入缩放因子(窄正态分布)以变异;线圈灵敏度权重可采样自高斯分布(μ=1, σ=0.3,钳位[0,2]);各瞬态具独立频漂与相漂。
默认导出.mat格式,含数据、谱拟合结果、模拟参数、基线偏移及代谢物振幅系数。同时支持NIfTI-MRS格式,便于各类软件使用。
为匹配特定体内数据集,MRS-Sim提供工具分析Osprey等软件的拟合参数输出,使用Fitter库识别最佳概率分布,获得参数数值特征。
代码基于PyTorch 1.11.0与Python 3.9.7,支持批量模拟,无需特殊硬件。参数默认值源自谱拟合软件(如LCModel、Osprey)及文献(如Wyss、Gudmundson、Wermter等),详情见在线仓库。
验证合成数据缺乏金标准,故侧重定性评估与视觉检查。可通过与体内数据配对(使用相同拟合参数模拟)及相似性度量(如互相关)评估。图示展示了B0不均匀性、基线/残差水及完整模型的效果,凸显了仿真的全面性与灵活性。
B0不均匀性导致线展宽、信号阻尼及全局频移。图示表明,即便数Hz的不均匀性也会显著影响谱分辨率与信号强度,各向同性与异性不均匀性视觉差异不明显。
生成器产出多样化的基线与残差水信号,参数范围用户可调,旨在涵盖传统方法提取的基线轮廓,可用于评估不同拟合协议的基线建模性能。
随机采样 artefacts 的PRESSTE=30ms谱展示了单谱可呈现的多样性,适用于开发验证数据处理技术(如artefact去除、新拟合协议)。完整模型通过整合常见体内现象与artefacts,使合成数据更贴近未处理的体内数据,有益于深度学习(作为数据增强)及方法验证。
MRS-Sim是MRS领域的重大进步,首个集 realism、灵活性与可及性于一体的开源框架。其整合了前沿谱拟合模型的谱组分,提供全面、适配的信号模型。关键特性包括:B0场模拟器、半参数化基线与残差水生成器及模块化架构,支持社区驱动开发(如未来添加J差谱、扩散谱等)。附带的参考数据库(代谢物自旋系统、温度artefacts、3T T2值、浓度范围等)有助于标准化合成数据生成。
开源数据生成框架对广泛采用合成MRS数据、提升其泛化性及可重复性至关重要。MRS-Sim通过提供高质量仿真与支持信息,进一步民主化MRS研究。未来需研究者协作建立仿真标准与最佳实践,扩展框架至更多体内场景,推动领域持续进步。
生物通微信公众号
知名企业招聘