新机器学习方法更好地描述神经退行性疾病进展

【字体: 时间:2022年09月28日 来源:MIT麻省理工

编辑推荐:

  机器学习方法发现渐冻症患者的健康下降模式;这项技术也适用于阿尔茨海默氏症和帕金森症。

  

神经退行性疾病——如肌萎缩性侧索硬化症(肌萎缩性侧索硬化症)、阿尔茨海默症和帕金森症——是复杂的慢性疾病,可出现各种症状,以不同的速度恶化,并有许多潜在的遗传和环境原因,其中一些是未知的。尤其是肌萎缩侧索硬化症,它会影响到随意的肌肉运动,而且总是致命的。不过,虽然大多数人在确诊后只能存活几年,但也有人会患病数十年。肌萎缩性侧索硬化症的表现也可能有很大差异;通常病情发展较慢与肢体起病有关,影响精细运动技能,而更严重的是球部肌萎缩侧索硬化症影响吞咽、说话、呼吸和行动能力。因此,了解肌萎缩性侧索硬化症(ALS)等疾病的进展对临床试验的登记、潜在干预措施的分析和发现根本原因至关重要。

然而,评估疾病的进化远非简单明了。目前的临床研究通常假设健康状况在症状分级量表上呈向下的线性下降轨迹,并使用这些线性模型来评估药物是否在减缓疾病进展。然而,数据表明,渐冻人症通常遵循非线性轨迹,症状稳定的时期与症状迅速变化的时期交替出现。由于数据可能稀少,健康评估往往依赖于在不均匀的时间间隔测量的主观评级指标,在患者群体之间进行比较是困难的。这些不同的数据和进展反过来又使发明有效性的分析复杂化,并可能掩盖疾病的起源。

现在,由麻省理工学院、IBM研究中心和其他机构的研究人员开发的一种新的机器学习方法旨在更好地描述ALS疾病的发展模式,为临床试验设计提供信息。

“有些群体的个体有着共同的发展模式。例如,有些人似乎患有快速发展的渐冻人症,而另一些人则是随着时间的推移而变化的缓慢发展的渐冻人症,”麻省理工学院的研究专家Divya Ramamoorthy博士说,他是本月发表在《自然计算科学》上的一篇新论文的主要作者。“我们一直在问的问题是:我们能否使用机器学习来识别这些类型的一致模式在个体之间是否存在,以及在多大程度上存在?”

他们的技术确实识别了肌萎缩性侧索硬化症进展的离散而稳健的临床模式,其中许多是非线性的。此外,这些疾病进展亚型在患者群体和疾病指标中是一致的。该团队还发现,他们的方法也可以应用于阿尔茨海默氏症和帕金森氏症。

重塑健康下降

在咨询了临床医生之后,由机器学习研究人员和神经学家组成的团队让数据自己说话。他们设计了一个无监督机器学习模型,使用两种方法:高斯过程回归和狄利克雷过程聚类。这些工具直接从患者数据中推断出健康轨迹,并自动将相似轨迹分组在一起,而无需规定集群的数量或曲线的形状,形成ALS发展的“亚型”。他们的方法以阴性轨迹的偏倚方式纳入了先前的临床知识——与神经退行性疾病进展的预期一致——但没有假设任何线性。“我们知道线性并不能反映实际观察到的情况,我们在这里使用的方法和模型更加灵活,从某种意义上说,它们捕获了数据中看到的东西,”不需要昂贵的标签数据和参数处方。

首先,他们将该模型应用于ALS临床试验和观察研究的五个纵向数据集。这些研究使用了衡量症状发展的黄金标准:ALS功能分级量表(ALSFRS-R),它捕捉了患者神经损伤的全球情况,但可能有点“混乱”。此外,研究还纳入了生存概率、强迫肺活量(呼吸功能的测量)和ALSFRS-R评分(观察个体身体功能)。

新的进程和效用机制

当他们的人群水平模型在这些指标上进行训练和测试时,从许多轨迹中跳出了四种主要的疾病模式——S型快速发展、稳定的缓慢发展、不稳定的缓慢发展和不稳定的中等发展——其中许多具有很强的非线性特征。值得注意的是,它捕获了患者经历能力突然丧失的轨迹,称为功能悬崖,这将显著影响治疗、临床试验登记和生活质量。

研究人员将他们的方法与该领域其他常用的线性和非线性方法进行了比较,以区分聚类和线性对模型精度的贡献。这项新工作的表现超过了它们,甚至超过了针对患者的模型,并发现子类型模式在各种测量中是一致的。令人印象深刻的是,当数据被保留时,该模型能够插入缺失的值,关键是,它可以预测未来的健康指标。该模型还可以在一个ALSFRS-R数据集上进行训练,并预测其他数据集的集群成员,使其健壮、可泛化和在稀缺数据下的准确性。只要有6-12个月的数据,就可以比传统方法更有把握地推断健康轨迹。

研究人员的方法还为阿尔茨海默病和帕金森病提供了见解,这两种疾病都有一系列的症状表现和进展。对于阿尔茨海默症,这项新技术可以识别出不同的疾病模式,特别是从轻度疾病到重度疾病的转变率的变化。帕金森病分析显示了停药评分的进展轨迹与疾病表型之间的关系,如帕金森病的震颤显性或姿势不稳/步态困难形式。

这项工作在复杂神经退行性疾病的时间序列的噪声中寻找信号方面取得了重大进展。Fraenkel说:“我们看到的模式在研究中是可重复的,我认为这是以前没有显示过的,这可能会对我们如何对(ALS)疾病进行分型产生影响。”由于FDA一直在考虑临床试验设计中的非线性影响,该团队注意到他们的工作是特别相关的。

随着了解疾病机制的新方法的出现,该模型从系统生物学的角度提供了另一种工具来区分像ALS、阿尔茨海默症和帕金森症等疾病。

Fraenkel的实验室通过观察细胞变化来了解疾病的病因和可能的治疗目标,他说:“我们从相同的病人那里获得了大量的分子数据,所以我们的长期目标是看看这种疾病是否有亚型。一种方法是从症状开始,看看不同疾病发展模式的人在分子水平上是否也不同。这可能会让你接受治疗。然后是自下而上的方法,你从分子开始,并试图重建可能受到影响的生物通路。我们将从两个方面(解决这个问题)……看看是否有什么东西能在中间满足。”


相关新闻
生物通微信公众号
微信
新浪微博
  • 搜索
  • 国际
  • 国内
  • 人物
  • 产业
  • 热点
  • 科普
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号