CharMark:用于解释性语言生物标志物的字符级马尔可夫建模,以检测认知衰退

《Frontiers in Digital Health》:CharMark: character-level Markov modeling for interpretable linguistic biomarkers of cognitive decline

【字体: 时间:2025年11月19日 来源:Frontiers in Digital Health 3.8

编辑推荐:

  本研究提出CharMark框架,通过一阶马尔可夫链分析语言转录中字符转移概率,发现空格、n和i等字符使用模式在痴呆症患者与健康人群间存在显著差异,经PCA和Kolmogorov-Smirnov检验验证,Lasso逻辑回归模型AUC达0.806,优于TF-IDF和BERT模型,为可解释的早期数字生物标志物筛查提供新方法。

  认知退化,尤其是阿尔茨海默病及其相关痴呆症(ADRD),正成为全球范围内日益严重的健康问题。根据2020年的数据,全球已有超过5500万人受到这种疾病的困扰,预计到2050年这一数字将攀升至1.39亿人。早期发现对于改善患者预后具有至关重要的作用,然而,目前的筛查工具仍存在诸多限制,难以在临床实践中广泛应用。本文提出了一种全新的、可解释的人工智能(IAI)框架——CharMark,该框架通过分析语音转录文本中的字符级语言模式,识别出与认知衰退相关的语言生物标志物。这种基于第一阶马尔可夫链模型的方法,使得我们能够捕捉语言在微观层面的变化,这些变化通常是认知障碍早期的信号。

传统的痴呆筛查工具,如蒙特利尔认知评估(MoCA)和圣路易斯大学精神状态检查(SLUMS),虽然被广泛使用,但它们依赖于人工解释,缺乏对语言特征的深入分析。这些工具在实际应用中常面临主观性、时间成本高、诊断信心不足以及受教育程度和语言能力影响等问题。因此,开发一种更加客观、高效且文化适应性强的筛查方法显得尤为迫切。

CharMark框架通过分析语音转录文本中的字符级模式,揭示了语言生成过程中可能的细微变化。我们构建了一个基于字符转换的马尔可夫网络模型,通过计算每个字符的稳态概率,提取出具有诊断意义的语言特征。这种方法不仅具有可解释性,而且计算简单,能够适用于不同语言环境下的筛查应用。我们对稳态概率进行了聚类分析和主成分分析(PCA),并使用Kolmogorov-Smirnov(KS)检验来确认不同组别之间的分布差异。此外,我们还采用Lasso逻辑回归模型,进一步评估这些特征的诊断价值。

在我们的研究中,发现了一些特定的字符,如空格字符(代表停顿)、字母“n”和“i”,在痴呆患者和健康对照组之间表现出显著的使用差异。这些字符反映了语言流畅性、重复模式以及词汇结构的变化,这些变化在认知衰退的早期阶段尤为明显。通过使用这些字符特征,我们不仅能够识别出个体的语言模式,还能够揭示出语言变化与认知功能之间的潜在联系。

CharMark框架的构建基于对语音转录文本的预处理和特征提取。我们使用了DementiaBank Pitt语料库,该语料库包含310条阿尔茨海默病患者的语音转录文本和242条健康对照组的文本。所有文本被统一转换为小写,并去除了非字母字符,如标点符号和特殊符号,以确保分析的一致性。此外,我们还对缩写词进行了分解,将其转换为单个字母,以保持文本的原始结构。最终,我们得到了一个由27个字符组成的离散序列,包括26个英文字母和一个空格字符,这些字符构成了我们模型的基本单元。

在模型构建过程中,我们采用了一阶马尔可夫链模型,计算每个字符的稳态概率。这种方法能够有效捕捉语言中字符转换的规律,并通过统计分析揭示不同组别之间的差异。我们还进行了敏感性分析,测试了不同平滑参数(α)对模型性能的影响,发现模型在α=0.01时表现最为稳定。这表明,选择适当的平滑参数对于确保模型的稳定性和解释性至关重要。

为了进一步验证模型的诊断能力,我们对字符特征进行了聚类分析和主成分分析。聚类结果表明,痴呆患者和健康对照组在字符分布上存在显著差异,而主成分分析则帮助我们更清晰地可视化这些差异。这些分析不仅确认了模型的有效性,还为我们提供了更深入的理解,即认知衰退如何在语言的微观层面体现。

我们还使用了Kolmogorov-Smirnov检验来评估不同字符在组别间的分布差异,并发现空格字符在痴呆患者中表现出更高的使用频率和更长的停顿时间。这可能与患者在语言表达中的犹豫和不流畅有关。此外,我们通过Lasso逻辑回归模型评估了这些字符特征的预测能力,发现其在区分痴呆患者和健康对照组方面具有较高的准确率。模型的AUC值达到了0.806,显示出字符级特征在诊断中的强大潜力。

尽管CharMark框架在诊断性能上表现出色,但我们也认识到其在实际应用中的一些局限性。例如,当前的研究仅基于一项标准化的口语任务——描述“波士顿饼干盗窃”事件,这可能限制了模型在其他语言环境下的适用性。此外,由于语料库缺乏与个体人口统计学特征的详细关联,我们无法对这些变量进行建模,这可能影响模型的泛化能力。未来的研究将致力于扩展CharMark的应用范围,包括更多样的任务和数据集,以及探索其在多语言环境下的适用性。

总体而言,CharMark框架为痴呆症的早期筛查提供了一种新的方法。通过分析语音转录文本中的字符级模式,我们不仅能够识别出与认知衰退相关的语言特征,还能够揭示这些特征如何反映语言的微观变化。这种方法的优势在于其计算效率高、可解释性强,以及对多语言和资源受限环境的适应性。未来,随着更多数据的积累和更全面的模型优化,CharMark有望成为一种重要的数字生物标志物工具,为痴呆症的早期诊断和干预提供支持。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号