机器学习对心理韧性的预测:健康与自我认知变量的分析

《Journal of Affective Disorders Reports》:Machine learning prediction of psychological resilience: An analysis of health and self-perception variables

【字体: 时间:2025年11月21日 来源:Journal of Affective Disorders Reports CS3.8

编辑推荐:

  心理韧性评估与健康管理相关因素及机器学习模型应用研究。西班牙大学学生样本(n=360)通过随机森林和TabNet模型分析,发现地中海饮食依从性、身体感知差异及健康自评是预测心理韧性的关键变量。聚类分析揭示低韧性群体酒精依赖风险显著升高。研究首次将TabNet等先进机器学习应用于心理韧性预测,验证了饮食健康、身体意象与心理韧性的非线性关联,为精准干预提供新工具。

  ### 研究背景与意义

心理韧性是指个体在面对压力或创伤事件时,能够灵活有效地进行适应和恢复的能力。它不仅仅意味着回到之前的状态,而是能够发展出一种新的心理平衡。心理韧性并非固定不变的特质,而是由生物、心理、社会和环境因素共同作用形成的动态过程。研究表明,心理韧性不仅能缓解创伤带来的负面影响,还与积极的心理特征发展密切相关。在不同年龄段,心理韧性都发挥着关键的保护作用,有助于个体在面对可能破坏其情感和身体平衡的事件时保持心理健康。

这一概念在特定人群中尤为重要,尤其是大学学生群体。大学生活伴随着学业压力、人际关系复杂性以及对未来不确定性的担忧,这些因素都可能影响个体的心理健康。2009年的研究指出,相当比例的学生面临心理健康挑战,其中47.1%有焦虑障碍,55.6%患有抑郁症,这些情况与学业和家庭因素密切相关。在这样的背景下,心理韧性可能在减轻这些压力带来的心理后果方面发挥重要作用。因此,了解支持或削弱心理韧性的因素,对于制定有效的干预措施至关重要。

本研究假设个体的心理韧性与其健康行为和自我感知密切相关。越来越多的研究表明,健康习惯不仅涉及身体层面,还深刻影响心理状态。例如,不良的饮食习惯、吸烟和饮酒行为可能会对情绪、压力水平和认知功能产生负面影响,这些都是心理韧性的重要组成部分。同样,个体对自身身体形象的感知,包括态度、想法和感受,是其心理健康的基石。在社会普遍推崇不切实际的审美标准的背景下,身体形象不满可能会消耗个体的心理资源,阻碍其有效应对压力的能力。

因此,本研究旨在探讨心理韧性与多个关键健康和心理变量之间的关联,包括饮食习惯(如地中海饮食的依从性)、吸烟状态、饮酒风险、进食障碍行为以及身体形象感知等。虽然这些变量通常被单独研究,但我们的目标是理解它们在预测心理韧性方面的综合作用。此外,人工智能(AI)和机器学习(ML)技术为分析复杂的健康数据提供了新的方法。传统统计方法虽然能够识别一般性相关性,但高级ML模型可以揭示微妙的非线性关系和多个变量之间的相互作用。本研究提出,心理韧性是一个多维的结构,不能仅通过静态测量(如25个条目的问卷)来充分捕捉。因此,我们采用了一种更全面的方法,结合了七种不同的问卷数据,构建了一个稳健的预测模型。这种方法不仅有助于测量心理韧性,还能够理解其背后的驱动因素。聚类分析也被用来识别人群中的不同子群或特征,因为对整个样本的单一分析可能会掩盖重要的变异性。通过这种双重方法,我们希望超越简单的关联分析,为心理韧性研究奠定更全面和预测性的基础。

### 研究方法与数据处理

本研究采用了一种多中心的横断面研究设计,旨在评估大学学生在学习期间饮食、生活方式和心血管风险的变化。共有360名第一年大学学生参与了研究,参与率约为64.28%(从560名邀请学生中获得)。分析样本在年龄、性别和父母社会经济地位方面具有代表性。

研究获得了“Cuenca的Virgen de la Luz”临床研究伦理委员会的批准,符合赫尔辛基宣言的原则。参与者在参与前被口头和书面告知研究内容,并在参与条件中签署知情同意书。由于所有参与者均年满18岁,即西班牙的法定成年年龄,因此每个参与者都获得了独立的书面知情同意。

变量的选择过程是严格且多阶段的,既基于理论基础,也考虑了数据质量。此外,包括自我感知健康和身体形象的变量,因为它们可能为模型提供额外的有价值信息。尽管这些变量不像其他变量那样直接与现有文献相关,但理论认为,个体的主观幸福感感知可能捕捉到客观测量中未体现的细微差别。

最初,研究受到大量关于心理韧性的文献综述的指导,这导致了在多个领域识别出12个关键变量,包括饮食模式和生活方式习惯(如烟草和酒精消费)。引入了三个额外的构建变量,以进一步丰富模型的预测能力,并捕捉由原始数据形成的更复杂、更深层次的概念。这种方法使模型能够探索更复杂的交互和模式,超越简单的双变量相关性,实现对预测心理韧性因素的更全面理解。最终,整个变量集(12个原始变量和3个构建变量)经过了数据质量评估。具有高缺失值百分比的变量被系统性地排除,以确保分析的完整性和可靠性。

在数据预处理阶段,采用了综合且细致的方法。这包括处理缺失值、确保数据一致性以及管理异常值,以防止它们影响结果。所有连续变量都使用Python库Scikit-learn进行了标准化处理。具体而言,StandardScaler被用于标准化具有正态分布或异常值的变量,确保它们的均值为0,标准差为1。对于具有固定范围或偏态分布的变量,MinMaxScaler被用来将数据归一化到0到1的范围内。这些方法的参数严格来源于训练集,并随后用于训练和测试集的转换,以确保数据完整性并防止数据泄露偏差。

为了应对类别不平衡问题,其中高韧性个体数量远多于低韧性个体,采用了合成少数过采样技术(SMOTE)。这种方法通过生成少数类的合成数据,确保模型不会偏向多数类。SMOTE仅应用于训练集,以保持测试集的未见性,确保模型评估基于原始而非合成数据。

为了实现研究目标,即预测学生心理韧性水平并将其分为具有相似特征的群体,采用了两种强大的机器学习模型:随机森林(Random Forest)和TabNet。在模型选择方面,随机森林模型通过设置树的数量(n_estimators)为100,以在性能和计算成本之间取得平衡。为了防止过拟合,限制了每棵树的最大深度(max_depth = 30),并设置了节点分割的最小样本数(min_samples_split = 10)和形成叶节点的最小样本数(min_samples_leaf = 2)。这些参数作为正则化机制,有助于防止模型过度专业化。此外,由于韧性类别存在不平衡,class_weight参数被设置为“balanced”,以确保模型对所有类别给予同等关注,从而提高公平性和预测准确性。

TabNet模型作为一种先进的神经网络架构,特别适合处理表格数据。其主要优势在于,它能够通过学习的掩码机制,在每一步自动强调最相关的变量,同时忽略不太重要的变量。这种独特的注意力机制不仅增强了模型的预测能力,还提高了可解释性,使我们能够观察模型在决策过程中考虑哪些变量。此外,TabNet的超参数已预先调优,因此在模型选择中使用了简单的分层交叉验证,而不是双重交叉验证。

为了评估模型的预测性能,采用了宏观F1分数(macro F1-score)。这一指标在类别不平衡数据集中尤为重要,因为它对少数类和多数类赋予相等的重要性。除了整体F1分数,还报告了每个韧性类别(低、中、高)的F1分数,以提供对模型预测能力的更全面评估。此外,为了增强模型的可解释性并揭示潜在关系,对预测变量的重要性进行了分析。在随机森林模型中,变量重要性基于节点纯度的减少进行评估。而在TabNet模型中,采用排列重要性技术。这些分析帮助我们识别出影响韧性预测的关键因素,如身体形象差异、感知健康水平和地中海饮食依从性。

在聚类分析方面,采用了K-means算法,这是一种无监督学习方法,能够将学生分为具有相似特征的群体。为了确定最优的聚类数量,使用了轮廓系数(Silhouette Coefficient)作为质量指标。K-means算法通过最小化观测值与其所属聚类中心之间的平方距离和,有效地根据特征空间中的相似性对观测值进行分组。最终的聚类分析表明,最优聚类数量为2,这一结果由轮廓系数分析得出。

### 研究结果与分析

在初步分析中,通过相关矩阵和统计检验,发现了一些关键变量之间的显著关系。其中,身体形象差异、感知健康水平和地中海饮食依从性被识别为最重要的预测因素。这些变量在两个模型中都表现出较高的重要性,表明它们对心理韧性预测具有重要影响。

在随机森林模型中,身体形象差异、感知健康水平和地中海饮食依从性被确定为最重要的预测变量。这表明个体的身体形象感知和整体健康状况在心理韧性中起着关键作用。身体形象差异可能反映了个体对自身身体和理想身体形象之间的差距,这种差距可能对心理韧性产生重要影响。感知健康水平(gh1)可能代表个体对自身整体健康的主观评价,而地中海饮食依从性则可能与健康饮食习惯相关,这些习惯被认为有助于心理韧性的发展。

在TabNet模型中,当前吸烟者(Current Smoker)被确定为最重要的预测变量,表明吸烟状态在模型的决策过程中具有决定性作用。这一发现与之前的研究一致,表明心理韧性可能影响个体的吸烟行为,或者相反,吸烟行为可能影响心理韧性。此外,该模型还揭示了一些具有负重要性的变量,如进食障碍风险(Risk of EDs)和性别。这表明这些变量可能引入了混淆效应,影响了模型的预测性能。它们的负贡献意味着它们可能掩盖了与目标结果相关的潜在模式。

通过分析两个模型的变量重要性,发现它们在变量重要性等级上具有一定的相似性。两者都赋予健康相关变量(如感知健康水平和地中海饮食依从性)较高的重要性。这一结果与现有文献一致,表明健康习惯和饮食模式与心理韧性的适应能力和心理恢复密切相关。此外,TabNet模型还突出了烟草消费作为高度相关因素的重要性,这与之前的研究一致,表明心理韧性可能在戒烟过程中起到关键作用。

研究还发现,地中海饮食依从性在两个模型中都表现出较高的预测能力。这一发现得到了现有文献的支持,其中提到心理韧性与饮食摄入之间的关系可能由情绪性进食(emotional eating)所中介。这意味着健康的饮食习惯可能反映更高的心理韧性,并有助于更有效的应对机制。

此外,感知健康水平和酒精依赖风险(AUDIT分数)在模型中表现出显著的预测相关性。这与之前的研究一致,表明较高的心理韧性与较低的物质滥用可能性相关。我们的聚类分析进一步支持了这一结论,揭示了两个不同的群体:一个低韧性群体,其平均AUDIT分数较高,表明更高的酒精依赖风险;另一个中等韧性群体,其平均AUDIT分数较低,表明较低的酒精依赖风险。这些结果提供了实证证据,表明心理韧性较低的个体更倾向于采取不适应的应对方式。

通过关注非危机情境,我们的研究提供了额外的证据,表明这些关系对于心理韧性是基本的,即使在没有压力事件的情况下也是如此。这一结论与之前的研究一致,这些研究探讨了心理韧性与一般健康行为之间的关系。

本研究的模型虽然在预测性能上表现中等(F1分数在0.51到0.59之间),但这一结果在调查数据中具有重要意义。与传统统计方法相比,随机森林和TabNet模型特别适合揭示复杂的非线性关系和变量间的复杂相互作用。心理韧性与健康习惯和自我感知之间的关系并非简单的线性方程,而是一个复杂且多维的现象,其中因素可能以微妙的方式相互影响。机器学习方法使我们能够更全面地探索这些模式,并构建一个预测框架,以识别具有风险特征的个体。此外,聚类分析不仅提供了对模型性能的验证,还揭示了人群中的自然分组,为心理韧性研究提供了更深入的理解。

### 研究讨论与启示

本研究揭示了心理韧性与健康习惯和身体自我感知之间的复杂关系。研究结果表明,身体形象差异和感知健康水平是预测心理韧性最重要的因素。这为未来针对这一人群的心理韧性干预措施提供了坚实的基础,表明通过改善生活方式和自我感知,可以有效增强心理韧性。

尽管研究结果具有重要的启示意义,但也存在一些局限性。主要的局限之一是预测模型的中等表现,这主要归因于样本量较小。更大的、更具代表性的样本可能会提高模型的准确性,从而更好地推广研究发现。此外,研究采用的是横断面设计,这使得无法确定心理韧性与健康习惯或身体感知之间的因果关系,因为无法判断是心理韧性影响了健康习惯,还是健康习惯影响了心理韧性。

因此,未来的研究可以考虑采用纵向设计,以探索心理韧性、健康习惯和身体感知之间的动态关系,并明确因果方向。此外,未来的研究可以扩展变量,包括其他影响心理韧性的因素,如社会支持、社会经济背景和生活经历,以提供更全面的心理韧性理解。为了改进我们的方法,可以优化机器学习模型,使用更大的数据集或探索更复杂的模型架构,以提高对低韧性子群体的预测准确性,从而开发更有效的检测工具。

本研究的结果还表明,针对身体形象改善和健康生活方式促进的干预措施可能在提高心理韧性方面有效。因此,未来的研究可以基于我们的发现设计和评估这些干预措施的有效性,以进一步改善大学学生的心理健康状况。

### 研究结论

本研究揭示了健康习惯和身体自我感知变量在预测大学学生心理韧性方面的重要性。通过机器学习模型,我们确认了身体形象差异和感知健康水平是最重要的预测因素。这一发现提供了实证证据,表明心理韧性是一个动态的构建,可以通过改善生活方式和自我感知来增强,为这一人群的心理韧性干预措施提供了坚实的基础。

尽管本研究为心理韧性研究提供了重要的见解,但其局限性也值得关注。预测模型的中等表现主要归因于样本量较小。更大的、更具代表性的样本可能会提高模型的准确性,从而更好地推广研究发现。此外,研究的横断面设计限制了对心理韧性与健康习惯或身体感知之间因果关系的探索。未来的研究可以采用纵向设计,以更全面地理解这些关系的动态变化。

基于这些发现,未来的研究可以探索心理韧性、健康习惯和身体感知之间的复杂关系,并明确因果方向。此外,可以扩展变量,包括其他影响心理韧性的因素,如社会支持、社会经济背景和生活经历,以提供更全面的心理韧性理解。为了改进我们的方法,可以优化机器学习模型,使用更大的数据集或探索更复杂的模型架构,以提高对低韧性子群体的预测准确性,从而开发更有效的检测工具。

本研究的结果还表明,针对身体形象改善和健康生活方式促进的干预措施可能在提高心理韧性方面有效。因此,未来的研究可以基于我们的发现设计和评估这些干预措施的有效性,以进一步改善大学学生的心理健康状况。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号