基于人口与社会因素的中国自杀企图预测:机器学习模型的构建与优化

【字体: 时间:2025年06月10日 来源:Journal of Affective Disorders 4.9

编辑推荐:

  本研究针对中国自杀企图(SA)预测模型变量复杂、应用受限的问题,采用随机森林(RF)、XGBoost等5种机器学习(ML)算法,基于人口统计学特征及自杀态度量表(GSS)、自杀意念量表(BSI)数据构建预测模型。结果显示LightGBM训练集AUC达0.9199,RF测试集AUC为0.8136,整体准确率79.09%,为自杀预防提供了更简洁高效的预测工具。

  

自杀是全球重要的公共卫生难题,每年导致约百万人死亡,而自杀未遂案例更是死亡案例的10-25倍。在中国,由于缺乏完善的登记系统和病耻感,真实自杀数据可能被严重低估。传统预测方法多依赖复杂变量,模型普适性较差。为此,来自山东等三省的研究团队在《Journal of Affective Disorders》发表研究,通过机器学习技术构建了中国人群自杀企图的简洁预测模型。

研究采用病例对照设计,从山东、湖南、辽宁三省医院信息系统收集791例自杀未遂者,并匹配同等数量的社区对照。通过面对面访谈采集人口统计学数据和心理量表(GSS、Beck量表)评分。运用R 4.2.1软件实施随机森林(RF)、多元逻辑回归(MLR)、XGBoost、AdaBoost和LightGBM五种算法建模,采用AUC、灵敏度、特异度等指标评估模型性能。

Demographic characteristic of case and control groups

通过配对设计有效控制了年龄、性别等混杂因素,发现教育程度、婚姻状况等社会因素在组间存在显著差异(P<0.05),提示这些变量对自杀预测具有关键价值。

Results

机器学习模型展现出优异预测效能:

  1. LightGBM训练集AUC最高(0.9199),RF测试集表现最佳(AUC=0.8136)
  2. RF整体准确率79.09%位列第一,LightGBM(77.18%)次之
  3. RF与XGBoost分别获得训练集(80.00%)和测试集(84.83%)最高灵敏度
  4. LightGBM阳性预测值最优,显示其在识别高危个体方面的优势

Discussion

研究表明不同算法各有优势:RF综合性能最佳,LightGBM在特定指标上表现突出。相较于传统复杂模型,该研究建立的简洁模型更利于临床推广。研究者建议根据实际需求选择算法,或采用组合模型策略提升预测精度。该成果为自杀预防提供了可扩展的技术框架,但需进一步验证其在更大人群中的适用性。研究获得美国国立精神卫生研究院(NIMH)R01 MH068560、山东省自然科学基金等资助。

相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号