基于人口与社会因素的中国自杀企图预测：机器学习模型的构建与优化

首页今日动态人才市场新技术专栏中国科学人云展台
BioHot
云讲堂直播会展中心特价专栏技术快讯免费试用

生物通官微
陪你抓住生命科技
跳动的脉搏

生物通首页 > 今日动态 > 正文

【字体：大中小】 时间：2025年06月10日 来源：Journal of Affective Disorders 4.9

编辑推荐：

　　本研究针对中国自杀企图(SA)预测模型变量复杂、应用受限的问题，采用随机森林(RF)、XGBoost等5种机器学习(ML)算法，基于人口统计学特征及自杀态度量表(GSS)、自杀意念量表(BSI)数据构建预测模型。结果显示LightGBM训练集AUC达0.9199，RF测试集AUC为0.8136，整体准确率79.09%，为自杀预防提供了更简洁高效的预测工具。

自杀是全球重要的公共卫生难题，每年导致约百万人死亡，而自杀未遂案例更是死亡案例的10-25倍。在中国，由于缺乏完善的登记系统和病耻感，真实自杀数据可能被严重低估。传统预测方法多依赖复杂变量，模型普适性较差。为此，来自山东等三省的研究团队在《Journal of Affective Disorders》发表研究，通过机器学习技术构建了中国人群自杀企图的简洁预测模型。

研究采用病例对照设计，从山东、湖南、辽宁三省医院信息系统收集791例自杀未遂者，并匹配同等数量的社区对照。通过面对面访谈采集人口统计学数据和心理量表（GSS、Beck量表）评分。运用R 4.2.1软件实施随机森林(RF)、多元逻辑回归(MLR)、XGBoost、AdaBoost和LightGBM五种算法建模，采用AUC、灵敏度、特异度等指标评估模型性能。

^{Demographic characteristic of case and control groups}

通过配对设计有效控制了年龄、性别等混杂因素，发现教育程度、婚姻状况等社会因素在组间存在显著差异（P<0.05），提示这些变量对自杀预测具有关键价值。

^Results

机器学习模型展现出优异预测效能：

LightGBM训练集AUC最高（0.9199），RF测试集表现最佳（AUC=0.8136）
RF整体准确率79.09%位列第一，LightGBM（77.18%）次之
RF与XGBoost分别获得训练集（80.00%）和测试集（84.83%）最高灵敏度
LightGBM阳性预测值最优，显示其在识别高危个体方面的优势

^Discussion

研究表明不同算法各有优势：RF综合性能最佳，LightGBM在特定指标上表现突出。相较于传统复杂模型，该研究建立的简洁模型更利于临床推广。研究者建议根据实际需求选择算法，或采用组合模型策略提升预测精度。该成果为自杀预防提供了可扩展的技术框架，但需进一步验证其在更大人群中的适用性。研究获得美国国立精神卫生研究院(NIMH)R01 MH068560、山东省自然科学基金等资助。

热点排行

新闻专题

联系信箱：

粤ICP备09063491号