
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于人口与社会因素的中国自杀企图预测:机器学习模型的构建与优化
【字体: 大 中 小 】 时间:2025年06月10日 来源:Journal of Affective Disorders 4.9
编辑推荐:
本研究针对中国自杀企图(SA)预测模型变量复杂、应用受限的问题,采用随机森林(RF)、XGBoost等5种机器学习(ML)算法,基于人口统计学特征及自杀态度量表(GSS)、自杀意念量表(BSI)数据构建预测模型。结果显示LightGBM训练集AUC达0.9199,RF测试集AUC为0.8136,整体准确率79.09%,为自杀预防提供了更简洁高效的预测工具。
自杀是全球重要的公共卫生难题,每年导致约百万人死亡,而自杀未遂案例更是死亡案例的10-25倍。在中国,由于缺乏完善的登记系统和病耻感,真实自杀数据可能被严重低估。传统预测方法多依赖复杂变量,模型普适性较差。为此,来自山东等三省的研究团队在《Journal of Affective Disorders》发表研究,通过机器学习技术构建了中国人群自杀企图的简洁预测模型。
研究采用病例对照设计,从山东、湖南、辽宁三省医院信息系统收集791例自杀未遂者,并匹配同等数量的社区对照。通过面对面访谈采集人口统计学数据和心理量表(GSS、Beck量表)评分。运用R 4.2.1软件实施随机森林(RF)、多元逻辑回归(MLR)、XGBoost、AdaBoost和LightGBM五种算法建模,采用AUC、灵敏度、特异度等指标评估模型性能。
Demographic characteristic of case and control groups
通过配对设计有效控制了年龄、性别等混杂因素,发现教育程度、婚姻状况等社会因素在组间存在显著差异(P<0.05),提示这些变量对自杀预测具有关键价值。
Results
机器学习模型展现出优异预测效能:
Discussion
研究表明不同算法各有优势:RF综合性能最佳,LightGBM在特定指标上表现突出。相较于传统复杂模型,该研究建立的简洁模型更利于临床推广。研究者建议根据实际需求选择算法,或采用组合模型策略提升预测精度。该成果为自杀预防提供了可扩展的技术框架,但需进一步验证其在更大人群中的适用性。研究获得美国国立精神卫生研究院(NIMH)R01 MH068560、山东省自然科学基金等资助。
生物通微信公众号
知名企业招聘