
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于临床历史与护理观察的分层机器学习模型预测精神分裂症住院患者暴力行为
【字体: 大 中 小 】 时间:2025年09月23日 来源:Frontiers in Psychiatry 3.2
编辑推荐:
本研究开发并验证了一种整合静态临床特征与动态行为评估的分层机器学习模型(LR),用于精准预测精神分裂症住院患者的暴力行为(AUC=0.8741)。该模型通过加权融合策略(α=0.37)显著提升预测性能,关键预测因子包括暴力史(OR=4.638)、躁狂症状(OR=7.801)、愤怒表达(OR=4.649)及失眠(OR=7.422),为临床及时干预提供了数据驱动工具。
精神分裂症是一种严重的精神疾病,患者表现出感知、情感、认知和行为的多维度紊乱。住院精神分裂症患者的暴力行为发生率高达15%-50%,严重影响其他患者和医护人员的安全,增加约束隔离等强制措施的使用,进而提升医疗成本和社会负担。传统暴力风险评估多依赖静态因素(如年龄、性别、暴力史)或动态症状(如命令性幻听、愤怒表达),但单一视角预测精度有限。临床常用的结构化专业判断工具(如HCR-20)虽能系统整合风险因素,但仍依赖 clinician的主观整合,难以客观权衡大量因素的复杂非线性关系。机器学习(ML)技术因其处理高维数据和复杂模式的能力,为精神病学预测提供了新途径。然而,现有ML模型多采用"扁平"架构,将静态与动态特征等同处理,导致高影响力静态特征(如性别、既往暴力)掩盖细微但关键的动态波动。本研究旨在开发一种分层机器学习模型,显式分离并优化整合静态与动态风险因子,以提升预测精度与临床可解释性。
本研究回顾性纳入2021年7月至2024年7月辽宁省某精神病院住院的346例精神分裂症患者(ICD-10诊断标准),年龄18-65岁,住院时间>2周且完成≥2次护理观察量表评估。排除标准包括严重躯体疾病、器质性脑病及首周即发生暴力事件者(缺乏事前行为数据)。最终样本中,暴力组123例,非暴力组223例。患者平均年龄43.8±12.5岁,男性54.9%,未婚75.1%,初中及以下学历76.3%,在职81.2%,中位病程14年,平均住院6.34±2.67周,34.4%有物质滥用史,75.4%有暴力史。
数据源自电子病历(EMR)和精神病患者护理观察量表(基于NOSIE-30扩展的39项版本)。静态特征包括18项入院时采集的人口学与临床基线特征(如年龄、性别、职业、病程、婚姻、教育、人格特质、物质滥用史、暴力史、高风险命令幻听、被害妄想、思维障碍、感知异常、智力、注意缺陷、记忆损害、抑郁绝望、躁狂症状)。动态特征为每周五由主管护士评定的39项行为指标(Likert 0-3分),涵盖 ward规则遵守、个人物品管理、活动参与、着装、躯体不适、人际互动、情绪表达、个人卫生、饮食、愤怒、 agitation、语速加快、自言自语、不当笑声、幻听、久坐、精神运动迟缓、失眠、哭泣、抑郁、自我评价、病识感、出院意愿等。
暴力行为定义为住院期间针对他人或财产的故意物理力量或权力使用(包括威胁或实际行动),可能导致损伤、心理伤害或财产损失(符合WHO暴力定义及HCR-20、OAS、BVC标准)。具体包括殴打、踢踹、推搡、咬伤、投掷物品、破坏财产等,排除纯言语威胁、侮辱、自伤及自杀行为。由两名精神科主治医师独立回顾EMR、护理记录与不良事件报告,通过关键词筛查与共识讨论确定分组:≥1次暴力事件者归为暴力组(n=123),否则为非暴力组(n=223)。
数据按患者ID随机分为70%训练集与30%测试集。分类变量进行二进制编码(如性别、婚姻、就业、物质滥用史、暴力史、精神病性症状),序数变量保留等级(如教育水平:0=无/小学,1=初中,2=高中/职校,3=大学及以上)。连续变量(如年龄、病程、观察评分)进行Z-score标准化。缺失值采用中位数(连续)或众数(分类)填补。
模型构建采用分层设计:
静态基线模型(R0):基于18项静态特征,使用正则化逻辑回归(LR)并优化超参数(惩罚类型:l1/l2/elasticnet;C值:10-4-104;求解器:liblinear/lbfgs/saga;最大迭代:100/200),通过5折交叉验证网格搜索选择最佳参数(最终采用L2惩罚、C=1.0、liblinear求解器、200迭代)。
动态行为模型(Rdyn):基于39项动态特征(每周评分取平均),同样使用正则化LR并调参(最优为L2惩罚、C=0.5、liblinear)。
模型融合:采用加权线性组合 R = αR0 + (1-α)Rdyn,α∈[0,1]通过网格搜索(步长0.05)选择最优值(LR+LR融合α=0.37)。
为对比性能,同时训练了其他ML模型(SVM、XGBoost、RF、MLP、KNN),但LR在静态与动态模型中均表现最佳,故作为最终选择。
采用敏感性(召回率)、特异性、准确率、阳性预测值(PPV)、阴性预测值(NPV)、AUC及混淆矩阵全面评估模型性能。
单因素分析显示,暴力组与非暴力组在多个静态与动态特征上存在显著差异(P<0.05)。静态特征中,年龄更小、病程更短、暴力史、躁狂症状、 hopelessness、高风险命令幻听、教育水平、职业状态差异显著;动态特征中,31/39项行为指标差异显著,包括愤怒表达、失眠、幻听、活动参与度低、个人卫生差等。
多因素逻辑回归识别出独立预测因子:
静态模型:暴力史(OR=4.638, 95%CI:2.169-9.918, P<0.001)、躁狂症状(OR=7.801, 95%CI:1.449-41.997, P=0.017)、 younger年龄(OR=0.966, 95%CI:0.937-0.997, P=0.030)、高风险命令幻听(OR=2.602, 95%CI:1.033-6.553, P=0.043)。
动态模型:愤怒表达(OR=4.649, 95%CI:2.555-8.458, P<0.001)、失眠(OR=7.422, 95%CI:2.212-24.900, P=0.001)、幻听(OR=2.092, 95%CI:1.319-3.317, P=0.002)为风险因子;精神运动迟缓(OR=0.467, 95%CI:0.235-0.927, P=0.030)和病识感(OR=0.636, 95%CI:0.415-0.973, P=0.037)为保护因子。
静态基线模型(仅4项显著特征)AUC=0.7953,敏感性0.4846,特异性0.8955,准确率0.7500;动态行为模型(仅5项显著特征)AUC=0.8003,特异性0.8507,PPV=0.6552。分层融合模型(α=0.37)AUC提升至0.8741,敏感性0.7838,特异性0.8358,准确率0.8173,显著优于单一模型。其他ML算法(如SVM、XGBoost)使用全特征集但未超越LR性能。
本研究成功构建了一种分层机器学习模型,通过分离与融合静态临床历史与动态护理观察,显著提升了精神分裂症住院患者暴力行为的预测精度。关键静态预测因子(暴力史、躁狂症状、年轻年龄、命令幻听)与动态因子(愤怒表达、失眠、幻听)与既往研究一致,证实了多维度评估的必要性。动态特征权重更高(α=0.37),突显其对于短期风险预警的敏感性。模型的高AUC(0.8741)与平衡的敏感特异性表明其临床实用价值,可为医护人员提供客观、数据驱动的决策支持,助力早期干预与资源优化。
局限包括回顾性设计、单中心样本、周度评估粒度较粗及样本量较小。未来需前瞻性、多中心验证,并探索实时监测技术(如可穿戴设备)与生物标志物(神经影像、遗传)的整合,以进一步优化预测效能与机制理解。
生物通微信公众号
知名企业招聘