一种新颖的、结合了轻量级梯度提升模型的鹈鹕优化算法(Pelican Optimization Algorithm)与混合模型,用于智能基础设施:这是一种高精度的占用率和故障预测方法
《Green Technologies and Sustainability》:Novel and hybrid model of pelican optimization algorithm with light gradient boosting model for smart infrastructure: A high-precision approach to occupancy and failure prediction
【字体:
大
中
小
】
时间:2025年12月04日
来源:Green Technologies and Sustainability CS9.7
编辑推荐:
本研究提出结合Pelican优化算法(POA)与LightGBM模型的预测框架,用于建筑占用预测和结构健康监测。通过对比随机森林、梯度提升树等六种机器学习模型,验证POA-LightGBM在F1分数(训练0.9373,测试0.9267)、AUC-ROC(训练0.9995,测试0.9990)等指标上最优,尤其擅长处理不平衡数据。可视化分析显示该模型预测误差最小且最稳定,SHAP值解释表明特征2和7对模型输出影响显著。研究为智能建筑提供高效能、可解释的预测工具,推动预防性维护和能源优化。
本文围绕智能建筑结构健康监测中的建筑入住率预测问题,提出了一种融合 pelican 优化算法(POA)与轻量级梯度提升树模型(LightGBM)的创新解决方案。研究基于2015年PHM数据挑战赛的多源传感器时序数据,构建了涵盖设备状态、能耗参数及空间分布特征的复合数据集,重点突破传统结构健康监测存在的数据维度高、标注精度低、模型可解释性差等核心挑战。
研究首先系统梳理了结构健康监测(SHM)的技术演进路径。传统监测依赖人工巡检与周期性检测,存在响应滞后、成本高昂、易受主观因素影响等缺陷。近年来机器学习技术的引入显著提升了预测效能,但现有研究存在三大痛点:其一,模型优化多依赖网格搜索等暴力方法,难以适配高维参数空间;其二,黑箱模型与工程实践需求存在认知鸿沟;其三,多源异构数据融合不足制约预测精度。基于此,本研究创新性地将海洋鸟类捕食行为解构为优化算法,通过模拟 pelican 群体协同搜索策略,实现了模型参数的智能优化。
在算法架构设计方面,研究团队构建了"数据预处理-特征工程-模型优化-性能评估"的完整技术链条。数据层采用多尺度传感器网络,涵盖位移、温度、能耗等12类动态参数,通过时间序列分解与特征降维处理,将原始127,691条样本转化为包含空间分布特征、设备运行状态特征和用户行为特征的三维特征矩阵。值得注意的创新点是引入了动态时间窗机制,将原始15分钟间隔数据扩展为多粒度时间序列特征,有效捕捉建筑使用模式的时序规律。
模型优化阶段,研究提出 POA-LightGBM 的协同优化框架。该框架突破传统优化算法的局部搜索局限,通过模仿 pelican 群体捕食行为,构建了"全局探索-局部精细化"的双阶段优化机制。在全局搜索阶段,采用随机种群初始化策略,通过模拟 pelican 群体飞行轨迹生成多维度参数组合;在局部优化阶段,引入动态收缩因子控制搜索范围,当发现有效解时自动缩小搜索步幅,实现算法效率与精度的平衡。这种生物启发的优化策略使模型参数搜索时间缩短了73%,同时将最优解的收敛精度提升至0.1%以内。
性能评估部分采用多维指标体系进行对比验证。实验数据显示,POA-LightGBM模型在测试集上实现了F1-score 0.9267,AUC-ROC 0.9990的卓越表现,较传统随机森林模型提升9.3个百分点。特别是在处理类别不平衡问题方面,研究创新性地引入动态权重调整机制,使模型在多数样本占比低于5%的故障预测场景下仍保持0.88的平衡准确率。可视化分析表明,该模型具有明显的特征依赖性,前7个特征(包括设备振动频率、温湿度梯度、能耗波动率等)贡献了总重要性的82%,其中第6特征(设备运行负载指数)对模型输出的影响最为显著。
研究特别强调工程实践中的可解释性设计。通过开发可视化特征重要性图谱,结合SHAP值分解技术,建立了从模型预测到工程决策的转化机制。例如,当检测到 HVAC 系统异常时,系统会自动生成包含特征贡献度、异常模式分类及维修建议的可视化报告,这种"预测-解释-决策"闭环体系显著提升了工程人员的接受度。在模型鲁棒性测试中,POA-LightGBM表现出优异的抗干扰能力,在传感器噪声超过15%的模拟场景下,预测误差仍控制在0.5%以内。
实际应用方面,研究团队开发了模块化部署方案。该方案将模型推理过程分解为特征提取、实时预测、结果可视化三个独立模块,支持在边缘计算设备(如工业网关)上实现每秒20次的实时预测。在长沙某高层建筑实测中,系统成功将HVAC能耗峰值降低18.7%,同时将设备故障预警时间提前至平均72小时。特别值得关注的是,系统通过动态学习机制,可在3天内完成对新建筑类型(如装配式建筑)的模型自适应,展现出良好的迁移学习能力。
未来研究方向聚焦于三个维度:首先,构建跨建筑类型的多场景联合训练框架,解决模型泛化性问题;其次,研发基于联邦学习的分布式模型部署方案,满足建筑群隐私保护需求;最后,探索数字孪生技术与本模型的融合路径,实现从预测到数字孪生驱动的闭环运维。这些技术突破将推动建筑监测从"事后响应"向"事前干预"的范式转变,为新型城镇化建设提供关键技术支撑。
研究的社会经济价值体现在三个方面:其一,通过精准预测降低建筑运维成本,按测算可减少年度能耗支出23%-35%;其二,提升公共基础设施韧性,将重大结构失效预警时间从传统方法的48小时延长至72小时以上;其三,促进智慧城市数据资产化,所构建的预测模型已实现专利授权(专利号ZL2023XXXXXXX),相关技术正在与建筑管理云平台进行集成测试。该成果不仅填补了建筑监测领域智能优化算法的空白,更为后续研究提供了可复用的技术框架。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号