基于无人机采集与机器学习的建筑表面缺陷检测数据集MBDD2025构建与验证
《Scientific Data》:A dataset of building surface defects collected by UAVs for machine learning-based detection
【字体:
大
中
小
】
时间:2025年11月23日
来源:Scientific Data 6.9
编辑推荐:
本研究针对建筑表面缺陷检测领域缺乏大规模高质量标注数据集的瓶颈问题,构建了一个基于无人机(UAV)采集、涵盖六种建筑结构类型和五种典型缺陷类别的大规模数据集MBDD2025。该数据集包含14,471张高分辨率图像,采用标准化边界框标注,并通过35种主流目标检测模型(包括YOLO系列和Faster R-CNN)进行系统验证。研究结果表明,该数据集在mAP@0.5等关键指标上显著优于现有数据集,为建筑缺陷智能检测提供了重要的数据基础和基准参考,推动基础设施智能维护技术的发展。
随着全球城市化进程加速,建筑结构安全日益成为关乎公共安全的重要议题。传统建筑表面缺陷检测主要依赖人工目视检查,这种方法不仅劳动强度大、效率低下,而且检测结果易受人员经验影响,导致判断标准不一。更为严峻的是,全球范围内约40%的重大建筑倒塌事故均由结构性缺陷引发,这凸显了早期准确识别建筑缺陷的迫切性。尽管深度学习技术为自动化检测带来了希望,但其在实际工程中的应用仍面临重大挑战——缺乏大规模、高质量且具有多样性的标注数据集。
现有数据集如CODEBRIM和CUBIT-Det在图像数量、缺陷类别覆盖度和建筑结构多样性方面存在明显不足。例如,CODEBRIM仅包含1,590张图像,且主要关注桥梁结构;CUBIT-Det虽然图像数量达到5,527张,但缺陷类别有限,且缺乏对不同建筑材料的系统覆盖。这些局限性严重制约了深度学习模型在真实复杂场景中的泛化能力。
为解决这一难题,由安徽农业大学工程学院查启凯、姚一鸣等研究人员组成的团队在《Scientific Data》上发表了题为"A dataset of building surface defects collected by UAVs for machine learning-based detection"的研究论文,推出了MBDD2025数据集——一个专门为建筑缺陷检测设计的大规模、多场景基准数据集。
研究团队在安徽省合肥市六个行政区域系统采集了建筑表面影像数据,覆盖城乡多种建筑环境。采用大疆Mini 4K多旋翼无人机平台,配备1/1.3英寸CMOS传感器,能够生成4000×3000像素的高质量航空影像。数据采集过程中,无人机在5-25米高度运行,以倾斜和垂直角度捕捉图像,确保立面的完整覆盖和缺陷的充分可见性。
研究团队创新性地设计了基于摄影测量路径规划原则的飞行算法,采用锯齿形飞行模式,有效提高了图像采集效率。特别值得关注的是,团队针对不同光照条件(低光、常光、强光)进行了系统采集,极大丰富了数据集的场景多样性。在数据清洗和增强环节,针对数量严重不足的鼓包缺陷类别(仅98个样本),通过360°旋转和裁剪技术将样本量扩充十倍至980个,显著改善了类别平衡问题。
数据标注采用计算机视觉标注工具(CVAT),以Pascal VOC格式输出标注文件。为确保标注质量,研究团队制定了清晰的缺陷识别标准,并采用交叉验证和行业专家评审机制。最终数据集包含14,471张高质量图像,系统标注了裂缝、渗漏、脱落、腐蚀和鼓包五类典型缺陷。
数据集在六种建筑结构类型中的分布呈现出明显的差异性:钢结构建筑主要出现腐蚀缺陷(1,321个样本),木结构建筑则涵盖了全部五类缺陷,砖混结构建筑中裂缝(1,509个)和脱落(1,040个)缺陷较为常见。这种分布真实反映了不同建筑材料在实际使用中的缺陷特征。
技术验证环节,研究团队使用YOLOv8n模型进行基准测试,结果显示该数据集在精确率(85.8%)、召回率(80.8%)、mAP@0.5(86.7%)和mAP@0.5:0.95(48.6%)等关键指标上均表现优异。特别值得注意的是,在渗漏和鼓包缺陷检测中,mAP@0.5分别达到95.8%和89.8%,展现了出色的类别识别能力。
与同类数据集的对比实验更具说服力。在相同的YOLOv8n模型和训练参数下,MBDD2025的mAP@0.5(86.7%)显著高于CUBIT-Det(73.7%)和CODEBRIM(24.9%)。这一结果充分证明了新数据集在图像质量、标注准确性和任务适应性方面的优势。
为全面评估数据集的泛化能力,研究团队在35种主流目标检测模型上进行了系统验证,涵盖了从YOLOv5到YOLO11的多个版本以及Faster R-CNN等经典架构。实验结果表明,YOLO系列模型在该数据集上表现尤为突出,其中YOLOv10-x、YOLOv10-b和YOLO11-x的mAP@0.5均超过89%,最高mAP@0.5:0.95达到53.3%。
值得注意的是,尽管模型架构存在显著差异,但MBDD2025数据集在不同模型上都保持了较高的兼容性和检测精度。例如,YOLOv9至YOLO11等新版本模型通过引入PGI-GELAN主干网络和CNN-Transformer检测头等先进组件,显著提升了对小目标和低对比度缺陷的检测能力。相比之下,两阶段检测框架Faster R-CNN的表现相对较弱,其在裂缝和脱落类别上的AP值最低仅为29.9%和41.1%,反映出在复杂背景下对小目标检测的局限性。
通过对比不同模型在同一测试图像上的检测结果,研究发现了一个有趣现象:对于边界模糊、形状不规则的缺陷(如裂缝和脱落),各模型在边界框位置、大小和置信度分数上存在明显差异。一些模型会对同一缺陷产生多个检测框,特别是在纹理复杂或光照不均的场景下。这种变异性既反映了缺陷本身的内在复杂性,也体现了数据集在评估模型泛化能力方面的价值。
以腐蚀缺陷检测为例,YOLOv9-s和YOLOv9-m表现出稳定的性能,而YOLOv8-s则容易受到背景中广告元素的干扰。在鼓包缺陷检测中,尽管各模型识别的区域基本一致,但置信度分数差异显著,这表明模型对缺乏强烈纹理特征的结构变化敏感性存在差异。
MBDD2025数据集的建立填补了建筑缺陷检测领域大规模基准数据的空白。其核心价值体现在三个方面:首先,数据规模显著超越现有数据集,为训练更稳健的深度学习模型提供了基础;其次,缺陷类别和建筑结构的多样性确保了模型在真实场景中的适用性;最后,系统的多模型验证为算法比较和优化提供了可靠基准。
从技术发展角度看,该研究验证了"数据质量优于模型架构"的重要观点。实验表明,从YOLOv8到YOLO11的模型架构改进带来的性能提升,远不及使用高质量数据集带来的增益显著。这一发现为后续研究指明了方向——在追求模型创新的同时,更应关注数据质量的提升。
在实际应用层面,该数据集不仅适用于建筑外墙缺陷识别,还可扩展至桥梁结构健康监测(SHM)等更广泛的基础设施安全评估场景。通过将基于深度学习的视觉检测结果与结构响应传感器、振动监测系统相结合,该方法能够为裂缝、腐蚀等关键表面损伤提供直观的时空信息,从而实现结构性能退化的连续跟踪和早期预警。
本研究构建的MBDD2025数据集通过系统化的数据采集、严谨的标注流程和全面的性能验证,为建筑缺陷检测研究提供了重要的数据资源。数据集在规模、多样性和质量方面的优势,使其成为该领域一个新的基准。多模型验证结果表明,数据集在各类现代目标检测架构上都表现出良好的兼容性和稳定性。
未来研究方向包括进一步扩大数据规模、丰富缺陷类别、优化标注质量,以及开发针对建筑缺陷特性的专用检测算法。同时,探索数据集在跨域迁移学习、小样本学习等前沿方向的应用潜力也值得期待。随着智能建造和基础设施维护需求的日益增长,MBDD2025数据集将为推动建筑检测技术向自动化、智能化方向发展提供持续支撑。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号