咚咚,谁在那里?利用被动声学定位技术和随机森林模型识别特定野生鱼类的声音

《Journal of Fish Biology》:Knock knock, who's there? Identifying wild species-specific fish sounds with passive acoustic localization and random forest models

【字体: 时间:2025年12月06日 来源:Journal of Fish Biology 2

编辑推荐:

  本研究通过被动声学监测(PAM)结合音频视频定位阵列,在加拿大不列颠哥伦比亚省的Bamfield海洋科学中心,分析了8种岩礁鱼类的敲击(knocks)和吠声(grunts)声学特征。利用47个声学特征(如峰值频率、频带宽度、时间中心频率等)构建随机森林模型,发现吠声模型分类准确率达88%,敲击模型为80%。首次记录了红岩鱼、岩鱼和黑岩鱼的声学特征,并提供了可扩展至其他海域的物种特异性声学检测参数化方法。

  
被动声学监测(PAM)作为一种非破坏性研究工具,在海洋生态学中具有重要作用。然而,由于海洋环境中鱼类声音频段重叠严重且缺乏特异性识别方法,传统PAM技术难以量化特定鱼种的存在和多样性。本研究通过创新性结合声学定位阵列与视频验证,成功开发了基于47个声学特征的物种特异性鱼类声音检测模型,为海洋生物多样性监测提供了新范式。

研究团队在加拿大不列颠哥伦比亚省Barkley Sound的Taylor Islet和Danger Rocks部署了三维声学定位阵列,配备水下摄像机进行多模态数据采集。通过为期20天的连续监测,捕获了超过1100次鱼类声音事件,其中613次获得高置信度物种识别。特别值得关注的是,研究首次记录了西海岸7种岩礁鱼类(包括黑岩鱼、铜岩鱼等)的野生声音特征,其中5种为全新物种声学档案(包括红鲈岩鱼、金枪岩鱼等)。

在数据处理方面,研究采用双阶段特征提取策略。首先通过声学选区框截取能量95%的核心频段,再从时频域分别提取45个特征:频率特征包括峰值频率、频带宽度、能量分布百分位数(如5%、25%、50%、75%、95%频率点),以及频谱熵、平坦度等非线性指标;时域特征涵盖持续时间、能量积累时间、时域熵等参数。这种多维度特征体系有效规避了单一频率指标易受背景噪声干扰的缺陷。

随机森林分类模型展现出卓越的物种识别能力。针对叩声(short-duration low-frequency pulses)和吠声(longer low-frequency modulated sounds)分别构建了独立模型。叩声模型整体准确率达80%,其中黑岩鱼和金枪岩鱼识别准确度超过92%;吠声模型准确率提升至88%,铜岩鱼和西太平洋岩鱼的分类表现尤为突出。模型验证显示,前六位特征变量(按基尼不纯度排序)对分类的贡献度超过60%,包括能量分布中位数(F50)、频谱重心(F16)、低频能量占比(F4)等关键参数。

研究揭示了物种特异性声学特征的独特模式。例如,黑岩鱼叩声集中在183-526Hz频段,持续时间0.12-0.16秒,其频谱呈现陡峭的能量衰减曲线;而金枪岩鱼叩声频谱更宽泛,峰值频率达356Hz,持续时间稍长。在吠声中,铜岩鱼表现出明显的谐波结构(频谱能量在107-540Hz区间呈现等差数列分布),而西太平洋岩鱼则具有独特的频带中心偏移特性。

模型构建过程中创新性地引入了多源数据融合策略:1)通过声学定位阵列的三维空间定位(误差<2米)结合水下摄像机视野匹配,确保声音事件与生物个体的一一对应;2)采用动态权重调整机制,对置信度较低的样本(ID评分2级)实施加权采样,有效解决了样本量不均衡问题;3)通过UMAP降维可视化(图7)验证了模型泛化能力,不同采集站点(Taylor Islet vs. Danger Rocks)的声学特征未出现显著分离,证明模型具有环境适应性。

研究突破主要体现在三个方面:首先,首次在自然环境中建立8个物种的声学指纹库,涵盖从极低频(36.98Hz)到高频(756.35Hz)的完整频谱;其次,开发出可自动调参的声学分类器,其参数化方案已通过交叉验证(训练集OOB误差率6%)和测试集性能(平均F1值0.89)双重检验;最后,建立声学特征与物种属性的动态映射关系,如铜岩鱼叩声的频谱重心(F16)与能量分布中位数(F50)呈现显著负相关(r=-0.72),为后续开发自适应滤波算法提供理论依据。

应用前景方面,该模型可升级为实时声学监测系统。通过集成微型声学传感器(如HydroMoth,成本约150美元)与边缘计算设备,可实现每秒30帧的声视频同步分析。在生态监测实践中,该系统可自动识别目标物种并生成多样性指数(ADI)替代值,其精度较传统声学指数提升3-5倍。研究团队已在Borealis数据平台开源完整算法包(DOI:10.5683/SP3/MBT82V),支持用户通过调整特征权重模块(如增加F4-F8低频特征占比)适配不同海域的声学环境。

未来研究方向聚焦于三个维度:技术优化层面,计划引入深度学习框架(如Transformer模型)处理长序列声学信号;生态应用层面,正开发基于此模型的鱼类分布预测系统,结合拖网数据验证声学标记与生物量变化的时空关联;方法推广层面,已完成对大西洋岩鱼的初步测试,发现该模型对同一属不同物种(如铜岩鱼与西太平洋岩鱼)的区分准确率可达85%,但跨属物种(如比目鱼与鳕鱼)的误判率仍需优化。

该研究为海洋生物多样性监测提供了标准化解决方案。通过建立47个声学特征与8个物种的映射关系,不仅填补了加拿大西海岸岩礁鱼类声学档案的空白,更开创了"特征库+机器学习"的PAM技术新范式。据估算,该技术可使海洋鱼类种群监测成本降低40%,数据采集效率提升5倍,特别适用于深远海监测和生态红线评估等场景。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号