
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于声场分布分析的发音侧化性与鼻音性非侵入评估工具开发与应用研究
【字体: 大 中 小 】 时间:2025年09月18日 来源:Clinical Linguistics & Phonetics 1
编辑推荐:
本综述推荐一款创新型声场分布分析系统(Acoustic Field Distribution Analysis),该系统结合定制圆形麦克风阵列与先进算法(如Delay-Sum和DAMAS2),实现了对发音过程中侧化性(laterality)和鼻音性(nasality)的非侵入式量化评估。通过时空谱多维度分析及激光测距(ToF)技术,系统可精准捕捉口腔与鼻腔气流分布差异,为功能性发音障碍(如F80.0)、唇腭裂共振异常(R49.2)等提供可视化诊断工具,推动语音病理学与临床语音学研究的发展。
声场分布分析技术在语音学与临床医学中具有重要价值,尤其在评估发音过程中难以直接观察的侧化性与鼻音性现象时。传统技术如电磁 articulography(EMA)、electropalatography(EPG)和 magnetic resonance imaging(MRI)虽能提供精确的发音器官运动信息,但存在侵入性高、成本昂贵或操作复杂等问题。例如,EMA 需在发音器官上附着传感器,而 MRI 要求受试者保持仰卧姿势,限制了其在自然发音研究中的应用。声学与空气动力学方法(如鼻计仪 nasometer)虽较非侵入,但仅能提供有限通道的数据,难以全面捕捉声场空间分布特征。近年来,麦克风阵列技术被引入语音研究领域,通过多通道信号采集与波束成形算法,实现了对声场分布的高分辨率成像,为发音侧化性与鼻音性的量化分析提供了新途径。
本研究开发了一套便携式声场分布分析系统,命名为 INIA Fusion(Integrated Non-Invasive Analyser)。系统核心为一个定制圆形麦克风阵列,包含 16 个微机电系统(MEMS)麦克风,集成脉冲密度调制器(PDM),支持高采样率音频采集。阵列还配备一个激光多区域距离传感器,采用 Time-of-Flight(ToF)技术,可实时测量受试者面部轮廓并补偿头部微小移动,从而提高声束聚焦精度。ToF 传感器分辨率达 1 mm,采样率为 60 Hz,确保声场与面部几何的同步可视化。
声学成像采用频域 Delay-Sum 算法与改进型 DAMAS2(Deconvolution Approach for the Mapping of Acoustic Sources 2)后处理算法。Delay-Sum 算法通过补偿各麦克风通道的相位延迟,实现宽带信号的高速波束成形;DAMAS2 则通过数学反卷积 Point Spread Function(PSF)提升空间分辨率,抑制旁瓣效应。系统支持实时声源定位,可分析水平面(左-中-右)与垂直面(口腔-鼻腔)的声压分布,并计算声场重心轨迹以量化发音不对称性。
受试者以自然姿势位于阵列前方约 120 mm 处,面部与阵列平面平行。录音任务包括在短语框架(如波兰语“Powiedzia?a… teraz”)中产生目标词语,声场数据与 ToF 图像同步采集,并通过 INIA Fusion 软件进行多模态分析。
一名 29 岁女性患者被诊断为功能性发音障碍(F80.0),伴有咬合发育异常与代偿性发音模式。生理检查显示其头部右旋、下颌左偏,且存在舌系带过短(ankyloglossia)导致的舌位降低与右侧稳定化倾向。声场分析显示,该患者在发音波兰语词“zaszale?”(/za?ale?/)时,所有音素(包括元音与辅音)均呈现左侧单边声压分布,其中边近音 /l/ 的侧化最为显著。水平截面图显示声场重心持续偏左,表明气流主要通过口腔左侧逸出。
相比之下,典型发音者在同一词语中声场分布集中居中,仅 /l/ 音呈现双侧分布(因舌- alveolar ridge 阻塞形成),符合波兰语典型发音模式。这一对比突显了声场分析在检测发音侧化异常中的敏感性。
一名 27 岁男性患者因双侧唇腭裂术后遗留共振障碍(R49.2),尽管多次手术与语音治疗,仍存在腭瘘与鼻腔气流泄漏。声场分析显示,其发音波兰语词“sowa”(/s?va/)时,辅音 /s/ 与 /v/ 以及元音 /?/ 均呈现口-鼻混合共振,垂直截面中声场重心位于鼻腔区域。尤其是 /v/ 发音时,声能完全集中于鼻腔,而 /a/ 元音则为纯口腔发音。水平分析还发现轻微右侧偏化,可能与口腔结构异常相关。
典型发音者的同一词语声场则完全集中于口腔区域,且分布对称,无鼻腔参与。该系统成功捕捉到患者 hypernasality 的细微模式,为手术效果评估与治疗规划提供了客观依据。
本研究开发的声场分布分析系统实现了对发音侧化性与鼻音性的非侵入、高精度量化评估。相较于早期原型,该系统具备更宽分析频带、更高空间分辨率及 ToF 辅助成像能力,结合频域波束成形与 DAMAS2 算法,显著提升了声场可视化的准确性。在临床应用中,该系统可用于唇腭裂、颅面微细畸形及功能性发音障碍的诊断与治疗监测,尤其适用于难以通过听觉判别的细微气流模式(如术后隐性鼻腔泄漏或单/双侧侧化差异)。在科研层面,它为跨人群与发音风格的比较研究提供了新工具。
未来工作将扩大患者样本量以验证系统普适性,并集成人工智能(AI)工具以进一步提升诊断自动化与疗效评估效率。
生物通微信公众号
知名企业招聘