面向虚拟仿真的音频电路多非线性显式建模:基于矢量波与神经网络的高效方法
《IEEE Open Journal of Signal Processing》:Explicit Modeling of Audio Circuits With Multiple Nonlinearities for Virtual Analog Applications
【字体:
大
中
小
】
时间:2025年12月01日
来源:IEEE Open Journal of Signal Processing 2.7
编辑推荐:
本文针对虚拟模拟(VA)中多非线性音频电路实时仿真计算成本高的问题,提出了一种结合矢量波与神经网络(Wave Digital Filters, WDFs)的显式建模方法。该方法通过将多个非线性元件整合为单N端口块,并利用神经网络近似非线性关系,实现了VOX V847 Wah-Wah和Fuzz Face效果器的高精度、高效率仿真(实时比分别达0.15和3.17),为复杂非线性音频电路的实时仿真开辟了新途径。
在数字音频领域,音乐家和音频工程师一直渴望能够精准复刻经典模拟设备(如吉他效果器、音频放大器)的独特音色。这种将模拟设备“数字化”的技术被称为虚拟模拟(Virtual Analog, VA)。然而,尽管技术不断进步,一个核心难题始终困扰着研究人员:如何实时、高效地仿真那些包含多个非线性元件(如晶体管、二极管)的复杂模拟音频电路?传统的白盒建模方法,如波数字滤波器(Wave Digital Filters, WDFs),虽然在处理线性元件和单个非线性元件时表现出色,但在面对多个非线性元件时,往往陷入计算瓶颈,需要依赖迭代求解器,极大地增加了计算成本,限制了其在实际实时应用中的潜力。
波数字滤波器方法因其高模块化和数值稳定性而备受青睐。它通过引入波变量(入射波aj和反射波bj)来代替传统的基尔霍夫变量(电压vj和电流ij),并借助端口电阻(Zj)这一自由参数来消除模块连接时产生的无延迟环路(Delay-Free Loops, DFLs),从而实现显式计算。对于单个非线性元件(无论是一端口还是两端口),通过选择合适的端口电阻,可以将其适配到连接树的根节点,从而避免迭代。然而,当电路中存在多个非线性元件时,这些元件之间的相互依赖关系会形成复杂的隐式方程组,传统的WDF方法难以构建一个完全显式的树状结构,通常不得不求助于牛顿法等迭代技术,牺牲了计算效率。
为了解决这一挑战,来自米兰理工大学的研究团队在《IEEE Open Journal of Signal Processing》上发表了一项创新性研究。他们提出了一种新颖的显式建模框架,旨在实现对包含多个(甚至多端口)非线性元件的音频电路进行高效、实时的仿真。该方法的核心思想在于巧妙地扩展了矢量波(Vector Waves)的应用。
为了验证所提方法的有效性和效率,研究人员选择了两个经典的吉他效果器电路作为案例:VOX V847 Wah-Wah和Arbiter Electronics Fuzz Face。这两个电路均包含两个双极结型晶体管(Bipolar Junction Transistors, BJTs),是测试多非线性建模方法的理想对象。
研究人员首先为每个案例构建了相应的波数字滤波器结构。以VOX V847为例,其WDF实现包含一个23端口的拓扑连接点。关键的一步是将两个BJT(每个被视为一个两端口非线性元件)组合成一个单一的4端口非线性WD块。这个4端口块连接到拓扑连接点的前4个端口,这4个端口使用矢量波定义。通过计算并设置一个特定的4x4参考多端口电阻矩阵Z1:4,使得拓扑连接点散射矩阵S中对应于这4个端口的4x4对角子矩阵为零,从而实现了这4个端口的适配。连接点上的所有线性元件(电阻、电容、电感)则按照传统的WDF方法进行适配,并采用后向欧拉(Backward Euler)方法进行离散化。这样,整个WD结构形成了一个显式的树状连接,根节点就是包含了所有非线性关系的4端口WD块。
接下来,核心任务是如何对这个4端口非线性WD块进行建模。研究人员采用了一种数据驱动的方法。他们首先在基尔霍夫域为每个BJT生成数据集,通过扫描其工作电压范围(例如,对于Q1,v1在[0, 0.75] V,v2在[-9, -1] V),并利用扩展的Ebers-Moll模型计算对应的电流i1和i2。然后,使用之前确定的Z1:4矩阵,通过矢量波定义将基尔霍夫变量(v1Q1, i1Q1, v2Q1, i2Q1, v1Q2, i1Q2, v2Q2, i2Q2)转换为波变量(a1, a2, a3, a4和b1, b2, b3, b4)。这样就得到了用于训练神经网络的数据集,其目标是学习从入射波向量a到反射波向量b的映射函数b = f(a)。
研究人员采用了一个多层感知机(Multi-Layer Perceptron, MLP)来近似这个非线性函数。该MLP具有4个隐藏层,每层64个神经元,使用指数线性单元(Exponential Linear Unit, ELU)作为激活函数,总共包含13060个可训练参数。网络使用PyTorch框架实现,并采用Cauchy损失函数进行优化,该损失函数在处理回归问题时能有效限制异常值的影响。训练后的模型在测试集上表现出极高的精度,对于VOX V847和Fuzz Face案例,归一化均方误差(Normalized Mean Squared Error, NMSE)分别低至4.14x10-8和7.16x10-8。
在性能测试中,研究人员将提出的WDF模型与MathWorks Simscape的仿真结果进行了比较。输入信号为振幅0.7V、频率100Hz的正弦波。时域和频域的比较结果都显示出极高的一致性。
对于VOX V847,输出信号Vout的均方误差(Mean Squared Error, MSE)为3.22x10-6,频域响应的平均绝对误差(Mean Absolute Error, MAE)为0.062 dB。最重要的是实时性能指标,实时比(Real-Time Ratio, RTR)衡量了仿真速度相对于实时速度的快慢(RTR < 1表示可实时运行)。提出的WDF方法对于VOX V847和Fuzz Face的RTR分别达到了惊人的0.15和3.17,远低于Simscape的相应值(5.69和10.36),证明了该方法的高效性。
本研究成功提出并验证了一种基于矢量波和神经网络的新型显式Wave Digital Filter方法,用于高效仿真包含多个非线性元件的音频电路。该方法通过将多个非线性元件整合为一个N端口块,并利用适配的多端口电阻消除延迟无环路,从而构建了完全显式的WD结构。使用神经网络(如MLP)在波域直接近似非线性映射,避免了运行时迭代求解或插值计算,显著提高了效率。
研究结果表明,该方法在仿真经典的VOX V847和Fuzz Face效果器电路时,达到了与商业仿真软件Simscape相媲美的高精度,同时计算效率大幅提升,展现出优异的实时仿真潜力。这项工作突破了传统WDF方法在处理多非线性电路时的限制,极大地扩展了可用于虚拟模拟(VA)应用的音频电路类别,为未来实时仿真包含大量非线性元件的复杂音频系统铺平了道路。未来的工作可以探索将更多类型和数量的非线性元件整合到同一WD块中,并研究更高效的神经网络架构以进一步降低计算成本。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号