首页 > 其他分享 >NNbased AEC模型归纳

NNbased AEC模型归纳

时间:2023-02-28 16:46:21浏览次数:59  
标签:回波 归纳 模型 噪声 协方差 AEC NNbased 卡尔曼滤波 近端

  • near-end signal:近端信号,最终需要的
  • far-end signal:远端信号,喇叭播放的,需要消除的

目前nnAEC大致包括以下方案:

  1. 端到端模型:一个模型承担所有功能;

  2. 传统线性部分+nn NLP(nn RES);

  3. 传统线性部分+模型承担RES和NS功能,eg.NN3A

  4. nn AEC+nn NLP(post filtering):分成两个模型来共同处理,可以联合训练;

  5. 沿用传统的处理框架,用NN去预测一些传统算法的关键量,eg.NKF

方案2-1

Nonlinear Residual Echo Suppression using a Recurrent Neural Network

Lukas Pfeifenberger, Franz PernkopfSignal Processing and Speech Communication Laboratory,Graz University of Technology, Graz, Austria

该模型是基于一个小的RNN实现的,提出了一种低资源实现并具有实时处理能力的RES功能网络,对应下图中绿色框,属于方案二的一种实践。

方案2-2

Acoustic Echo Cancellation by Combining Adaptive Digital Filter and Recurrent Neural Network

Lu Ma, Hua Huang, Pei Zhao, Tengrong Su Haier Smart Home Co., Ltd

后续待补充

方案3-1

NN3A: NEURAL NETWORK SUPPORTED ACOUSTIC ECHO CANCELLATION, NOISE SUPPRESSION AND AUTOMATIC GAIN CONTROL FOR REAL-TIME COMMUNICATIONS

Ziteng Wang, Yueyue Na, Biao Tian, Qiang Fu Alibaba Group, China

摘要:声学回波消除(AEC)、噪声抑制(NS)和自动增益控制(AGC)是实时通信(RTC)中常用的三个模块。本文提出了一种神经网络支持的RTC算法NN3A,该算法结合了自适应滤波器(线性部分)多任务模型,用于残余回波抑制(RES)、降噪(NS)和近端语音活动检测(VAD)。所提出的算法被证明优于使用单独模型的方法和端到端替代方法。结果表明,该模型中存在残差抑制和近端语音失真之间的平衡关系,可以通过一种新的损失加权函数进行平衡。本文还研究了训练关节模型的几个实际方面,以使其性能达到极限。

图2 NN3A算法流程图

  1. 信号模型--麦克风接收信号为\(d(t)=x(t)*a(t)+s(t)+v(t)\),其中\(x(t),s(t),v(t)\)分别表示远端信号,近端信号,环境噪声;

  2. 线性滤波部分--在频域进行\(E_{t,f}=D_{t,f}-\mathbf{w}_{L,f}^H\mathbf{x}_{L,f}\)

  3. 神经网络--输入:\(\mathbf{f}_t=\left \{ E_{t,f},Y_{t,f},D_{t,f},X_{t,f} \right \}\),输出:\(M_{t,f},P_{t}\)分别为降噪的Mask和近端语音概率(VAD)

  4. 损失函数Loss--

$\left\{\begin{matrix}\mathcal{L} _{mask}=\sum_{t,f}^{}{\alpha _{t,f}\left | M_{t,f}-\bar{M}_{t,f} \right | ^2} \\\mathcal{L} _{vad}=\sum_{t}^{}-\bar{P_t}log(P_t)-(1-\bar{P}_t)log(1-P_t) \end{matrix}\right.$

其中$\bar{P}_t\in \left \{ 0,1 \right \}$是近端语音VAD。经验发现,在MSE损失下训练的模型不能完全去除残留回波,不能满足通常人类听觉零回波泄漏的要求。因此,引入加权函数$\alpha _{t,f}=\alpha -\bar{M}_{t,f},\alpha >1$,加权函数将更多的权重放在回声主导TFbin上。

  1. 后处理Post-processing--AGC

$\hat{s} (t)=g(P_t)IFFT(\hat{S}_{t,f})$

$g(·)$为自定义函数,由计算增益的峰值电平检测器和调节增益的增益控制器组成。

方案5-1

LOW-COMPLEXITY ACOUSTIC ECHO CANCELLATION WITH NEURAL KALMAN FILTERING

Dong Yang∗, Fei Jiang∗, Wei Wu, Xuefei Fang, Muyong Cao Tencent GVoice

摘要:卡尔曼滤波器因其对双话的鲁棒性、收敛速度快、稳态性能好等优点被广泛应用于声学回波消除中。卡尔曼滤波器的性能与状态噪声协方差和观测噪声协方差的估计精度密切相关。估计误差可能会导致不可接受的结果,特别是当回波路径发生突变时,卡尔曼滤波器的跟踪性能会显著降低。在本文中,我们提出了神经卡尔曼滤波(NKF),该方法利用神经网络隐式地对状态噪声和观测噪声的协方差进行建模,并实时输出卡尔曼增益。在合成测试集和真实记录测试集上的实验结果表明,与目前最先进的基于模型的方法相比,所提出的NKF具有更好的收敛和再收敛性能,同时保证了较低的近端语音退化。此外,本文提出的NKF模型规模仅为5.3 K, RTF低至0.09,可以部署在低资源平台上。

图1 算法步骤

卡尔曼滤波的收敛性和跟踪能力由状态噪声和观测噪声的协方差控制,可以根据一些假设动态估计协方差。然而,噪声协方差估计误差可能导致不可接受的结果。如Yang et al.[4]指出,当回波路径发生突变时,观测噪声协方差的高估会降低再收敛速度。为了解决这一问题,我们提出将MB方法与数据驱动(DD)方法相结合。更具体地说,我们建议使用可训练的RNN隐式建模状态噪声和观测噪声的协方差,并实时输出自适应卡尔曼增益。这比卡尔曼滤波具有更好的收敛性和跟踪能力[5,6]。与其他神经网络辅助的自适应滤波方法不同,例如深度神经网络控制的频域自适应滤波器(DNN-FDAF)[7]和深度变步长NLMS (DVSS-NLMS)[8]分别在频域和时域进行滤波,我们在时频域进行神经卡尔曼滤波操作,从而获得了更小的模型尺寸(仅5.3 K,而2.4 M和1 M参数)。在合成测试集和真实记录测试集上的实验结果表明,所提出的NKF比传统的自适应滤波器和最先进的MB/DD混合方法Meta-AF[9]具有更好的AEC性能。

标签:回波,归纳,模型,噪声,协方差,AEC,NNbased,卡尔曼滤波,近端
From: https://www.cnblogs.com/lulululuyan/p/17158910.html

相关文章

  • 经典算法动态规划(dp问题归纳)
    1,线性dp求连续子区间问题输入一个整型数组,数组中的一个或连续多个整数组成一个子数组。求所有子数组的和的最大值。要求时间复杂度为O(n)。栗子:输入:1-2310-472-......
  • 经典算法贪心(刷题归纳)
    <贪心算法greedyalgorithnm>本质是让机器模拟人类,每次都按照某一个标准取最优解,一般常用最优子结构问题,但不是所有的时候贪心都获得最优解。跟DP最大的区别在于,贪心不可......
  • 对归纳偏置的理解
    参考SimpleAI这篇帖子:https://view.inews.qq.com/k/20211214A03DKG00其实这个词已经见到很久了,之前也查了一些东西,但是感觉总是说法不一,而且用法也非常普遍,本文用一些论文......
  • C程序问题归纳(static,auto,register,extern,程序内存分布图,linux下程序的执行过程...
    PS:要转载请注明出处,本人版权所有。PS:这个只是基于《我自己》的理解,如果和你的原则及想法相冲突,请谅解,勿喷。前置说明  本文作为本人csdnblog的主站的备份。(BlogID......
  • HDU1098 Ignatius's puzzle (数学归纳法)
    Description:Ignatiusispooratmath,hefallsacrossapuzzleproblem,sohehasnochoicebuttoappealtoEddy.thisproblemdescribesthat:......
  • 网络流杂题+不多的归纳
    照着ppt写博客的时代应是一去不复返了,借不同题目阐述基本思想当为至道。转个链接:https://www.cnblogs.com/SYCstudio/p/7260613.html,这篇笔记写得很好。引入题目之前,阐......
  • 为无用设备添加驱动INF, 如显卡的DEV_1AEC
    ASUS的显卡TUF-GTX1660TI-6G-EVO-GAMING,在win7下会发现这个设备,而且nvidia没有这个win7的驱动,有时会自动搜索这个驱动很烦本身这个东西是没有实际硬件,属于一个虚......
  • 功能测试必备:Fiddler 弱网测试及其测试思路归纳总结
    大家好啊,我是大田之前介绍了一篇使用Charles做弱网测试:功能测试必备:抓包工具Charles弱网测试,本篇来看看Fiddler如何做弱网测试。弱网本质是访问速度特别慢,每秒可能......
  • 传统文化的归纳
    最近无聊看了一些关于中国玄学方面的资料大概知道了以下这些东西。山:用动作来进行修行,对身心的一种锻炼。(八部金刚功等等)医:中医经典命:四柱推命,紫微斗数等等相:看脸懂不,......
  • 计算机网络核心知识归纳
    第一章:概论互联网、以太网、广域网、局域网、万维网局域网:(LocalAreaNetwork,LAN),局域网是一个局部范围的计算计组,比如家庭网络就是一个小型的局域网,里面包含电脑、手机......