关于线调频小波CNN的可解释性故障诊断

标签：滤波器卷积解释性小波频率频带 CNN 调频

针对当前机械故障智能诊断缺乏可解释性的现状，可以将视角投向具有明显物理意义的传统信号处理方法。传统信号处理方法和神经网络相结合的方向已涌现出不少成果，信号处理赋能神经网络是其中的代表性工作。这类网络融入了传统信号处理方法的先验知识，且将信号处理方法的重要变量设为网络可训练参数，解决了传统诊断方法参数优化难的问题，在机械故障诊断任务中通常能够取得更为优异的诊断表现。

信号处理方法是具有明确的物理意义，这类网络通过梯度传播对嵌入其中的信号处理方法的重要变量进行优化，这些优化后的变量一方面提高神经网络的故障诊断能力，另一方面也能够借助信号处理理论进行分析，获取优化变量背后对应的物理意义，从而实现对网络的解释。

线调频核函数与正弦核函数、Morlet小波核函数的时域图和频谱图如下图所示。

正弦核函数

Morlet核函数

线调频核函

由频谱图可知，3种核函数均可视为带通滤波器，但在滤波特性上存在显著差别。正弦核函数仅通过频率因子f来调整滤波器中心频率，滤波带宽则保持恒定；Morlet小波核函数则通过尺度因子s对滤波特性进行调控，低频带宽小，高频带宽大；线调频小波核函数则通过频率因子f独立调整滤波器中心频率，通过线性调频因子α独立调整滤波器的带宽。因此，相比于正弦核函数和Morlet小波核函数，线调频小波核函数的滤波器中心频率和带宽均可独立调节，更具灵活性。

卷积层的卷积过程是卷积核和输入样本的滑动内积过程，这等价于信号处理领域中的有限冲激响应FIR滤波过程，其中卷积核对应FIR滤波器，输入样本为待滤波信号。基于卷积核和FIR滤波器的对应关系，对卷积核进行适当长度的补零后进行快速傅里叶变换并取模，可得到卷积核滤波过程的幅频响应。考虑到卷积层包含多个通道，因此可以计算出单通道卷积核的幅频响应，并在通道维度上进行平均，得到综合幅频响应。

线调频卷积层本质上是中心频率和带宽可学习的多个带通滤波器，不同通道对信号不同频带进行滤波，其输出为多个滤波子信号的拼接。将线调频卷积层作为预处理层与基准CNN相结合，也就是在基准 CNN 的数据入口处增加一个多通道带通滤波器，当然这个多通道带通滤波器是在整个神经网络框架中的，滤波器的中心频率和带宽由神经网络的 BP 过程进行参数更新。在振动信号中，故障类别信息存在于特定的频带中，即故障信息频带，这些频带能够有效区分各类故障。可以给基准 CNN 添加可学习、可调整的带通滤波器组，即线调频卷积层。基准CNN以提高故障诊断准确率为目标，当带通滤波器组与故障信息频带对应时则获得正反馈，反之与故障无关频带对应时则获得负反馈。网络训练过程使得带通滤波器的中心频率和带宽逐渐与数据集故障信息频带相对应，从而在提高故障表现的同时，也揭示了神经网络模型对数据集不同频带的关注，一定程度上地实现对神经网络这一“黑箱”模型的间接解释。

综合幅频响应可以表征卷积层对于数据集在频域上的关注侧重，即幅频响应中的峰值频率受卷积层的高度关注，携带着重要的类别信息；反之，幅频响应谷值频率则不被卷积层关注，说明该频率的信息与类别特征无关。

将线调频变换融入CNN的卷积层，能够给“黑箱模型”的CNN引入物理层面的可解释性，即通过幅频响应分析方法，可以揭示卷积神经网络提取类别特征和做出判断的频带依据。

以CWRU数据集里负载为3HP工况、采样频率为12kHz的振动信号作为输入样本，对Backbone-CNN 、SincNet、Morlet-WKN和Chirplet-CNN 进行训练。为了得到清楚的模型可解释效果，四类模型的预处理层通道数均设置为 8，其他的试验设置与之前一致。

在完成模型训练后开展卷积层幅频响应分析，得到的数据集振动信号的频谱和模型卷积层的幅频响应如下图所示。

从数据集频谱图a中可知，频谱幅值主要存在于四个频带中，这些频带包含重要的故障类别信息，一个良好的故障诊断模型应该重点关注这些频带，以获得更好的诊断准确率。从模型卷积层的幅频响应图 b～f 可知如下。

(1) 训练后的Backbone-CNN无明显的频响幅值变化，训练后的 Rondom-CNN 仅在频带 4 有明显幅值上升，从而说明作为基准的 Backbone-CNN 和Rondom-CNN 对振动信息提取是不充分的。

(2) 训练后的 SincNet 在频带 1、2、3、4 上均存在明显的幅值峰。说明 SincNet 在训练过程中有效地关注了数据集的信息频带，提取了部分故障分类的相关特征，因此得到了较好的准确率表现。但由于SincNet的核函数只能通过频率因子f调节各通道的中心频率，并不能调节各通道的带宽，所以SincNet 在没有信息分布的高频段仍然存在2个幅值峰，与数据集频谱并非完全吻合。

(3) 训练后的Morlet-WKN在频带 2、3、4 上存在明显的幅值峰，与 Morlet-WKN 在故障诊断中的良好表现相对应。但由于 Morlet 小波具有可变时频窗口的特点，其低频分辨率过于密集而在高频分辨率则过于稀疏，Morlet-WKN 很难具有一个良好的解释效果。

(4) 训练后的 Chirplet-CNN 在频带 1、2、3、4上存在明显的幅值峰和训练变化，表明Chirplet-CNN 很好地关注了数据集的信息频带。Chirplet 核函数不仅能够通过频率因子 f 改变滤波器频率，还能通过线性调频因子α 间接改变滤波器带宽，所以在没有数据集信息的通道中，Chirplet-CNN 可通过调整α 来使得滤波器带宽增大，间接性地降低该通道的频响幅值。因此，Chirplet-CNN 的幅频响应并未如 SincNet 一样，在高频段存在与数据集不相关的 2 个幅值峰，其幅频响应和数据集频谱完全符合，具有良好的物理可解释性。

将时频变换方法融入卷积神经网络的操作，在提高模型诊断能力的同时，也为不可解释的神经网络引入了物理可解释性。通过分析网络学习到的参数，获取背后的物理含义，实现对网络的解释，是一条可行的思路。

学术咨询：