-
MEMD是传统经验模态分解的多元扩展,能够克服传统方法中固有模式不匹配问题[15-16]。经过MEMD分解得到的IMF可有效反映输入信号(图像)的时频特性,描述各个频率成分的特性,从而获得输入图像的多层次特性。根据现有文献,MEMD的具体实施可归纳为以下步骤:
步骤1:采用Hammersley序列采样法在n-1维球面上进行点集采样,获得的K组方向向量;
步骤2:计算输入信号
$(v(t))_{t = 1}^T$ 在K组方向向量${x^{{\theta _k}}}$ 上的投影集$({p^{{\theta _k}}}(t))_{k = 1}^K$ ,其中$(v(t))_{t = 1}^T = \left\{ {{v_1}(t){\text{,}}{v_2}(t){\text{,}} \cdots ,{v_n}(t)} \right\}$ 表示包含n个通道的多元信号,${x^{{\theta _k}}} = \left\{ {x_1^k{\text{,}}x_2^k, \cdots{\text{,}}x_n^k} \right\}$ 对应n−1球面上沿着方向角${\theta _k} = \left\{ {{\theta _{k1}},{\theta _{k2}}, \cdots ,{\theta _{kn - 1}}} \right\}$ 的一组方向向量;步骤3:求投影集
$\left\{ {{p^{{\theta _k}}}(t)} \right\}_{k = 1}^K$ 所有极大值对应的时间点$\left\{ {t_i^{{\theta _k}}} \right\}$ ;步骤4:对
$\left\{ {t_i^{{\theta _k}},v(t_i^{{\theta _k}})} \right\}$ 进行插值获得多元包络曲线$\left\{ {{{\rm{e}}^{{\theta _k}}}(t)} \right\}_{k = 1}^K$ ;步骤5:计算整组方向向量包络曲线的均值
$m(t)$ :$$m(t) = \frac{1}{k}\sum\nolimits_{k = 1}^K {{{\rm{e}}^{{\theta _k}}}(t)} $$ (1) 步骤6:按照
$d(t) = v(t) - m(t)$ 获得$d(t)$ ,若$d(t)$ 满足迭代终止条件,则认为其是当前IMF,否则转至步骤2。采用MEMD对输入信号
$v(t)$ 进行分解,获得M个不同层次的IMF,如公式(2)所示:$$v(t) = \sum\limits_{m = 1}^M {\overline {{c_m}} (t) + \overline r } (t)$$ (2) 式中:
$\overline {{c_m}} (t)$ 表示第m个IMF;$\overline r (t)$ 为分解残差。相比传统的经验模态分解算法,MEMD具有更强的稳健性。基于MEMD分解得到的多层次IMF可以更为有效地分析输入信号(图像)的特性。为此,文中采用MEMD对SAR图像进行分解,获得多层次IMF,并据此设计后续的目标识别方法。此外,基于同一幅SAR图像分解得到的多层次IMF具有一定的内在关联性,充分利用这一特性可进一步提升后续分类决策的精度。
-
对于MEMD分解得到的多层次IMF,在分类决策阶段采用联合稀疏表示对它们进行分析。假设测试样本为
$y$ ,经MEMD得到M个层次的IMF:$\left[ {{y^{(1)}}{\rm{ }}{y^{(2)}}{\rm{ }} \cdots {\rm{ }}{y^{(M)}}} \right]$ ,统一考察它们的稀疏表示问题,表达如下:$$\mathop {\min }\limits_\beta \left\{ {g(\beta ) = \sum\limits_{m = 1}^M {\left\| {{y^{(m)}} - {D^{(m)}}{\alpha ^{(m)}}} \right\|} } \right\}$$ (3) 式中:
${D^{(m)}}$ 对应于第m个IMF的全局字典,通过所有训练样本的分解得到;${\alpha ^{(m)}}$ 为相应的稀疏系数矢量。$\;\beta = \left[ {{\alpha ^{(1)}}\;{\rm{ }} {\alpha ^{(2)}}{\rm{ }} \cdots {\rm{ }} {\alpha ^{(M)}}} \right]$ 为系数矩阵,存储全部M个IMF所有的稀疏系数矢量。为考察不同IMF之间的内在关联,联合稀疏表示引入
${\ell _{\rm{1}}}/{\ell _2}$ 范数对矩阵$\;\beta $ 进行约束,获得新的目标函数如下[3]:$$\mathop {\min }\limits_\beta \left( {g(\beta ) + \lambda {{\left\| \beta \right\|}_{2,1}}} \right)$$ (4) 式中:
$\lambda $ 表示正则化参数,为一个大于零的常数。在
${\ell _{\rm{1}}}/{\ell _2}$ 范数的约束下,可考察不同IMF的关联性从而提升整体表征精度。根据求解结果,按照公式(5)分别计算不同类别条件下的重构误差之和,进而进行测试样本类别决策。$${\rm{identity}}(y) = \mathop {\min }\limits_i \sum\limits_{m = 1}^M {\left\| {{y^{(m)}} - D_i^{(m)}\alpha _i^{(m)}} \right\|} $$ (5) 式中:
$D_i^{(m)}$ 为${D^{(m)}}$ 中对应第$i$ 个类别的所有训练样本。根据上述分析,设计文中方法的识别流程如图1所示,主要实施过程归为以下步骤。
步骤1:采用MEMD对训练样本进行分解,获得M个层次的IMF,并分别构建全局字典;
步骤2:采用相同的MEMD对待识别测试样本进行分解,获得相应M个层次的IMF;
步骤3:在联合稀疏表示下基于全局字典对测试样本的M个IMF进行表征,求解稀疏表示系数矩阵;
步骤4:分别计算各个训练类别对测试样本M个IMF的整体重构误差,按照式(5)的最小误差准则判定测试样本目标类别。
-
文中在MSTAR数据集上展开方法测试。该数据集自20世纪90年代公开以来,成为SAR目标识别领域最为权威的数据集之一,广泛用于各种SAR目标识别的测试及验证。数据集中10类目标的图像如图2所示,为尺寸、形状相近的地面车辆目标。各类目标的SAR图像由X波段机载平台采集,覆盖0°~360°方位角以及部分俯仰角。因此,基于MSTAR数据集可设置多种条件测试提出方法的有效性和稳健性。
实验中,选用部分现有SAR目标识别方法作为对比参照,包括基于单演信号(Monogenic)[3]、二维经验模态分解(BEMD)[14]以及CNN的方法(CNN)[9]。其中,单演信号及二维经验模态分解方法为特征主导的方法,主要通过特征提取提高目标识别性能。参考文献[9]中的CNN方法设计了针对SAR目标识别的全卷积神经网络,取得了很好的识别性能。因此,三类对比方法能够较好地反映当前主流SAR目标识别方法的性能,具有代表意义。后续实验分别在标准操作条件、俯仰角差异、噪声干扰以及目标遮挡条件下进行。通过定量对比,对文中方法的性能形成初步结论。
-
文中首先基于MSTAR数据集设置10类目标识别问题,具体的训练和测试集如表1所示。各类目标的训练样本分别来自17°和15°俯仰角,方位角覆盖0°~360°。从表中可以看出,任一类别的训练样本均多于测试样本,可有效覆盖测试样本可能出现的方位角(即相匹配的样本),故可近似认为是标准操作条件。图3显示了当前测试条件下的混淆矩阵,横纵坐标分别代表真实和类别和分类结果,因此对角线元素反映了不同目标的正确识别率,得到10类目标的平均识别率为99.28%,显示所提方法的有效性。表2列出了各方法的平均识别率,均保持在98.5%以上。对比可见,所提方法的识别率最高,显示其性能优势。与基于单演信号和二维经验模态分解的方法相比,文中通过采用多元经验模态分解最终提高了整体识别性能,表明了特征提取算法的有效性。与CNN方法相比,文中通过结合多元经验模态分解和联合稀疏表示获得了更高的识别率,这反映了选用特征和决策机制的有效结合。因此,从标准操作条件下的实验结果可以看出所提方法对于10类目标识别问题的有效性。
表 1 10类目标识别问题的训练和测试集
Table 1. Training and test sets of 10-class recognition problem
Class Training set Test set BMP2 233 195 BTR70 233 196 T72 232 196 T62 299 273 BRDM2 298 274 BTR60 256 195 ZSU23/4 299 274 D7 299 274 ZIL131 299 274 2S1 299 274 表 2 各类方法对10类目标识别问题的结果对比
Table 2. Comparison of different methods for 10-class recognition problem
Method type Average recognition rate Proposed 99.28% Monogenic 98.94% BEMD 99.02% CNN 99.08% -
在表1所示的10类目标识别问题中,测试与训练集之间的俯仰角差异较小。实际过程中,非合作条件下获得的测试样本可能与训练集存在较大的俯仰角差异。表3选用MSTAR数据集中部分样本设置了俯仰角差异条件下的测试条件。其中,训练集来自17°俯仰角;测试集分别包括30°和45°俯仰角下的SAR图像。对各类方法在此条件下进行测试,获得图4所示结果。SAR图像对成像视角变化较为敏感,当测试样本与训练样本之间存在的较大俯仰角差异时,它们的图像差异也随着增大,这导致各类方法在45°俯仰角下识别性能下降显著。对比看出,所提方法在俯仰角差异条件下可以保持优势性能,显示其更强的稳健性。对比二维经验模态分解方法,文中通过多元模态分解进一步提升了对俯仰角差异的适应性和分类能力。
表 3 俯仰角差异下的训练和测试集
Table 3. Training and test sets under depression angle variance
Depression angle 2S1 BDRM2 ZSU23/4 Training set 17° 299 298 299 Test set 30° 288 287 288 45° 303 303 303 -
实际获取的SAR图像往往信噪比(SNR)较低,这导致它们与经过预处理的高信噪比训练样本存在较大的差异。文中参照文献[4]中的噪声添加算法进行噪声样本构造,获得不同噪声水平下的测试集。具体而言,根据原始图像的能量按照预设的信噪比条件不同程度的高斯白噪声,从而获得相应信噪比的测试样本。图5显示了当前条件下各类方法的识别结果。在信噪比逐渐降低时,各方法的识别性能均出现较为显著的下降。对比可见,所提方法在各个信噪比下均取得了最高的识别率,表明其更优的噪声稳健性。文中正是运用多元模态分解提升了获得特征的噪声稳健性,进而通过联合稀疏表示进一步提升了识别性能。
-
与噪声干扰类似,在非合作条件下获得的测试样本可能存在目标遮挡的情况。此时,部分目标特性不能体现在提取的特征中,导致与训练样本之间的差异。实验按照参考文献[4]中的目标遮挡模拟方法,获得不同遮挡比例条件下的测试集。在此基础上,分别在不同遮挡比例下测试各类方法的识别性能,如图6所示。随着目标遮挡比例的不断增加,各类方法的性能下降较为剧烈。对比可见,所提方法在各个遮挡比例均取得高于对比方法的性能,充分说明了其对于目标遮挡的稳健性。基于MEMD分解得到的多层次IMF可更为有效地克服目标遮挡的影响,因此最终的识别稳健性也得到了整体提升。
Multivariate empirical mode decomposition with application to SAR image target recognition
-
摘要: 提出基于多元模态分解的合成孔径雷达(SAR)目标识别方法。多元模态分解是传统模态分解的多元扩展,能够有效避免传统算法中的模态混叠问题。采用多元模态分解对SAR图像进行处理,获得的多层次固有模式函数(IMF)能够更为有效地反映目标的时频特性。不同IMF之间具有良好互补性,同时它们描述同一目标因而具有内在关联性。分类阶段,采用联合稀疏表示对分解得到的IMF进行表征。联合稀疏表示在多任务学习的理念下,对多个关联稀疏表示问题进行求解,可获得更为可靠的估计结果。在获得各层次IMF对应的稀疏表示系数矢量的基础上,计算不同类别对于当前测试样本多层次IMF的重构误差之和,进而判定测试样本的目标类别。基于MSTAR数据集开展实验,通过在标准操作条件、俯仰角差异、噪声干扰以及目标遮挡条件下进行对比分析,验证了提出方法的有效性。Abstract: A synthetic aperture radar (SAR) target recognition method was proposed based on multivariate empirical mode decomposition (MEMD). MEMD was the general extension of traditional EMD, which could avoid the mode mixing problems. MEMD was employed to process SAR images to obtain the multi-layer intrinsic mode functions (IMF), which could better reflect the time-frequency properties of the targets. Different layers of IMFs could effectively complement each other while sharing some inner correlations because they are generated from the same target. In the classification phase, the joint sparse representation was employed to represent the IMFs. The joint sparse representation could solve several related sparse representation tasks based on the idea of multi-task learning. It could produce more precise estimations than the solutions of single tasks. According to the sparse coefficient vectors corresponding to different IMFs, the reconstruction errors of different classes for the representation of the test sample can be calculated. Afterwards, the target label of the test sample can be determined. Experiments were conducted on the Moving and Stationary Target Acquisition and Recognition (MSTAR) dataset, by comparison with existing methods under the standard operating condition, depression angle variance, noise corruption, and target occlusion, the results confirm the validity of the proposed method.
-
表 1 10类目标识别问题的训练和测试集
Table 1. Training and test sets of 10-class recognition problem
Class Training set Test set BMP2 233 195 BTR70 233 196 T72 232 196 T62 299 273 BRDM2 298 274 BTR60 256 195 ZSU23/4 299 274 D7 299 274 ZIL131 299 274 2S1 299 274 表 2 各类方法对10类目标识别问题的结果对比
Table 2. Comparison of different methods for 10-class recognition problem
Method type Average recognition rate Proposed 99.28% Monogenic 98.94% BEMD 99.02% CNN 99.08% 表 3 俯仰角差异下的训练和测试集
Table 3. Training and test sets under depression angle variance
Depression angle 2S1 BDRM2 ZSU23/4 Training set 17° 299 298 299 Test set 30° 288 287 288 45° 303 303 303 -
[1] Dong Lei, Lu Zhenwu, Liu Xinyue. Analysis and comparison of limit detection capabilities of three active synthetic aperture imaging techniques [J]. Chinese Optics, 2019, 12(1): 138-147. (in Chinese) doi: 10.3788/co.20191201.0138 [2] Xie Qin, Zhang Hong. Multi-level SAR image enhancement based on regularization with application to target recognition [J]. Journal of Electronic Measurement and Instrumentation, 2018, 32(9): 157-162. (in Chinese) [3] Dong G G, Kuang G Y. Classification on the Monogenic scale space: application to target recognition in SAR image [J]. IEEE Transactions on Image Processing, 2015, 24(8): 2527-2539. doi: 10.1109/TIP.2015.2421440 [4] Ding Baiyuan, Wen Gongjian, Yu Liasheng, et al. Matching of attributed scattering center and its application to synthetic aperture radar Automatic Target Recognition [J]. Journal of Radar, 2017, 6(2): 157-166. (in Chinese) [5] Liu Changqing, Chen Bo, Pan Zhouhao, et al. Research on target recognition technique via simulation SAR and SVM classifier [J]. Journal of CAEIT, 2016, 11(3): 257-262. (in Chinese) doi: 10.3969/j.issn.1673-5692.2016.03.008 [6] Li Yajuan. Target recognition of SAR images based on combination of global and local sparse representations [J]. Journal of Electronic Measurement and Instrumentation, 2020, 34(2): 165-171. (in Chinese) [7] Lu Ruitao, Ren Shijie, Shen Lurong, et al. Robust template patches-based object tracking with sparse representation [J]. Infrared and Laser Engineering, 2019, 48(3): 0326003. (in Chinese) doi: 10.3788/IRLA201948.0326003 [8] Tan Cuimei, Xu Tingfa, Ma Xu, et al. Graph-spectral hyperspectral video restoration based on compressive sensing [J]. Chinese Optics, 2018, 11(6): 949-957. (in Chinese) doi: 10.3788/co.20181106.0949 [9] Chen S Z, Wang H P, Xu F, et al. Target classification using the deep convolutional networks for SAR images [J]. IEEE Transactions on Geoscience and Remote Sensing, 2016, 54(8): 4806-4817. doi: 10.1109/TGRS.2016.2551720 [10] Zhang Panpan, Luo Haibo, Ju Morang, et al. An improved capsule and its application in target recognition of SAR images [J]. Infrared and Laser Engineering, 2020, 49(5): 20201010. (in Chinese) [11] Xu Ying, Gu Yu, Peng Dongliang, et al. SAR ATR based on disentangled representation learning generative adversarial networks and support vector machine [J]. Optics and Precision Engineering, 2020, 28(3): 727-735. (in Chinese) doi: 10.3788/OPE.20202803.0727 [12] Ye Song, Li Yuanzhuang, Sun Yongfeng, et al. Extraction of spatial heterodyne spectroscopy target based on empirical mode decomposition and regression analysis [J]. Infrared and Laser Engineering, 2018, 47(12): 1223001. (in Chinese) doi: 10.3788/IRLA201847.1223001 [13] Chen Zhencheng, Wu Xianliang, Zhao Feijun. Denoising and implementation of photoplethysmography signal based on EEMD and wavelet threshold [J]. Optics and Precision Engineering, 2019, 27(6): 1327-1334. (in Chinese) [14] Chang M, You X, Cao Z. Bidimensional empirical mode decomposition for SAR image feature extraction with application to target recognition [J]. IEEE Access, 2019, 7: 135720-135731. doi: 10.1109/ACCESS.2019.2941397 [15] Zhang Jing, Chen Hongtao, Liu Fang. Remote sensing image fusion based on multivariate empirical mode decomposition and weighted least squares filter [J]. Acta Photonica Sinica, 2019, 48(5): 051003. (in Chinese) [16] Wu Zhe, Yang Shaopu, Ren Bin, et al. Rolling element bearing fault diagnosis method based on NAMEMD and multi-scale morphology [J]. Journal of Vibration and Shock, 2016, 35(4): 127-133. (in Chinese)