留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于红外探测的无人机群结构特性感知方法

夏文新 杨小冈 席建祥 卢瑞涛 谢学立

夏文新, 杨小冈, 席建祥, 卢瑞涛, 谢学立. 基于红外探测的无人机群结构特性感知方法[J]. 红外与激光工程, 2024, 53(1): 20230429. doi: 10.3788/IRLA20230429
引用本文: 夏文新, 杨小冈, 席建祥, 卢瑞涛, 谢学立. 基于红外探测的无人机群结构特性感知方法[J]. 红外与激光工程, 2024, 53(1): 20230429. doi: 10.3788/IRLA20230429
Xia Wenxin, Yang Xiaogang, Xi Jianxiang, Lu Ruitao, Xie Xueli. Structure characteristics sensing method of unmanned aerial vehicle group based on infrared detection[J]. Infrared and Laser Engineering, 2024, 53(1): 20230429. doi: 10.3788/IRLA20230429
Citation: Xia Wenxin, Yang Xiaogang, Xi Jianxiang, Lu Ruitao, Xie Xueli. Structure characteristics sensing method of unmanned aerial vehicle group based on infrared detection[J]. Infrared and Laser Engineering, 2024, 53(1): 20230429. doi: 10.3788/IRLA20230429

基于红外探测的无人机群结构特性感知方法

doi: 10.3788/IRLA20230429
基金项目: 国家自然科学基金项目(62176263, 62276274);陕西省杰出青年科学基金项目(2021JC-35);陕西省科协青年人才托举计划项目(20220123)
详细信息
    作者简介:

    夏文新,男,硕士生,主要从事目标检测、识别方面的研究

    杨小冈,男,教授,博士,主要从事图像处理、目标检测、图像制导等方面的研究

    通讯作者: 席建祥,男,教授,博士,主要从事协同控制方面的研究
  • 中图分类号: TP391

Structure characteristics sensing method of unmanned aerial vehicle group based on infrared detection

Funds: National Natural Science Foundation of China (62176263, 62276274); Science Foundation for Distinguished Youth of Shaanxi Province (2021JC-35); Youth Talent Promotion Program of Shaanxi Provincial Association for Science and Technology (20220123)
  • 摘要: 针对现有目标检测算法未考虑无人机群成员之间相互关系,容易出现漏检、误检群成员和未能感知无人机群队形结构特性的问题,提出了一种基于红外探测的无人机群结构特性感知方法。首先,为减少图像中无人机外观特征损失,设计了空间深度-通道注意力模块,该模块结合空间深度转换模块保留判别特征信息的优点和通道注意力关注通道间相关性的特点,提高了检测网络的特征提取能力;其次,为充分利用图像中无人机群成员的位置、边界框大小等结构信息,提出了群成员关系模块,将无人机的结构信息融入到无人机群成员之间的关联信息,提高了检测网络对无人机群成员的检测定位能力。最后,在自建的Drone-swarms Dataset数据集上开展实验验证。实验结果表明:文中提出的无人机群结构特性感知算法的mAP达到了95.9%,较原始YOLOv5算法的mAP提高了约7%,有效提高了无人机群成员的检测精度;同时,检测速度达到59帧/s,实现了无人机群目标的实时检测,进而实现了无人机群队形结构特性的感知。
  • 图  1  GMR-YOLOv5算法的网络结构图

    Figure  1.  Network structure diagram of GMR-YOLOv5 algorithm

    图  2  $ scale{\text{ = }}2 $时的空间深度-通道注意力结构图

    Figure  2.  Structure of space to depth-channel attention net at $ scale{\text{ = }}2 $

    图  3  群成员关系模块结构图

    Figure  3.  Structure diagram of group member relation module

    图  4  无人机群飞行状态示例

    Figure  4.  Example of UAV group flight status

    图  5  GMR-YOLOv5算法检测结果图

    Figure  5.  Detection result of GMR-YOLOv5 algorithm

    图  6  YOLOv5算法检测结果图

    Figure  6.  Detection result of YOLOv5 algorithm

    图  7  YOLOv7算法检测结果图

    Figure  7.  Detection result of YOLOv7 algorithm

    图  8  YOLOX算法检测结果图

    Figure  8.  Detection result of YOLOX algorithm

    图  9  SSD算法检测结果图

    Figure  9.  Detection result of SSD algorithm

    图  10  三种干扰情况下,GMR-YOLOv5算法检测结果

    Figure  10.  Detection results of GMR-YOLOv5 algorithm in three interference cases

    图  11  三种干扰情况下,YOLOv5算法检测结果

    Figure  11.  Detection results of YOLOv5 algorithm in three interference cases

    图  12  三种干扰情况下,YOLOv7算法检测结果

    Figure  12.  Detection results of YOLOv7 algorithm in three interference cases

    图  13  三种干扰情况下,YOLOX算法检测结果

    Figure  13.  Detection results of YOLOX algorithm in three interference cases

    表  1  数据集信息

    Table  1.   Dataset information

    TitleNorm
    Dataset nameDrone-swarms Dataset
    Number of images6900 sheet
    Resolution of an image/pixel960×540
    Number of UAV20-25 racks
    UAV target size/pixel9×8-13×11
    下载: 导出CSV

    表  2  实验平台的配置

    Table  2.   Configuration of the experimental platform

    TitleNorm
    Operating systemUbuntu 18.04
    Processing unitIntel Xeon Gold 6230×2
    Graphics boardNVIDIA RTX 8000 ×2
    RAM192 G(32 G×6) DDR4 2933 MT/s
    Development environmentPython 3.6
    PyTorch 1.10.0
    CUDA 11.4
    下载: 导出CSV

    表  3  参数设置

    Table  3.   Parameter settings

    Parameter nameParameter size
    Epoch300
    Attenuation factor0.0005
    Learning rate0.001
    Model optimizerAdam
    Batch size8
    下载: 导出CSV

    表  4  对比实验结果

    Table  4.   Comparative experimental results

    AlgorithmsmAP@0.50mAP@0.50:0.95 FPS
    GMR-YOLOv595.9%70.1%59
    YOLOv589.6%60.5%67
    YOLOv786.3%28.9%40
    YOLOX85.9%28.8%33
    SSD56.7%23.2%87
    Faster R-CNN58.3%30.1%16
    下载: 导出CSV

    表  5  三种干扰情况下的数据集信息

    Table  5.   Information about the dataset for the three disturbance scenarios

    TitleNorm
    Motion crossover606 sheet
    Motion blur564 sheet
    Dense distribution523 sheet
    UAV target size/pixel9×8-13×11
    下载: 导出CSV

    表  6  运动交叉情况下,对比实验结果

    Table  6.   Comparison of experimental results in the case of motion crossover

    AlgorithmsmAP@0.50mAP@0.50:0.95FPS
    GMR-YOLOv582.2%43.4%60
    YOLOv558.8%15.1%69
    YOLOv769.1%16.2%21
    YOLOX75.9%17.2%30
    下载: 导出CSV

    表  7  运动模糊情况下,对比实验结果

    Table  7.   Comparison of experimental results in the case of motion blur

    AlgorithmsmAP@0.50mAP@0.50:0.95FPS
    GMR-YOLOv591.3%56.2%60
    YOLOv587.3%26.9%69
    YOLOv786.1%26%23
    YOLOX88%24.8%30
    下载: 导出CSV

    表  8  分布密集情况下,对比实验结果

    Table  8.   Comparison of experimental results in the case of dense distribution

    AlgorithmsmAP@0.50mAP@0.50:0.95FPS
    GMR-YOLOv590.9%55.5%60
    YOLOv575.5%20.8%69
    YOLOv783.7%18.5%28
    YOLOX80%16.3%30
    下载: 导出CSV

    表  9  消融实验结果

    Table  9.   Results of ablation experiment

    AlgorithmsmAP@0.50mAP@0.50:0.95FPS
    YOLOv589.6%60.5%67
    YOLOv5+SD-CAN93.2%58.1%60
    YOLOv5+GMR91.3%60.4%70
    YOLOv5+SD-CAN+SIoU93%58.3%60
    YOLOv5+GMR+SIoU92.3%61.9%70
    YOLOv5 +SD-CAN+GMR92.1%57.9%60
    YOLOv5+SD-CAN+GMR+SIoU95.9%70.1%59
    下载: 导出CSV
  • [1] Zhao Yuemeng, Liu Huigang. Detection and tracking of low-altitude unmanned aerial vehicles based on optimized YOLOv4 algorithm [J]. Laser & Optoelectronics Progress, 2022, 59(12): 397-406. (in Chinese) doi:  10.3788/LOP202259.1215017
    [2] Bao Wenqi, Xie Liqiang, Xu Caihua, et al. Real-time detection method of micro UAV based on YOLOv5 [J]. Journal of Ordnance Equipment Engineering, 2022, 43(5): 232-237. (in Chinese) doi:  10.11809/bqzbgcxb2022.05.037
    [3] Wang Jiannan, Lv Shengtao, Niu Jian. Drone detection method based on improved YOLOv5 [J]. Optics & Optoelectronic Technology, 2022, 20(5): 48-56. (in Chinese) doi:  10.19519/j.cnki.1672-3392.2022.05.015
    [4] Liu Shanliang, Wu Renbiao, Qu Jingyi, et al. Bi PPYOLO tiny: A lightweight airport UAV detection method [J]. Journal of Safety and Environment, 2023, 23(2): 480-488. (in Chinese) doi:  10.13637/j.issn.1009-6094.2021.1818
    [5] Zhang Lingling, Wang Peng, Li Xiaoyan, et al. Low-altitude UAV detection method based on optimized SSD [J]. Computer Engineering and Applications, 2022, 58(16): 204-212. (in Chinese) doi:  10.3778/j.issn.1002-8331.2201-0067
    [6] Ma Qi, Zhu Bin, Zhang Hongwei, et al. Low-altitude UAV detection and recognition method based on optimized YOLOv3 [J]. Laser & Optoelectronics Progress, 2019, 56(20): 201006. (in Chinese) doi:  10.3788/LOP56.201006
    [7] Zhou Qiang, Xia Mingyun. Research on Multi-UAV detection based on improved SSD algorithm [J]. Information Technology, 2020, 44(12): 71-76. (in Chinese) doi:  10.13274/j.cnki.hdzj.2020.12.014
    [8] Zhang Ruixin, Li Ning, Zhang Xiaxia, et al. Low-altitude UAV detection method based on optimized CenterNet [J]. Journal of Beijing University of Aeronautics and Astronautics, 2022, 48(11): 2335-2344. (in Chinese) doi:  10.13700/j.bh.1001-5965.2021.0108
    [9] Qi Jiangxin, Wu Ling, Lu Faxing, et al. UAV cluster detection based on improved YOLOv4 algorithm [J]. Journal of Ordnance Equipment Engineering, 2022, 43(6): 210-217. (in Chinese) doi:  10.11809/bqzbgcxb2022.06.033
    [10] Wang C, Meng L, Gao Q, et al. A lightweight UAV swarm detection method integrated attention mechanism [J]. Drones, 2022, 7(1): 13. doi:  10.3390/drones7010013
    [11] Sunkara R, Luo T. No more strided convolutions or pooling: A new CNN building block for low-resolution images and small objects[DB/OL]. (2022-08-07) https://arxiv.org/abs/2208.03641
    [12] Hu J, Shen L, Sun G. Squeeze-and-excitation networks[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2018: 7132-7141.
    [13] Hu H, Gu J, Zhang Z, et al. Relation networks for object detection[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2018: 3588-3597.
    [14] Gevorgyan Z. SIoU loss: More powerful learning for bounding box regression[DB/OL].(2022-05-25) https://arxiv.org/abs/2205.12740
    [15] Lin T Y, Goyal P, Girshick R, et al. Focal loss for dense object detection[C]//Proceedings of the IEEE International Conference on Computer Vision, 2017: 2980-2988.
  • [1] 朱海勇, 陈俊林, 曾智江, 王小坤, 李亚冉, 王溪, 李雪.  用于冷光学长波红外杜瓦组件杂散光分析与抑制 . 红外与激光工程, 2023, 52(7): 20220823-1-20220823-9. doi: 10.3788/IRLA20220823
    [2] 李英超, 潘泽, 李冠霖, 史浩东, 付强.  分层海水条件下潜艇热尾流机载红外探测性能分析 . 红外与激光工程, 2023, 52(5): 20220741-1-20220741-7. doi: 10.3788/IRLA20220741
    [3] 周志远, 史保森.  基于频谱迁移的红外探测研究进展(特邀) . 红外与激光工程, 2023, 52(5): 20230165-1-20230165-11. doi: 10.3788/IRLA20230165
    [4] 薛珊, 陈宇超, 吕琼莹, 曹国华.  基于坐标注意力机制融合的反无人机系统图像识别方法 . 红外与激光工程, 2022, 51(9): 20211101-1-20211101-11. doi: 10.3788/IRLA20211101
    [5] 邢占, 陈晓依, 彭志勇, 杨志旺, 张贺龙, 邢忠福, 张宁.  红外气动光学效应研究进展与思考(特邀) . 红外与激光工程, 2022, 51(4): 20220228-1-20220228-17. doi: 10.3788/IRLA20220228
    [6] 司俊杰.  基于InSb的新型红外探测器材料(特邀) . 红外与激光工程, 2022, 51(1): 20210811-1-20210811-19. doi: 10.3788/IRLA20210811
    [7] 朱鹏, 肖磊, 孙泰, 史浩飞.  微纳结构增强型红外探测器研究进展(特邀) . 红外与激光工程, 2022, 51(1): 20210826-1-20210826-16. doi: 10.3788/IRLA20210826
    [8] 周凯, 李道京, 王烨菲, 姚园, 乔明.  衍射光学系统红外光谱目标探测性能 . 红外与激光工程, 2021, 50(8): 20200371-1-20200371-8. doi: 10.3788/IRLA20200371
    [9] 郭尚坤, 邓杰, 周靖, 张东海, 余宇, 邓嘉男, 蔡清元, 李志锋, 陆卫, 陈效双.  基于等离激元纳米结构非对称集成的二维材料自驱动光响应增强的研究进展(特邀) . 红外与激光工程, 2021, 50(1): 20211011-1-20211011-9. doi: 10.3788/IRLA20211011
    [10] 崔洲涓, 安军社, 崔天舒.  融合通道互联空间注意力的Siamese网络跟踪算法 . 红外与激光工程, 2021, 50(3): 20200148-1-20200148-13. doi: 10.3788/IRLA20200148
    [11] 李一涵, 胡海洋, 王强.  高超声速飞行器红外探测窗口辐射透射特性研究 . 红外与激光工程, 2020, 49(4): 0404002-0404002-7. doi: 10.3788/IRLA202049.0404002
    [12] 周军, 陈守谦, 甄政, 欧文, 熊健.  基于波前编码的大焦深弹载双色红外探测系统 . 红外与激光工程, 2020, 49(4): 0404001-0404001-5. doi: 10.3788/IRLA202049.0404001
    [13] 付秀华, 张功, 张静, 刘冬梅, 杨伟声, 木锐.  短中波红外探测系统宽波段高透过率薄膜 . 红外与激光工程, 2019, 48(10): 1017001-1017001(6). doi: 10.3788/IRLA201948.1017001
    [14] 王莹莹, 何苹, 孟常亮.  星载红外探测器对高超声速飞行器探测距离的计算 . 红外与激光工程, 2019, 48(7): 704003-0704003(7). doi: 10.3788/IRLA201948.0704003
    [15] 黄智国, 王建立, 殷丽梅, 李宏壮, 刘俊池, 刘祥意.  多波段冷光学红外成像终端研制 . 红外与激光工程, 2018, 47(9): 904001-0904001(9). doi: 10.3788/IRLA201847.0904001
    [16] 白瑜, 廖志远, 李华, 程习敏, 邢廷文, 蒋亚东.  折反射中波红外探测无热化成像系统设计分析 . 红外与激光工程, 2015, 44(2): 407-412.
    [17] 吴鑫, 张建奇, 杨琛.  JetsonTK1平台实现快速红外图像背景预测算法 . 红外与激光工程, 2015, 44(9): 2615-2621.
    [18] 张士成, 杨立, 石恒.  基于射线跟踪算法的舰船尾迹波红外特征与探测 . 红外与激光工程, 2015, 44(5): 1450-1455.
    [19] 周炜, 欧阳程, 吴敬, 高艳卿, 黄志明.  锰钴镍铜氧薄膜红外探测器制备与性能研究 . 红外与激光工程, 2014, 43(4): 1073-1079.
    [20] 欧阳程, 吴敬, 周炜, 高艳卿, 侯云, 黄志明.  磁控溅射制备Mn-Co-Ni-O热敏红外探测薄膜 . 红外与激光工程, 2014, 43(4): 1068-1072.
  • 加载中
图(13) / 表(9)
计量
  • 文章访问数:  62
  • HTML全文浏览量:  14
  • PDF下载量:  27
  • 被引次数: 0
出版历程
  • 收稿日期:  2023-05-28
  • 修回日期:  2023-06-28
  • 刊出日期:  2024-01-25

基于红外探测的无人机群结构特性感知方法

doi: 10.3788/IRLA20230429
    作者简介:

    夏文新,男,硕士生,主要从事目标检测、识别方面的研究

    杨小冈,男,教授,博士,主要从事图像处理、目标检测、图像制导等方面的研究

    通讯作者: 席建祥,男,教授,博士,主要从事协同控制方面的研究
基金项目:  国家自然科学基金项目(62176263, 62276274);陕西省杰出青年科学基金项目(2021JC-35);陕西省科协青年人才托举计划项目(20220123)
  • 中图分类号: TP391

摘要: 针对现有目标检测算法未考虑无人机群成员之间相互关系,容易出现漏检、误检群成员和未能感知无人机群队形结构特性的问题,提出了一种基于红外探测的无人机群结构特性感知方法。首先,为减少图像中无人机外观特征损失,设计了空间深度-通道注意力模块,该模块结合空间深度转换模块保留判别特征信息的优点和通道注意力关注通道间相关性的特点,提高了检测网络的特征提取能力;其次,为充分利用图像中无人机群成员的位置、边界框大小等结构信息,提出了群成员关系模块,将无人机的结构信息融入到无人机群成员之间的关联信息,提高了检测网络对无人机群成员的检测定位能力。最后,在自建的Drone-swarms Dataset数据集上开展实验验证。实验结果表明:文中提出的无人机群结构特性感知算法的mAP达到了95.9%,较原始YOLOv5算法的mAP提高了约7%,有效提高了无人机群成员的检测精度;同时,检测速度达到59帧/s,实现了无人机群目标的实时检测,进而实现了无人机群队形结构特性的感知。

English Abstract

    • 近年来,随着移动自组网技术、协同控制技术、传感探测技术、人工智能技术的飞速发展,无人机群逐渐显示出群体智能分布式、自组织性、非合作式的特点。从军事角度而言,无人机群技术的发展蕴含着对传统联合防空系统的挑战,甚至将引发防空装备体系的颠覆性变革。随着无人机群技术的不断发展,反无人机群技术逐渐变得复杂[1-2]。及时检测出袭扰的无人机群,可以采取丰富的反制措施。因此,发展无人机群目标检测识别技术,是实现反无人机战场态势感知的前提和关键。

      随着红外探测技术不断发展,相较于普通可见光系统,红外系统具有良好的环境适应能力,尤其在云雾等极端恶劣天气环境下,红外系统适应性表现更加明显。由于红外探测成像主要依靠目标与背景之间的温度和发射功率,在目标检测识别能力上,红外系统优于普通可见光系统。因此,红外探测在目标检测识别与特性感知能力上优于普通可见光探测。无人机类目标具有飞行高度低,飞行速度慢的特点,单阶段检测算法和两阶段检测算法对无人机类目标通用检测效果不好,因此,许多研究人员对基础检测网络进行了改进。王建楠等[3]引入多个不同采样率的空洞卷积,增强无人机的多尺度细节特征提取能力。刘闪亮等[4]提出双锥台特征融合结构,来提升无人机检测精度。张灵灵等[5]融合高层语义信息和浅层细节信息,并引入通道注意力机制,提升了对无人机小目标特征提取的能力。在深层和浅层特征融合基础上,马旗等[6]利用残差网络及多尺度特征融合的方式,提高无人机检测精度。上述方法是检测单架无人机的目标检测方法,而无人机群分布较为密集,且图像中无人机群目标容易出现遮挡,检测无人机群目标时,需要考虑检测网络对无人机目标的特征提取。周强等[7]采用轻量化网络Mobilenetv2,并调整网络通道数,提高了算法对多无人机目标的检测准确度。张瑞鑫等[8]为提升无人机群检测精度和定位质量,在CenterNet检测网络中,引入解耦的非局部算子。祁江鑫等[9]为了提高无人机集群检测精度,使用轻量化网络MobileNetv3,降低原网络的参数量和计算量。Wang等[10]针对现有无人机检测算法检测精度低、计算资源消耗大的问题,提出了一种基于YOLOX的轻量级无人机群检测方法。上述方法在基础检测网络中进行改进,得到了较好的检测模型,但是上述文献未考虑无人机群成员之间位置、边界框大小等信息,而将无人机作为独立目标进行检测,容易导致漏检、误检无人机群目标的问题。无人机群成员的状态不仅与自身有关,还与邻居成员有关联。因此,利用无人机群成员之间的联系,可以有效减少漏检、误检群成员的情况,实现无人机群队形结构特性感知。基于以上分析,在红外探测和YOLOv5算法的基础上,文中提出了基于红外探测的无人机群队形结构特性感知方法。

    • 无人机群具有编队队形、群成员之间相互联系、群间联系等结构特性,其中面对不同任务需求,无人机群可以采用不同的编队队形。在采取反制无人机群措施之前,得知无人机群队形,结合相关信息,找出无人机群的重要通讯节点,使得反制后无人机群因失去作战能力而无法完成任务,进一步提升反制效果和效率。因此,感知无人机群编队队形是实现战场态势感知的前提。文中利用红外探测系统探测无人机群,采集无人机群数据,并采用改进的无人机群目标检测算法检测出无人机群成员,识别出无人机群,实现无人机群队形结构的感知。在红外探测和YOLOv5算法的基础上,文中提出了无人机群队形结构特性感知算法,称为GMR-YOLOv5算法。该算法通过空间-深度转换模块[11](Space-to-Depth Non-strided Convolution,SPD-Conv)与通道注意力模块[12](Channel Attention Net,CAN)融合,设计空间深度-通道注意力(Space to Depth-Channel Attention Net, SD-CAN)模块。空间-深度转换模块可将无人机的特征从空间维度转换到通道维度,与通道注意力机制相比,它没有注重通道间的关联性,文中设计的空间深度-通道注意力模块,既能实现目标特征空间维度到通道维度的转换,又能关注通道中无人机的特征;同时,针对无人机群成员在红外图像中纹理特征不明显的问题,构建群成员关系(Group Member Relation, GMR)模块。该模块充分利用无人机群成员在图像中的位置、边界框大小等结构信息,将无人机群成员的结构信息融入到群成员之间关联信息中。与现有的目标检测算法相比,文中提出的群成员关系模块考虑了图像中无人机群成员的位置、边界框大小等信息;最后,将这两个构建的模块融合到YOLOv5基础网络。在自建无人机群数据集上,开展算法验证实验。实验结果证明,文中提出的GMR-YOLOv5算法有效提高了无人机群目标的检测精度,减少了检测无人机群目标时漏检、误检情况,实现了无人机群队形结构特性感知。

    • GMR-YOLOv5算法是在原始YOLOv5网络的基础上引入空间深度-通道注意力模块和群成员关系模块,引入后网络结构如图1所示。图1中,红色框模块为空间深度-通道注意力模块,绿色框模块为群成员关系模块。首先,在Neck部分,将Concat层保持在SPD层和CAN层之间,更好地利用经过卷积层提取的特征图。空间深度-通道注意力模块引入YOLOv5的网络结构中,增加网络对目标的关注度,提高网络对无人机特征的提取能力。其次,无人机群成员的外观、大小相似,利用图像中群成员之间的位置、尺寸大小等结构信息,构建群成员关系模块,将无人机群成员进行关联,不作为单独目标进行检测。文中将群成员关系模块添加到已经引入空间深度-通道注意力模块的YOLOv5网络输出端,该输出端既能输出无人机目标的位置几何信息,又能输出尺寸大小特征。

      图  1  GMR-YOLOv5算法的网络结构图

      Figure 1.  Network structure diagram of GMR-YOLOv5 algorithm

    • 在较为复杂的低空背景下,无人机群成员目标尺度较小。YOLOv5检测网络中卷积下采样率较大,容易造成无人机目标的特征信息丢失。空间-深度转换模块将无人机的特征从空间维度转化到通道维度,只是把无人机特征通道维度拼接在一起,然后进入步长为1的卷积层,未进一步考虑特征通道中无人机的特征。因此,文中将注意力机制引入到空间-深度转换模块中,并构建空间深度-通道注意力模块,使检测网络更加关注通道中无人机的特征。在YOLOv5网络中引入空间深度-通道注意力模块,提高网络对无人机目标的特征提取能力。

      空间深度-通道注意力模块由空间到深度(Space-to-depth, SPD)层 、通道注意力层以及非跨步卷积(Non-strided Convolution)层构成,其结构如图2所示。SPD层将图像特征的空间维度转换为通道维度,非跨步卷积层将无人机目标特征图的通道维度发生改变(其中$ {C_3} < 4{C_1}{\text{ = }}{C_2} $),如图2(f)、(g)所示。为了尽可能保留无人机目标特征图的所有判别特征信息,这里选择$ stride{\text{ = }}1 $的卷积层。当$ stride > 1 $时,容易导致特征信息的非歧视性丢失,进而影响检测效果。为进一步利用通道中无人机目标的特征,在SPD层和非跨步卷积层之间加入通道注意力机制。空间维度转换为通道维度的转换过程如公式(1)和图2(b)~(d)所示。SPD层将特征映射图按比例切割成成序列的子特征映射图后,再把这些子特征映射图沿通道维度连接起来,从而体现出空间到深度的特点。考虑任意大小为$ S \times S \times {C_1} $的中间特征映射$ X $,切出成序列的子特征映射为:

      图  2  $ scale{\text{ = }}2 $时的空间深度-通道注意力结构图

      Figure 2.  Structure of space to depth-channel attention net at $ scale{\text{ = }}2 $

      $$ \left\{ \begin{array}{c}{f}_{0,0}=X[0:S:scale,0:S:scale]\\ {f}_{1,0}=X[1:S:scale,0:S:scale],\cdots \text{,}\\ {f}_{scale-1,0}=X[scale-1:S:scale,0:S:scale]\\ {f}_{0,1}=X[0:S:scale,1:S:scale]\\ {f}_{1,1}\text=X[1:S:scale,1:S:scale]\text{,}\cdots \text{,}\\ {f}_{scale-1,1}=X[scale-1:S:scale,1:S:scale]\\ \vdots\\ {f}_{0,scale-1}=X[0:S:scale,scale-1:S:scale]\\ {f}_{1,scale-1}\text=X[1:S:scale,scale-1:S:scale]\text{,}\cdots \text{,}\\ {f}_{scale-1,scale-1}=X[scale-1:S:scale,scale-1:S:scale]\end{array} \right.$$ (1)

      式中:给定任何原始特征映射$ X $;子映射${f_{x,y}}$由能被切割比例因子整除的所有元素$X(i,j)$构成;$ scale $为切割比例因子。

    • 复杂运动背景下,无人机群成员纹理特征弱,目标外观和结构容易与噪声混淆,无人机群成员与相邻成员在图像中的空间位置相对固定。无人机群成员的状态不仅与自身有关,还与邻居成员有联系,群成员关系模块利用这种群成员之间的联系,减少漏检、误检无人机的情况。

      现有目标检测方法未考虑无人机群成员的内在联系,容易出现漏检、误检群成员的情况。充分利用群成员之间的关联信息是减少漏检、误检群成员的关键,Hu等[13]提出了物体间联系的结构。基于此,文中充分利用无人机群成员在图像中的位置、尺寸等结构信息,设计GMR模块,其结构如图3(a)所示。该模块将无人机群成员的外观特征和几何特征作为输入,输出为关系特征。GMR模块未将无人机群成员作为独立目标进行检测,而是把无人机群成员联系在一起。当图像中某个无人机目标未被检测出来,邻居成员已经被检测出来时,通过GMR模块,充分利用周围成员的位置、尺寸大小等结构信息,确定该目标是无人机群成员,进而减少无人机群目标检测的漏检、误检情况。

      图  3  群成员关系模块结构图

      Figure 3.  Structure diagram of group member relation module

      图3(a)中,$ g_A^n $表示第$n$个无人机目标的外观特征,包括无人机的形状,大小等特征;$ g_G^n $表示第$n$个无人机目标的几何特征,包括无人机的位置和边界框的大小;$ g{\text{*}}_A^n $表示第$n$个关系模块的输出。Relation为关系特征,利用所有无人机的两个特征($ g_A^n $和$ g_G^n $),得到不同的关系特征后进行拼接,并和无人机原特征信息进行融合。关系特征结构如图3(b)所示,图中$ {W_V} $、$ {W_Q} $、$ {W_K} $、$ {W_G} $都表示线性变换,改变无人机特征的维数,Weight表示权重$ {\omega ^{mn}} $,dot表示点乘,$g_R^n$表示关系特征的输出,无人机群成员关系模块和关系特征可以由公式(2)、(3)分别表示为:

      $$ \mathrm{g}_A^{* n}=g_A^n+{Concat}\left[g_R^1(n), \cdots, g_R^{N_r}(n)\right], \text { for all } n$$ (2)
      $$g_R(n)=\sum_m \omega^{m n} \cdot\left(W_V \cdot g_A^m\right) $$ (3)

      式中:$ g{\text{*}}_A^n $为第$n$个关系模块的输出,文中的$ {N_r} $根据无人机群中无人机数量设置为20;${g_R}(n)$为关系特征的输出。

    • 为加速损失的收敛速度,文中采用SIoU (SCYLLA-IoU, SIoU) Loss[14]函数。SIoU Loss包含角度损失,距离损失,形状损失以及IoU损失。其中,角度损失使网络的收敛速度更快,目标检测定位效果更好。SIoU Loss定义为:

      $$ {L_{{\rm{SIoU}}}} = {W_{box}}{L_{box}} + {W_{cls}}{L_{cls}} $$ (4)

      式中:${W_{box}}$、${W_{cls}}$分别表示框和分类损失的权重;${L_{cls}}$表示Focal Loss[15]函数;${L_{box}}$表示回归损失函数。

      Focal Loss函数的定义为:

      $$ {L_{{\rm{Focal}}{\text{ }}{\rm{Loss}}}} = \left\{ {\begin{array}{*{20}{c}} { - {{(1 - \hat p)}^\gamma }\log(\hat p)\;\;\;{\text{ if }}\;y{\text{ = 1}}} \\ { - {{\hat p}^\gamma }\log(1 - \hat p)\;\;\;{\text{ if}}\; y{\text{ = 0}}} \end{array}} \right. $$ (5)

      式中:$ \hat p $为目标预测概率;$ \gamma $为可调节因子;$ y $为label。

      回归损失函数${L_{box}}$的定义为:

      $$ {L_{box}}{{ = 1 - }}{\rm{IoU }}+ \frac{{\Delta + \varOmega }}{2} $$ (6)

      式中:$\Delta $表示距离损失;$\varOmega $表示形状损失。${\rm{IoU}}$可由公式(7)表示:

      $$ {\rm{IoU}} = \frac{{\left| {B \cap {B^{GT}}} \right|}}{{\left| {B \cup {B^{GT}}} \right|}} $$ (7)

      式中:$B$表示目标框;${B^{GT}}$表示回归框。

    • 本节介绍数据集构建方法并设计无人机群目标检测算法验证实验、算法对比实验和消融实验。

    • 为开展无人机群目标检测算法验证实验,文中构建了一种无人机群数据集Drone-swarms Dataset (DSD)。目前,尚未有开源的无人机群数据集,无人机群中无人机数量较多,较难获取优秀的无人机群数据集。文中利用红外相机拍摄无人机群多种飞行状态下的序列视频,对视频进行截取,得到无人机群飞行图像,再进行有效筛选,获取6900张红外图像的无人机群数据集。Drone-swarms Dataset数据集采用PASCAL VOC标注格式,其中70%用于训练,30%用于测试。无人机群数据集的图像数量、图像分辨率、图像中无人机目标数量、尺寸等信息如表1所示。数据集中的无人机群有三角形、矩形、圆形、多群等多种飞行状态,如图4所示。

      表 1  数据集信息

      Table 1.  Dataset information

      TitleNorm
      Dataset nameDrone-swarms Dataset
      Number of images6900 sheet
      Resolution of an image/pixel960×540
      Number of UAV20-25 racks
      UAV target size/pixel9×8-13×11

      图  4  无人机群飞行状态示例

      Figure 4.  Example of UAV group flight status

    • 文中实验平台的配置如表2所示,实验是在Drone-swarms Dataset数据集上开展,根据YOLOv5的训练要求修改配置文件,设置表3中的参数值,包括epoch值、衰减系数、Batch size、学习率等。实验选择目标检测的平均精度(Mean Average Precision, mAP)、检测速度(Frames Per Second, FPS)作为评价检测算法性能的指标。

      表 2  实验平台的配置

      Table 2.  Configuration of the experimental platform

      TitleNorm
      Operating systemUbuntu 18.04
      Processing unitIntel Xeon Gold 6230×2
      Graphics boardNVIDIA RTX 8000 ×2
      RAM192 G(32 G×6) DDR4 2933 MT/s
      Development environmentPython 3.6
      PyTorch 1.10.0
      CUDA 11.4

      表 3  参数设置

      Table 3.  Parameter settings

      Parameter nameParameter size
      Epoch300
      Attenuation factor0.0005
      Learning rate0.001
      Model optimizerAdam
      Batch size8
    • 为验证文中提出的算法的有效性,相同实验环境下,在Drone-swarms Dataset数据集上,文中提出的算法和YOLOv5两种算法开展对比测试实验。实验结果表明,文中提出的算法和YOLOv5的mAP分别为95.9%和89.6%,检测速度分别达到59 FPS和67 FPS,由此可知在检测速度差别不大的前提下,文中提出的算法检测更精准。两种算法的检测结果如图5图6所示。

      图  5  GMR-YOLOv5算法检测结果图

      Figure 5.  Detection result of GMR-YOLOv5 algorithm

      图  6  YOLOv5算法检测结果图

      Figure 6.  Detection result of YOLOv5 algorithm

      由实验结果和图5图6可知,文中的算法是优于原始YOLOv5算法。原始YOLOv5网络未引入SD-CAN模块和GMR模块,在无人机多种飞行状态下,检测无人机群成员时,会出现漏检、误检,如图6(a)、(b)出现漏检,图(c)出现误检。虽然GMR-YOLOv5算法的检测速度稍低于原始YOLOv5算法,但GMR-YOLOv5算法提高了检测精度,减少了漏检、误检的情况。

      为进一步验证文中提出的算法的优越性,将该算法与其他几种经典检测算法进行对比测试,如YOLOv7,YOLOX,SSD, Faster R-CNN。这几种算法的对比结果和检测效果图如表4图7~图9所示。表4中mAP@0.50表示在IoU=0.50时计算mAP;mAP@0.50:0.95表示在不同IoU值(0.5~0.95,步长为0.05)时平均mAP。

      表 4  对比实验结果

      Table 4.  Comparative experimental results

      AlgorithmsmAP@0.50mAP@0.50:0.95 FPS
      GMR-YOLOv595.9%70.1%59
      YOLOv589.6%60.5%67
      YOLOv786.3%28.9%40
      YOLOX85.9%28.8%33
      SSD56.7%23.2%87
      Faster R-CNN58.3%30.1%16

      图  7  YOLOv7算法检测结果图

      Figure 7.  Detection result of YOLOv7 algorithm

      图  8  YOLOX算法检测结果图

      Figure 8.  Detection result of YOLOX algorithm

      图  9  SSD算法检测结果图

      Figure 9.  Detection result of SSD algorithm

      表4可知,文中提出的检测算法的mAP@0.50、mAP@0.50:0.95在对比实验中是最高的,检测速度相较于原始YOLOv5有所降低。SSD算法在检测速度上相较于其他几种算法是最快的,但是在mAP@0.50,mAP@0.50:0.95指标上表现是最差的。由图5~图9可知,YOLOv7、YOLOX、SSD算法检测无人机群成员时,容易出现漏检情况,如图7图8(a)~(c)以及图9(b)、(c)所示的漏检情况。综合来看,文中提出的检测算法优于其他几种经典检测算法。

    • 为验证GMR-YOLOv5算法的抗干扰性,本节选取Drone-swarms Dataset数据集中无人机群运动交叉、运动模糊、分布密集三种干扰情况下进行GMR-YOLOv5、YOLOv5、YOLOv7、YOLOX四种算法对比实验。三种干扰情况下的数据集分别为606、564、523张图像,数据集信息如表5所示。实验结果如表6~表8所示,检测结果如图10~图13所示。

      表 5  三种干扰情况下的数据集信息

      Table 5.  Information about the dataset for the three disturbance scenarios

      TitleNorm
      Motion crossover606 sheet
      Motion blur564 sheet
      Dense distribution523 sheet
      UAV target size/pixel9×8-13×11

      表 6  运动交叉情况下,对比实验结果

      Table 6.  Comparison of experimental results in the case of motion crossover

      AlgorithmsmAP@0.50mAP@0.50:0.95FPS
      GMR-YOLOv582.2%43.4%60
      YOLOv558.8%15.1%69
      YOLOv769.1%16.2%21
      YOLOX75.9%17.2%30

      表 7  运动模糊情况下,对比实验结果

      Table 7.  Comparison of experimental results in the case of motion blur

      AlgorithmsmAP@0.50mAP@0.50:0.95FPS
      GMR-YOLOv591.3%56.2%60
      YOLOv587.3%26.9%69
      YOLOv786.1%26%23
      YOLOX88%24.8%30

      表 8  分布密集情况下,对比实验结果

      Table 8.  Comparison of experimental results in the case of dense distribution

      AlgorithmsmAP@0.50mAP@0.50:0.95FPS
      GMR-YOLOv590.9%55.5%60
      YOLOv575.5%20.8%69
      YOLOv783.7%18.5%28
      YOLOX80%16.3%30

      图  10  三种干扰情况下,GMR-YOLOv5算法检测结果

      Figure 10.  Detection results of GMR-YOLOv5 algorithm in three interference cases

      图  11  三种干扰情况下,YOLOv5算法检测结果

      Figure 11.  Detection results of YOLOv5 algorithm in three interference cases

      图  12  三种干扰情况下,YOLOv7算法检测结果

      Figure 12.  Detection results of YOLOv7 algorithm in three interference cases

      图  13  三种干扰情况下,YOLOX算法检测结果

      Figure 13.  Detection results of YOLOX algorithm in three interference cases

      表6~表8图10~图13可知,在三种干扰情况下,GMR-YOLOv5算法的mAP@0.50和mAP@0.50:0.95都是最高的,原始YOLOv5算法在对比实验中,速度最快,但在mAP@0.50指标上表现较差。原始YOLOv5、YOLOv7、YOLOX算法在三种干扰情况下,容易出现漏检、误检无人机群成员的情况如图11~图13所示。综合来看,文中提出的GMR-YOLOv5算法具有较好的抗干扰能力。

    • 为了表现出无人机群目标检测算法相比于原始YOLOv5的提升,对算法进行消融实验。此次实验使用Drone-swarms Dataset数据集对GMR-YOLOv5算法的每一部分改进模块开展训练验证并记录实验结果,实验结果如表9所示。

      表 9  消融实验结果

      Table 9.  Results of ablation experiment

      AlgorithmsmAP@0.50mAP@0.50:0.95FPS
      YOLOv589.6%60.5%67
      YOLOv5+SD-CAN93.2%58.1%60
      YOLOv5+GMR91.3%60.4%70
      YOLOv5+SD-CAN+SIoU93%58.3%60
      YOLOv5+GMR+SIoU92.3%61.9%70
      YOLOv5 +SD-CAN+GMR92.1%57.9%60
      YOLOv5+SD-CAN+GMR+SIoU95.9%70.1%59

      表9可知,YOLOv5网络中引入SD-CAN模块后,mAP@0.50提高约4%,但是mAP@0.50:0.95和检测速度有所降低。引入GMR模块后,mAP@0.50提高约1.9%,但检测速度在此次消融实验中较快的。SD-CAN模块和GMR模块都引入到YOLOv5网络后,mAP@0.50:0.95降低约4.3%,mAP@0.50提高约2.8%。文中提出的无人机群成员目标检测算法虽然检测速度降低了,但是在mAP@0.50,mAP@0.50:0.95指标上均有不同的程度的提高。

    • 针对现有无人机群检测算法容易出现漏检、误检目标以及未能感知无人机群结构特性的问题,文中提出了一种基于红外探测的无人机群结构特性感知算法。首先,将空间深度转换模块和通道注意力机制结合,构建了空间深度-通道注意力模块,该模块不仅将无人机特征从空间维度转化到通道维度,还利用通道注意力机制使网络更加关注通道中无人机的特征,提高了检测网络对无人机群成员的特征提取能力;其次,利用群成员在图像中的位置、边界框大小等结构信息,提出群成员关系模块,该模块将无人机群成员之间产生联系,进而提高网络对无人机群成员的检测定位能力;同时,采用SIoU损失函数,加速网络收敛;最后,在无人机群数据集上开展实验验证,最终获得mAP为95.9%,检测速度为59 FPS的网络模型,实现了无人机群队形结构的感知。

参考文献 (15)

目录

    /

    返回文章
    返回