采用传感器融合网络的单光子激光雷达成像方法

蒋筱朵; 赵晓琛; 冒添逸; 何伟基; 陈钱

doi:10.3788/IRLA20210871

采用传感器融合网络的单光子激光雷达成像方法

doi: 10.3788/IRLA20210871

南京理工大学电子工程与光电技术学院，江苏南京 210094

基金项目: 国家自然科学基金（61875088, 62005128）

详细信息

作者简介:
蒋筱朵，女，硕士生，主要从事单光子激光雷达成像技术与应用方面的研究

陈钱，男，副校长，教授，博士生导师，博士，主要从事光电成像与信息处理等方面的研究

通讯作者: 何伟基，男，研究员，博士生导师，主要从事光电成像技术及应用方面的研究。

中图分类号: O439

Single-photon LiDAR imaging method based on sensor fusion network

School of Electronic and Optical Engineering, Nanjing University of Technology and Science, Nanjing 210094, China

摘要: 激光雷达系统采用主动照明的方式，激光发射脉冲周期信号至目标场景，激光脉冲经目标表面漫反射，由单光子雪崩二极管（Single-Photon Avalanche Diode, SPAD）探测器记录回波光子的到达时间，获得场景的深度信息。然而在探测过程中，测量结果往往会遭到环境光的干扰。传感器融合是进行单光子成像的有效方法之一。最近提出的基于LiDAR和强度相机融合的数据驱动方法大多采用扫描式激光雷达，深度获取速度慢。SPAD阵列的出现打破了帧率的限制。SPAD阵列允许同时收集多个回波光子，加速了信息采集，但分辨率较低，在探测过程中还会受到环境光的干扰，因此需要通过算法打破SPAD阵列的固有限制，从噪声中分离深度信息。针对分辨率为32×32 pixel的SPAD阵列探测器，提出了一种卷积神经网络结构，旨在强度图的引导下，将低分辨率TCSPC直方图映射至高分辨率深度图。该网络采用多尺度方法提取输入特征，并基于注意力模型融合深度数据和强度数据。另外，设计了一个损失函数组合，适用于处理TCSPC直方图数据的网络。在采集数据上进行了验证，提出方法能成功将深度数据的空间分辨率提升4倍，并在质量和数据指标上都优于其他算法。
- 激光雷达 /
- 单光子成像方法 /
- 传感器融合 /
- SPAD阵列 /
- 卷积神经网络
Abstract: LiDAR systems with active illumination obtain depth information of the scene using Single-Photon Avalanche Diode(SPAD) detectors to record the arrival time of reflected photons from the laser pulse. However, there is ambient light that interferes measurements during the detection period. Sensor fusion is one of the effective methods for single-photon imaging. Recently, many data-driven methods based on intensity-LiDAR fusion have achieved gratifying results, but most of them use the scanning LiDAR which has a slow depth acquisition speed. The advent of the SPAD array can overcome the limitation of frame rates. The SPAD array allows the collection of multiple returned photons at the same time, which accelerates the information collection process. However, the spatial resolution of SPAD array detectors is typically low, and the detection process is also interfered by the ambient light. Therefore, it is necessary to break the inherent limitation of the SPAD array through an algorithm to separate the depth information from the noise. In this paper, for the SPAD array detector with the array size of 32×32 pixel, a convolutional neural network was proposed, which could reconstruct high-resolution clean TCSPC histogram under the guidance of the intensity image. A multi-scale approach was adopted to extract input features, and the fusion of depth data and intensity data was further processed based on the attention mechanism in the network. In addition, a loss function combination suitable for the TCSPC histogram data processing network was designed, where the overall distribution of photons and the ordinal relationship between time bins in the temporal dimension could be simultaneously considered. The method proposed in this paper can successfully increase the depth spatial resolution by 4 times, and the efficacy of proposed method is verified on realistic data, which is superior to state-of-the-art methods qualitatively and quantitatively.
- LiDAR /
- single-photon imaging method /
- sensor fusion /
- SPAD array /
- convolutional neural network
图 1 实验设置图

Figure 1. Experiment setup

下载: 全尺寸图片幻灯片

图 2 基于注意力模块的多尺度融合网络结构示意图

Figure 2. Schematic diagram of multi-scale fusion network structure based on attention module

下载: 全尺寸图片幻灯片

图 3 (a)网络输入强度图；(b)网络输入深度图；(c) MLE方法处理结果；(d) He et al. ^[16] 方法处理结果；(e) Lindell et al. ^[10] 方法处理结果；(f)文中方法处理结果

Figure 3. (a) The input intensity map; (b) The input depth map; (c) The result processed by MLE method; (d) The result processed by He et al. ^[16]; (e) The result processed by Lindell et al. ^[10]; (f) The result processed by proposed method in this paper

下载: 全尺寸图片幻灯片

图 4 (a)网络输入强度图；(b)文中提出方法处理结果图；(c)不含注意力模块的网络处理结果图；(d)无强度引导的网络处理结果；(e)使用不含序数回归损失的损失函数的网络处理结果；(f)使用不含KL散度的损失函数的网络处理结果

Figure 4. (a) Network input intensity map; (b) The result of the method proposed in the paper; (c) The result processed by the network without attention module; (d) The result processed by the network without intensity guidance; (e) The result processed by the network of loss function without ordinal regression loss; (f) The result processed by the network without KL divergence

下载: 全尺寸图片幻灯片

图 5 (a)没有上采样的点云图；(b)使用后上采样法的点云图；(c)使用预上采样法的点云图

Figure 5. (a) Point cloud without upsampling; (b) Point cloud with post-upsampling method; (c) Point cloud with pre-upsampling method

下载: 全尺寸图片幻灯片

表 1 实验量化结果比较

Table 1. Comparison of experimental quantitative results

Preprocessed MLE He et al. ^[16] Lindell et al. ^[10] Proposed

"N" and "J" 0.8489 0.4823 0.3970 0.3253 0.3068
Multi objects 0.7204 0.4510 0.6129 0.2432 0.1958

下载: 导出CSV

表 2 消融实验量化结果

Table 2. Ablation experimental quantitative results

Without attention Without intensity KL + TV OR + TV Proposed

"N" and "J" 0.7204 0.4510 0.6129 0.2432 0.1958

下载: 导出CSV

[1]	Henderson R K, Johnston N, Hutchings S W, et al. 5.7 A 256×256 40 nm/90 nm CMOS 3D-stacked 120 dB dynamic-range reconfigurable time-resolved spad imager[C]//ISSCC, 2019: 106–108.
[2]	Poland S P, Krstajić N, Monypenny J, et al. A high speed multifocal multiphoton fluorescence lifetime imaging microscope for live-cell FRET imaging [J]. Biomed Opt Express, 2015, 6(2): 277-296. doi: 10.1364/BOE.6.000277
[3]	黄鹤, 李昕芮, 宋京, 等. 多尺度窗口的自适应透射率修复交通图像去雾方法[J]. 中国光学, 2019, 12(6): 1311-1320. doi: 10.3788/CO.20191206.1311 Huang He, Li Xinrui, Song Jing, et al. A traffic image dehaze method based on adaptive transmittance estimation with multi-scale window [J]. Chinese Optics, 2019, 12(6): 1311-1320. (in Chinese) doi: 10.3788/CO.20191206.1311
[4]	Shin D, Xu F, Venkatraman D, et al. Photon-efficient imaging with a single-photon camera [J]. Nat Commun, 2016, 7(1): 12046. doi: 10.1038/ncomms12046
[5]	冯肖维, 胡海云, 庄瑞卿, 等. 三维点云自适应稀疏优化重构[J]. 光学精密工程, 2021, 29(10): 2495-2503. doi: 10.37188/OPE.20212910.2495 Feng Xiaowei, Hu Haiyun, Zhuang Ruiqing, et al. Adaptive reconstruction of 3D point cloud by sparse optimization [J]. Optics and Precision Engineering, 2021, 29(10): 2495-2503. (in Chinese) doi: 10.37188/OPE.20212910.2495
[6]	Rapp J, Goyal V K. A few photons among many: Unmixing signal and noise for photon-efficient active imaging [J]. IEEE Trans Comput Imaging, 2017, 3(3): 445-459. doi: 10.1109/TCI.2017.2706028
[7]	王春哲, 安军社, 姜秀杰, 等. 基于卷积神经网络的候选区域优化算法[J]. 中国光学, 2019, 12(6): 1348-1361. doi: 10.3788/CO.20191206.1348 Wang Chunzhe, An Junshe, Jiang Xiujie, et al. Region proposal optimization algorithm based on convolutional neural networks [J]. Chinese Optics, 2019, 12(6): 1348-1361. (in Chinese) doi: 10.3788/CO.20191206.1348
[8]	周宏强, 黄玲玲, 王涌天. 深度学习算法及其在光学的应用[J]. 红外与激光工程, 2019, 48(12): 1226004-1226004. doi: 10.3788/IRLA201948.1226004 Zhou Hongqiang, Huang Lingling, Wang Yongtian, et al. Deep learning algorithm and its application in optics [J]. Infrared and Laser Engineering, 2019, 48(12): 1226004. (in Chinese) doi: 10.3788/IRLA201948.1226004
[9]	曾瀚林, 孟祥勇, 钱惟贤, 等. 高斯差分滤波图像融合方法[J]. 红外与激光工程, 2020, 49(S1): 20200091. doi: 10.3788/IRLA20200091 Zeng Hanlin, Meng Xiangyong, Qian Weixian, et al. Image fusion algorithm based on DOG filter [J]. Infrared and Laser Engineering, 2020, 49(S1): 20200091. (in Chinese) doi: 10.3788/IRLA20200091
[10]	Lindell D B, O’Toole M, Wetzstein G. Single-photon 3D imaging with deep sensor fusion [J]. ACM Trans Graph, 2018, 37(4): 1-12.
[11]	Sun Z H, Lindell D B, Solgaard O, et al. SPADnet: Deep RGB-SPAD sensor fusion assisted by monocular depth estimation [J]. Opt Express, 2020, 28(10): 14948-14962. doi: 10.1364/OE.392386
[12]	Ruget A, McLaughlin S, Henderson R K, et al. Robust super-resolution depth imaging via a multi-feature fusion deep network [J]. Opt Express, 2021, 29(8): 11917-11937. doi: 10.1364/OE.415563
[13]	雷俊锋, 贺睿, 肖进胜. 融合空间注意力机制的行车障碍预测网络[J]. 光学精密工程, 2020, 28(8): 1850-1860. doi: 10.3788/OPE.20202808.1850 Lei Junfeng, He Rui, Xiao Jinsheng. Driving obstacles prediction network merged with spatial attention [J]. Optics and Precision Engineering, 2020, 28(8): 1850-1860. (in Chinese) doi: 10.3788/OPE.20202808.1850
[14]	Woo S, Park J, Lee J Y, et al. CBAM: Convolutional block attention module[C]//ECCV, 2018: 3-19.
[15]	Silberman N, Hoiem D, Kohli P, et al. Indoor segmentation and support inference from RGBD images[C]//ECCV, 2019: 746-760.
[16]	He K M, Sun J, Tang X O. Guided image filtering [J]. IEEE Trans Pattern Anal Mach Intell, 2013, 35(6): 1397-1409. doi: 10.1109/TPAMI.2012.213

[1]	张馨怡, 陈振林. 一种红外目标模拟器的大气传输校准方法研究 . 红外与激光工程, 2023, 52(3): 20220378-1-20220378-11. doi: 10.3788/IRLA20220378
[2]	张笑宇, 王凤香, 郭颖, 王文娟, 罗永锋, 武文, 侯佳, 姜紫庆, 彭梓强, 黄庚华, 舒嵘. 基于InGaAs单光子探测器的线阵扫描激光雷达及其光子信号处理技术研究 . 红外与激光工程, 2023, 52(3): 20220474-1-20220474-9. doi: 10.3788/IRLA20220474
[3]	李航, 彭高亮, 林鸿钊, 陈朝. 基于传感器融合预测的改进跟踪前馈控制方法研究 . 红外与激光工程, 2023, 52(5): 20220665-1-20220665-11. doi: 10.3788/IRLA20220665
[4]	徐国权, 李广英, 万建伟, 许可, 董光焰, 程光华, 王兴, 韩文杰, 马燕新. 脉冲调制激光雷达水下成像系统 . 红外与激光工程, 2022, 51(3): 20210204-1-20210204-8. doi: 10.3788/IRLA20210204
[5]	乔凯, 杨杰, 靳辰飞. 基于时间相关单光子计数的穿透成像激光雷达研究（特邀） . 红外与激光工程, 2022, 51(8): 20220404-1-20220404-13. doi: 10.3788/IRLA20220404
[6]	李霖, 王红梅, 李辰凯. 红外与可见光图像深度学习融合方法综述 . 红外与激光工程, 2022, 51(12): 20220125-1-20220125-20. doi: 10.3788/IRLA20220125
[7]	陆建华. 融合CNN和SRC决策的SAR图像目标识别方法 . 红外与激光工程, 2022, 51(3): 20210421-1-20210421-7. doi: 10.3788/IRLA20210421
[8]	齐悦, 董云云, 王溢琴. 基于汇聚级联卷积神经网络的旋转人脸检测方法 . 红外与激光工程, 2022, 51(12): 20220176-1-20220176-8. doi: 10.3788/IRLA20220176
[9]	李保华, 王海星. 基于增强卷积神经网络的尺度不变人脸检测方法 . 红外与激光工程, 2022, 51(7): 20210586-1-20210586-8. doi: 10.3788/IRLA20210586
[10]	刘瀚霖, 辛璟焘, 庄炜, 夏嘉斌, 祝连庆. 基于卷积神经网络的混叠光谱解调方法 . 红外与激光工程, 2022, 51(5): 20210419-1-20210419-9. doi: 10.3788/IRLA20210419
[11]	宦克为, 李向阳, 曹宇彤, 陈笑. 卷积神经网络结合NSST的红外与可见光图像融合 . 红外与激光工程, 2022, 51(3): 20210139-1-20210139-8. doi: 10.3788/IRLA20210139
[12]	庄子波, 邱岳恒, 林家泉, 宋德龙. 基于卷积神经网络的激光雷达湍流预警 . 红外与激光工程, 2022, 51(4): 20210320-1-20210320-10. doi: 10.3788/IRLA20210320
[13]	杨程, 鄢秋荣, 祝志太, 王逸凡, 王明, 戴伟辉. 基于深度学习的压缩光子计数激光雷达 . 红外与激光工程, 2020, 49(S2): 20200380-20200380. doi: 10.3788/IRLA20200380
[14]	高泽宇, 李新阳, 叶红卫. 流场测速中基于深度卷积神经网络的光学畸变校正技术 . 红外与激光工程, 2020, 49(10): 20200267-1-20200267-10. doi: 10.3788/IRLA20200267
[15]	徐云飞, 张笃周, 王立, 华宝成. 非合作目标局部特征识别轻量化特征融合网络设计 . 红外与激光工程, 2020, 49(7): 20200170-1-20200170-7. doi: 10.3788/IRLA20200170
[16]	裴晓敏, 范慧杰, 唐延东. 多通道时空融合网络双人交互行为识别 . 红外与激光工程, 2020, 49(5): 20190552-20190552-6. doi: 10.3788/IRLA20190552
[17]	薛珊, 张振, 吕琼莹, 曹国华, 毛逸维. 基于卷积神经网络的反无人机系统图像识别方法 . 红外与激光工程, 2020, 49(7): 20200154-1-20200154-8. doi: 10.3788/IRLA20200154
[18]	张腊梅, 陈泽茜, 邹斌. 基于3D卷积神经网络的PolSAR图像精细分类 . 红外与激光工程, 2018, 47(7): 703001-0703001(8). doi: 10.3788/IRLA201847.0703001
[19]	郭强, 芦晓红, 谢英红, 孙鹏. 基于深度谱卷积神经网络的高效视觉目标跟踪算法 . 红外与激光工程, 2018, 47(6): 626005-0626005(6). doi: 10.3788/IRLA201847.0626005
[20]	姜成昊, 杨进华, 张丽娟, 李祥. 新型多普勒成像激光雷达原理设计与仿真 . 红外与激光工程, 2014, 43(2): 411-416.

点击查看大图

图(5) / 表(2)

计量

文章访问数: 483
HTML全文浏览量: 148
PDF下载量: 126
被引次数: 0

全文HTML

0. 引　言

从感知场景中推断出正确的深度信息对许多应用来说是至关重要的，例如自动驾驶、虚拟现实、增强现实和机器人技术。激光雷达是深度成像中的领先技术，目前，大多数激光雷达系统采取单点/扫描的方式，使用共轴对齐的激光二极管和单光子探测器，由激光器发射激光，探测器时间标注经场景反射回来的到达光子。扫描式激光雷达系统虽然能够获取较为准确的深度信息，但采集速度慢。然而，越来越多的应用要求对场景进行快速获取，在此需求之下，单光子雪崩二极管（Single-Photon Avalanche Diode, SPAD）阵列应运而生。通过同时采集多个回波光子，SPAD阵列可以提供准确快速的场景深度信息。

近年来，许多研究团队着力发展SPAD阵列^[1-2]。目前，激光雷达的分辨率较低，尤其是SPAD阵列，因此，深度重建也是一个热门的研究方向^[3-6]，也有许多研究依赖于神经网络方法^[7-8]。仅从激光雷达系统中获取的信息进行深度重建效果是有限的，多维信息融合^[9]是解决这一问题的方法之一。Lindell等人结合常规高分辨率相机和线列SPAD，使用多尺度深度卷积网络，提出了一种用于效率3 D成像的数据驱动方法^[10]；在此基础上，Sun等人引入了单目深度估计算法，能从强度信息中得到更可靠的相对距离信息^[11]；Ruget等人使用了相同的SPAD阵列传感器，基于神经网络，利用强度图和多个从直方图中提取出的特征引导深度上采样^[12]。

在人类视觉系统中，大脑会自动忽略场景中低价值的信息，为了模仿这一行为，注意力模型被提出。在神经网络中，注意力模型能够硬性选择输入的某些部分，或者给输入的不同部分分配不同的权重，目前在各个领域被广泛使用^[13]。最近的工作将注意力模型应用于三维点云数据上，但解决的都是分类问题，文中将深度图像重构视为回归问题，将注意力模型嵌入处理时间相关单光子计数（Time-Correlated Single-Photon Counting, TCSPC）直方图数据的神经网络中，证明注意力模型在三维数据回归问题中的有效性。

为了打破SPAD阵列的固有图像分辨率限制和去除探测器探测过程中的噪声光子，论文基于传感器融合策略提出了一种卷积神经网络结构，引入多尺度特征提取和注意力机制模块，提高了融合质量。此外，设计了一个针对TCSPC直方图的损失函数，不仅关注光子在时间维度上的总体分布，还考虑各个时间仓间光子的序数关系。文中提出的方法可以将深度数据的空间分辨率提升4倍，并在仿真数据和真实采集数据上都取得了比其他算法更好的质量效果和量化指标。

4. 结　论

文中针对深度重构研究方向，介绍了一种基于传感器融合策略的卷积神经网络结构，并结合了注意力模型，产生了更好的融合效果。此外，文中设计了一种损失函数，适用于处理TCSPC直方图数据的算法，同时关注时间维度上光子的总体分布和各个时间仓之间的序数回归关系。文中提出的卷积神经网络结构简单，无需过多的预处理步骤，并在由SPAD阵列探测器获取的数据上验证了深度重构的鲁棒性。在比较实验中，文中提出的方法处理结果能够重构出边缘，物体深度完整；相比于其他深度重构方法，最好可以将量化指标提高3倍。在消融实验中，使用文中设计的网络结构和损失函数得到的处理结果都取得了最佳图像质量。这些实验结果均验证了文中方法具有优异的深度重构能力，在实际应用中具有潜力。

参考文献 (16)

姓名
邮箱
手机号码
标题
留言内容
验证码

留言板

采用传感器融合网络的单光子激光雷达成像方法

doi: 10.3788/IRLA20210871

作者简介:
蒋筱朵，女，硕士生，主要从事单光子激光雷达成像技术与应用方面的研究

陈钱，男，副校长，教授，博士生导师，博士，主要从事光电成像与信息处理等方面的研究

通讯作者: 何伟基，男，研究员，博士生导师，主要从事光电成像技术及应用方面的研究。

Single-photon LiDAR imaging method based on sensor fusion network

计量

采用传感器融合网络的单光子激光雷达成像方法

doi: 10.3788/IRLA20210871

南京理工大学电子工程与光电技术学院，江苏南京 210094

作者简介:
蒋筱朵，女，硕士生，主要从事单光子激光雷达成像技术与应用方面的研究

陈钱，男，副校长，教授，博士生导师，博士，主要从事光电成像与信息处理等方面的研究

通讯作者: 何伟基，男，研究员，博士生导师，主要从事光电成像技术及应用方面的研究。

English Abstract

Single-photon LiDAR imaging method based on sensor fusion network

School of Electronic and Optical Engineering, Nanjing University of Technology and Science, Nanjing 210094, China

全文HTML

1.1. 实验设置

1.2. 预处理

2.1. 网络结构

2.2. 损失函数

2.2.1. KL散度

2.2.2. 序数回归损失

2.2.3. 全变差正则项

3.1. 比较实验

3.2. 消融实验

3.3. 上采样实验

目录

	Preprocessed	MLE	He et al. ^[16]	Lindell et al. ^[10]	Proposed
"N" and "J"	0.8489	0.4823	0.3970	0.3253	0.3068
Multi objects	0.7204	0.4510	0.6129	0.2432	0.1958

	Without attention	Without intensity	KL + TV	OR + TV	Proposed
"N" and "J"	0.7204	0.4510	0.6129	0.2432	0.1958

留言板

采用传感器融合网络的单光子激光雷达成像方法

doi: 10.3788/IRLA20210871

作者简介: 蒋筱朵，女，硕士生，主要从事单光子激光雷达成像技术与应用方面的研究 陈钱，男，副校长，教授，博士生导师，博士，主要从事光电成像与信息处理等方面的研究

通讯作者: 何伟基，男，研究员，博士生导师，主要从事光电成像技术及应用方面的研究。

Single-photon LiDAR imaging method based on sensor fusion network

计量

出版历程

采用传感器融合网络的单光子激光雷达成像方法

doi: 10.3788/IRLA20210871

南京理工大学 电子工程与光电技术学院，江苏 南京 210094

作者简介: 蒋筱朵，女，硕士生，主要从事单光子激光雷达成像技术与应用方面的研究 陈钱，男，副校长，教授，博士生导师，博士，主要从事光电成像与信息处理等方面的研究

通讯作者: 何伟基，男，研究员，博士生导师，主要从事光电成像技术及应用方面的研究。

English Abstract

Single-photon LiDAR imaging method based on sensor fusion network

School of Electronic and Optical Engineering, Nanjing University of Technology and Science, Nanjing 210094, China

全文HTML

1.1. 实验设置

1.2. 预处理

2.1. 网络结构

2.2. 损失函数

2.2.1. KL散度

2.2.2. 序数回归损失

2.2.3. 全变差正则项

3.1. 比较实验

3.2. 消融实验

3.3. 上采样实验

目录

作者简介:
蒋筱朵，女，硕士生，主要从事单光子激光雷达成像技术与应用方面的研究

陈钱，男，副校长，教授，博士生导师，博士，主要从事光电成像与信息处理等方面的研究

南京理工大学电子工程与光电技术学院，江苏南京 210094

作者简介:
蒋筱朵，女，硕士生，主要从事单光子激光雷达成像技术与应用方面的研究

陈钱，男，副校长，教授，博士生导师，博士，主要从事光电成像与信息处理等方面的研究