-
从ATLAS发射出的小部分光子在完成首次穿越大气层后,经地球表面反射,再次穿越大气层返回进入ATLAS望远镜中,最终被仪器电子设备记录下来。在此过程中,来自532 nm波长的太阳光的背景光子可能会到达探测器,且其中的一些背景光子也会被ATLAS记录下来。ATLAS记录到达时间的任何光子称为光子事件,该记录过程与光子的来源无关。因此,ATLAS记录的光子事件的数量取决于地球表面的几何结构和反射率、太阳条件以及大气中的散射和衰减[15]。
ICESat-2卫星官方通过划分一定间隔的沿轨距离,对所探测到的光子进行分析和处理。不同等级的产品具有不同的沿轨距离间隔,如ATL03为20 m[16],ATL08为100 m[15]。文中所开展的地表覆盖分类的空间最小分辨率正是各级产品对应的单个沿轨距离间隔。通过分析分布于每个沿轨距离间隔内的探测光子在空间上的分布情况,可以识别出不同的地表覆盖。而每个沿轨距离间隔内有效探测光子(反射于地表的探测光子)的比例则将决定地表分类正确性。
-
ICESat-2卫星官方在产品发布前所进行的滤波工作,可以很大程度地抑制背景噪声光子的影响,但并非完全消除,特别当沿轨距离间隔内的有效探测光子数量过低时。为了更好地保证地表分类的准确性,文中依据了ICESat-2卫星产品中的信噪比标签,通过设定门限值对低信噪比(<3)的数据进行剔除。
同时,对每个沿轨距离间隔内的有效探测光子进行分析时,希望有效探测光子是均匀分布在整段沿轨距离间隔内。因此,文中对沿轨距离间隔内出现水平方向上超过20%有效探测光子缺失的数据进行了剔除。
-
如1.1节所介绍的,ICESat-2卫星数据对地表采用了光子级灵敏度的探测。同时,对不同类别的地表分类时是通过分析分布于每个沿轨距离间隔内的探测光子在空间上的分布情况而进行的。因此,在对不同地表进行分类时,关于分类器属性的选择,文中主要考虑以下几个方面。
首先,在每个沿轨距离间隔内,具有不同反射率的地表所返回的探测光子数是不同的。例如,雪和冰表面在532 nm波长的激光束处具有高反射率(典型的朗伯反射系数介于0.8和0.98之间),而树冠和地形表面的反射率要低得多(土壤通常约为0.3,植被约为0.1),预计从地球表面返回的光子数量是冰雪表面的1/3到1/9[9, 15]。基于此,文中采用产品在每个沿轨距离间隔内所记录的光子数量作为分类器的属性之一。该属性可以直接通过ICESat-2卫星产品中的标签获得。
其次,对于每个沿轨距离间隔,不同地表的探测光子在垂直方向中的不同高度层内,具有不同的比例。例如,当ICESat-2卫星对植被区域进行探测时,由于植被冠层的遮挡,分布于地面(或水面)的探测光子比例将低于裸地区域(或水域);以及ICESat-2卫星对于森林区域与灌木等低植被区域的冠层内部和顶部进行探测时,由于植被遮挡情况的不同(树冠的茂密程度不同),两者的冠层内部和顶部具有不同的探测光子比例。基于此,文中在每个沿轨距离间隔内,计算被分类为地面光子、被分类为冠层光子、以及被分类为冠层顶层光子各自相对于全部光子的比例作为分类器的属性。上述前三类光子的数量可以直接通过ICESat-2产品中的标签获得。该类属性是关于地表垂直方向上的描述信息,为传统遥感影像所不具有的信息,将有望辅助传统光学遥感图像分类以进一步提高地表分类精度。
另外,对于每个沿轨距离间隔,不同地表的探测光子在水平方向中具有不同的分布特性(或比例)。例如,由于植被冠层的遮挡,裸地(或水体)区域内被分类为地面光子在水平方向上的分布相比于植被区域的地面光子更为均匀。基于此,文中主要在每个沿轨距离间隔内,计算被分类为地面的光子,以及被分类为冠层或冠层顶部的光子在水平方向上的分布比例作为分类器的属性。以ICESat-2卫星的ATL08产品为例,产品对于每个沿轨距离间隔,在水平方向上均划分为五段等长子间隔,并对每段子间隔内的光子类别标识从而构建指示标签[9, 15]。通过此类标签,可以计算地面的光子,和冠层或冠层顶部的光子在水平方向上的分布比例。
最后,考虑到信噪比、太阳条件以及大气条件对有效探测光子的影响[15],文中将这些影响因素纳入分类器属性集内。这些属性可以直接通过ICESat-2产品中的标签所获得。
综上所述,文中构建分类器的属性如表1所示。
表 1 分类器属性
Table 1. Classifier attribute
Attribute Description Photon number Product label Proportion of terrain photons in
vertical directionComputed Proportion of canopy photons in
vertical directionComputed Proportion of top canopy photons in
vertical directionComputed Proportion of terrain photons
horizontal directionComputed Proportion of canopy/top canopy photons
horizontal directionComputed SNR Product label Solar elevation Product label Solar azimuth Product label Cloud confidence flag Product label 在完成数据预处理和分类器的属性选择后,通过选择训练样本进行随机森林训练可得到分类器模型,而测试样本可以通过该模型实现样本类别的预测,整个过程如图1所示。
-
文中的实验区域位于中国的江苏省、上海市和浙江省,实验数据为ICESat-2卫星的ATL08产品[9, 15]。产品中包含的IGBP土地覆盖分类数据可作为参考的地表覆盖数据[15]。该数据是通过2012年的MODIS数据生成的,其空间分辨率为500 m,涵盖了从森林、灌木、草场、水体以及城市等17个不同类别。考虑到卫星激光测高在地表纹理、反射率等信息上表征的不足从而导致相似地表覆盖分类性能中存在局限性的情况,以及结合相关学者关于高树/森林、城市、水和裸地/低植被四类地表覆盖分类的研究[2],文中首先将水体、森林地表覆盖作为两类地表类别,然后从植被与非植被地表区分角度,初步对低植被,城市和裸地三类地表覆盖划分为低植被和城市/裸地地表覆盖作为后两类地表类别,最后依据上述四类地表覆盖分类结果的混淆矩阵,进一步合并混淆度较大的地表类别以进一步分析分类器性能。依据IGBP 17类地表的混淆矩阵[17],可以估算文中采用的水体、森林、低植被以及城市/裸地四类地表的总体分类精度约为93%。ICESat-2官方已对ATL08产品数据与该数据作了最佳的地理位置匹配[15],可以直接作为该实验的验证数据。
依据1.2节中所描述的数据预处理,首先通过ATL08产品中每个沿轨距离间隔内(100 m)的探测光子的信噪比标签(SNR),对信噪比低于3的数据进行剔除。然后,通过ATL08产品中的每个沿轨距离间隔内(100 m)的探测光子在水平方向上5段等长子间隔(20 m)类别分布标签(subset_te_flag),对超过20%有效探测光子缺失的数据进行剔除。剔除后的数据分布如图2所示。最后,将土地覆盖分类数据(IGBP土地覆盖分类数据)重新分为水体、森林、低植被以及城市/裸地四类。四种类别地表的样本数量如表2所示。
表 2 四类地表样本数量
Table 2. Number of four kinds of land cover samples
Class Strong beam Weak beam Water 30 794 31 205 Forest 51 385 80 315 Low vegetation 241 955 279 090 Urban/barren 18 522 19 305 -
依据1.3节,完成了属性集的构建,然后,对表2中的强波束和弱波束数据分别按以下步骤进行处理:
(1)分别从各个类别的样本中随机抽取25%作为训练样本。
(2)对训练样本进行训练,获得随机森林分类器。
(3)以剩余的样本作为测试样本,通过步骤(2)获得到的随机森林分类器进行对样本类别进行预测。
(4)重复步骤(1)~(3)五次,得到五组随机分类结果。
训练过程中,随机森林的参数中的ntrees设置为500,mtry设置为4。
-
按照2.2节的数据处理步骤进行处理后,可以获得五组强波束和弱波束数据关于四类地表的分类结果,如图3所示。其中,第一组强波束和弱波束各自的混淆矩阵如图4所示。
图 3 强波束和弱波束数据关于四类地表的分类结果
Figure 3. Classification results for four kinds of land cover using strong beam and weak beam altimetry data
图 4 强波束和弱波束测高仪数据关于四类地表的分类混淆矩阵
Figure 4. Classification confusion matrix of four kinds of land cover using strong beam and weak beam altimetry data
从图3中可以看出,强波束和弱波束的数据在水体、森林、低植被以及城市/裸地四类地表的分类结果较好,总体分类精度均优于85%,Kappa系数均优于70%。从图4中可以发现,低植被的分类精度最佳,往后依次为水体、森林和城市/裸地。其中,城市/裸地类别的地表与低植被类被的地表混淆最大(强波束:76.21%,弱波束:82.06%),这可能是因为部分低植被区域的冠层覆盖率较低,信号(在这种情况下是树冠)光子可能被错误地识别为数据产品内的太阳背景噪声而被过滤掉[15],从而与裸地(或城市中空旷区域)混淆。此外,城市中稀疏的建筑与植被交错区域也将是潜在的混淆源。为了进一步提高分类器的性能,笔者等尝试将低植被类别的地表与城市/裸地类别的地表作为相同类别的地表,从而开展水体、森林、以及低植被/城市/裸地三类地表分类实验。该地表分类实验结果如图5所示。从图5中可以看出,分类器的性能得到进一步的提高,强波束和弱波束的总体精度均提高至90%以上,Kappa系数均提高至79%以上。
Land cover classification using ICESat-2 data with random forest
-
摘要: 该研究将ICESat-2卫星激光测高数据作为地表覆盖分类的新数据源,提出了一种基于随机森林的ICESat-2卫星地表覆盖分类方法,探索了光子计数卫星激光测高在地表覆盖分类中的应用潜力。该方法采用光子数目、不同类型光子水平和垂直分布比例、信噪比、太阳条件、大气条件作为分类的输入,并在中国长三角地区开展了多类地表覆盖类型分类实验进行了验证。实验结果表明,ICESat-2卫星的强波束和弱波束的激光数据在水体、森林、低植被以及城市/裸地四类地表的总体分类精度均能达到优于85%;在水体、森林以及低植被/城市/裸地三类地表的总体分类精度能达到优于90%的水平。Abstract: ICESat-2 data was considered as a new land cover classification data source, and a method was proposed to classify land cover using ICESat-2 data with random forest, to explore the application potential of the space-borne photon counting lidar in the land cover classification. The method used the photon number, the proportion of horizontal and vertical distribution of different types of photons, signal-to-noise ratio, solar conditions and atmospheric conditions as the input of classification, and was verified by the experiment of multi-category land cover in China's Yangtze River Delta. For four categories of water, forest, low vegetation and urban/barren, the classification results show that the overall accuracy of strong beam and weak beam is better than 85%. For three categories of water, forest, and low vegetation/urban/barren, the classification results show that the overall accuracy of strong beam and weak beam is better than 90%.
-
Key words:
- land cover classification /
- ICESat-2 /
- photon counting /
- random forest
-
表 1 分类器属性
Table 1. Classifier attribute
Attribute Description Photon number Product label Proportion of terrain photons in
vertical directionComputed Proportion of canopy photons in
vertical directionComputed Proportion of top canopy photons in
vertical directionComputed Proportion of terrain photons
horizontal directionComputed Proportion of canopy/top canopy photons
horizontal directionComputed SNR Product label Solar elevation Product label Solar azimuth Product label Cloud confidence flag Product label 表 2 四类地表样本数量
Table 2. Number of four kinds of land cover samples
Class Strong beam Weak beam Water 30 794 31 205 Forest 51 385 80 315 Low vegetation 241 955 279 090 Urban/barren 18 522 19 305 -
[1] Schutz B E, Zwally H J, Shuman, C A, et al. Overview of the ICESat mission [J]. Geophysical Research Letters, 2005, 32(21): L21S01. [2] Duong H, Pfeifer N, Lindenbergh R. Full waveform analysis: ICESat laser data for land cover classification[C]//In proceedings: ISPRS Mid-term Symposium, Remote Sensing, 2012, 36: 31-35. [3] Ghosh S, Nandy S, Patra S, et al. Land cover classification using ICESat/GLAS full waveform data [J]. Journal of the Indian Society of Remote Sensing, 2017, 45(2): 327-335. doi: 10.1007/s12524-016-0602-5 [4] 权学烽, 唐新明, 李国元, 等. 基于激光测高卫星全波形数据的地表覆盖分类应用—以北京市城区为例[J]. 遥感信息, 2019, 34(6): 6-11. doi: 10.3969/j.issn.1000-3177.2019.06.002 Quan Xuefeng, Tang Xinming, Li Guoyuan, et al. Land cover classification application of satellite laser altimetry data: a case study in Beijing, China [J]. Remote Sensing Information, 2019, 34(6): 6-11. (in Chinese doi: 10.3969/j.issn.1000-3177.2019.06.002 [5] 马跃, 张文豪, 张智宇, 等. 基于半解析模型的激光测高回波海水海冰波形分类方法[J]. 红外与激光工程, 2018, 47(5): 0506005. doi: 10.3788/IRLA201847.0506005 Ma Yue, Zhang Wenhao, Zhang Zhiyu, et al. Sea and sea-ice waveform classification for the laser altimeter based on semi-analytic model [J]. Infrared and Laser Engineering, 2018, 47(5): 0506005. (in Chinese doi: 10.3788/IRLA201847.0506005 [6] Li S, Zhang W H, Ma Y, et al. Theoretical surface type classifier based on a waveform model of a satellite laser altimeter and its performance in the north of Greenland [J]. Applied Optics, 2018, 57(10): 2482. doi: 10.1364/AO.57.002482 [7] Liu C X, Huang H B, Gong P, et al. Joint use of ICESat/GLAS and landsat data in land cover classification: a case study in Henan Province, China [J]. IEEE Journal of Selected Topics in Applied Earth Observations and Remote Sensing, 2015, 8(2): 511-522. doi: 10.1109/JSTARS.2014.2327032 [8] Markus T, Neumann R, Martino A, et al. The ice, cloud, and land elevation Satellite-2 (ICESat-2): Science requirements, concept, and implementation [J]. Remote Sens Environ, 2017, 190, 260: 273. [9] Neuenschwander A, Pitts K. The ATL08 land and vegetation product for the ICESat-2 Mission [J]. Remote Sensing of Environment, 2019, 221: 247-259. doi: 10.1016/j.rse.2018.11.005 [10] 夏少波, 王成, 习晓环, 等. ICESat-2机载试验点云滤波及植被高度反演[J]. 遥感学报, 2014, 18(6): 1199-1207. Xia Shaobo, Wang Cheng, Xi Xiaohuan, et al. Point cloud filtering and tree height estimation using airborne experiment data of ICESat-2 [J]. Journal of Remote Sensing, 2014, 18(6): 1199-1207. (in Chinese [11] 谢锋, 杨贵, 舒嵘, 等. 方向自适应的光子计数激光雷达滤波方法[J]. 红外与毫米波学报, 2017, 36(1): 107-113. doi: 10.11972/j.issn.1001-9014.2017.01.019 Xie Feng, Yang Gui, Shu Rong, et al. An adaptive directional filter for photon counting lidar point cloud data [J]. Journal of Infrared and Millimeter Waves, 2017, 36(1): 107-113. (in Chinese doi: 10.11972/j.issn.1001-9014.2017.01.019 [12] 许艺腾, 李国元, 邱春霞, 等. 基于地形相关和最小二乘曲线拟合的单光子激光数据处理技术[J]. 红外与激光工程, 2019, 48(12): 1205004. Xu Yiteng, Li Guoyuan, Qiu Chunxia, et al. Single photon laser data processing technology based on terrain correlation and least square curve fitting [J]. Infrared and Laser Engineering, 2019, 48(12): 1205004. (in Chinese [13] Zhang Z, Xu N, Ma Y, et al. Land and snow-covered area classification method based on the background noise for satellite photon-counting laser altimeters[J]. Optics Express, 2020, 28: 16030-16044. [14] Liu M, Popescu S, Malambo L. Feasibility of burned area mapping based on ICESAT-2 photon counting data [J]. Remote Sensing, 2019, 12(1): 24. [15] Neuenschwander A, Pitts K, Jelley B, et al. Ice, Cloud, and Land Elevation Satellite 2 (ICESat-2) algorithm theoretical basis document (ATBD) for land - vegetation along-track products (ATL08)[R]. ICESat-2 Algorithm Theoretical Basis Document, 2020. [16] Neumann T, Brenner A, Hancock D, et al. Ice, Cloud, and Land Elevation Satellite-2 (ICESat-2) project algorithm theoretical basis document (ATBD) for global geolocated photons ATL03[R]. ICESat-2 Algorithm Theoretical Basis Document, 2019. [17] Friedl M A, Sulla-Menashe D, Tan B, et al. MODIS collection 5 global land cover: Algorithm refinements and characterization of new datasets[J]. Remote Sensing of Environment, 2010, 114: 168–182.