基于视差和条纹调制度分析的多物体场景分割

李小晗; 陈璐; 周翔

doi:10.3788/IRLA20200085

基于视差和条纹调制度分析的多物体场景分割

doi: 10.3788/IRLA20200085

西安交通大学机械工程学院，陕西西安 710049

基金项目: 国家科技重大专项（2017ZX04002001）

详细信息

作者简介:
李小晗（1993-），女，博士生，主要从事深度场景理解和机器人三维视觉控制等方面的研究。Email：lixiaohan1993@stu.xjtu.edu.cn

周翔（1978-），男，副教授，博士生导师，博士，主要从事光学三维成像技术，机器人三维视觉导航等方面的研究。Email：zhouxiang@xjtu.edu.cn（通讯联系人）

中图分类号: TP931

Segmentation in multi-objects scene based on disparity and fringe modulation analysis

School of Mechanical Engineering, Xi'an Jiaotong University, Xi'an 710049, China

摘要:
噪声是影响图像分割的重要因素，文中提出了一种能够在含噪声的真实场景中准确提取出多个物体区域的分割方案。利用基于正弦条纹投影的双目结构光系统，得到包含目标物体的相位图和视差图。将视差图映射到U-视差图中，利用物体和噪声区域在该视差空间的不同形态特征，采用闭合区域检测算法初步得到各个物体的分割区域，并结合条纹调制度阈值分析法进一步去除阴影区域的噪声，最终得到精确的分割结果。客观评价的数据分析表明，文中提出的分割算法，不仅对噪声的鲁棒性较好，还可以有效地将物体与水平支撑面分割开，在不同场景下具有计算复杂度低，抗干扰能力强的优势，分割准确率均在90%以上，最高可达到99.2%，平均运行时间为27 ms。
- 正弦条纹投影轮廓术 /
- U-视差图分析 /
- 条纹调制度分析 /
- 物体分割
Abstract:
Noise is an important problem that affects image segmentation. A novel scheme was proposed that could accurately extract multiple objects in a noisy real-world scene. The phase map and disparity map were obtained by using the binocular structured light system based on sinusoidal fringe projection. Firstly, a disparity map was transformed into the corresponding U-disparity map. Then, according to the different projection characteristics of object and noise regions in the disparity map, the preliminary segmentation regions were obtained by using the closed region detection algorithm. In addition, the fringe modulation analysis method was used to remove the noise in the shadow region, and the accurate segmentation results were finally obtained. Experimental results and objective evaluation data indicate that the proposed segmentation algorithm in this paper is not only robust to noise but also can effectively separate the object from the horizontal support surface. It has the advantages of low computational complexity and strong anti-interference ability in different scenarios. The average segmentation accuracy is above 90%, and the best accuracy can achieve 99.2%. The average running time is almost 27 ms.
- sinusoidal fringe projection profilometry /
- U-disparity analysis /
- fringe modulation analysis /
- object segmentation

图 1 视差图到U-视差图的转换示意图

Figure 1. Transformations from the disparity map to U-disparity map

下载: 全尺寸图片幻灯片

图 2 不同平面与世界坐标系的示意图

Figure 2. Several planes in the world coordinate system

下载: 全尺寸图片幻灯片

图 3 算法流程示意图

Figure 3. Flowchart of the proposed algorithm

下载: 全尺寸图片幻灯片

图 4 (a) 石膏模型的灰度图像；(b) 伪彩处理后的视差图；(c) 物体在U-视差图上的投影形态；(d) 图(c)的阈值化图像

Figure 4. (a) Gray image of the plaster model; (b) pseudo color disparity map; (c) projection result on the U-disparity map; (d) binary image of (c)

下载: 全尺寸图片幻灯片

图 5 (a)二值化后的U-视差图；(b)红色斜线段标注的视差范围跨度较大的噪声

Figure 5. (a)Binary U-disparity map; (b)noise with large disparity range labeled with red oblique lines

下载: 全尺寸图片幻灯片

图 6 第一组三维场景分割结果。(a)灰度图；(b)三维重建结果; (c)分割结果在视差图上的标注框；(d),(e)初步分割结果；(f)最终分割结果

Figure 6. Scene segmentation results of group 1. (a) Gray image; (b) 3D reconstruction result; (c) labeled regions of segmentation results in the disparity map; (d),(e) preliminary segmentation result; (f) final segmentation result

下载: 全尺寸图片幻灯片

图 7 第二组三维场景分割结果。(a)灰度图；(b)三维重建结果; (c)分割结果在视差图上的标注框；(d)~(f)背景板和两个模型的初步分割结果；(g),(h)两个模型的最终分割结果

Figure 7. Scene segmentation results of group 2. (a) Gray image; (b) 3D reconstruction result;(c) labeled regions of segmentation results in the disparity map; (d)-(f) preliminary segmentation results of the background board and the two models; (g),(h) final segmentation results of the two models

下载: 全尺寸图片幻灯片

图 8 第三组三维场景分割结果。(a)灰度图；(b)分割结果在视差图上的标注框；(c)分割结果(e)在对应的相位图的结果；(d)图(c)对应在原始视差图的结果；(e)~(g)初步分割结果；(h)~ (j)最终分割结果

Figure 8. Scene segmentation results of group 3. (a) Gray image; (b) labeled regions of segmentation results in the disparity map; (c) segmentation region of (e) in the corresponding phase image; (d) segmentation region in the corresponding disparity image of (c); (e)-(g) preliminary segmentation result; (h)-(j) final segmentation result

下载: 全尺寸图片幻灯片

图 9 提出的算法对Realsense D415深度相机获取的视差图序列（第2帧）的处理结果。(a) RGB图像；(b) 视差图；(c) 分割结果在伪彩视差图上的标注框

Figure 9. Disparity sequence obtained by Realsense D415 depth camera by the proposed method. (a) RGB image; (b) disparity map; (c) labeled regions of segmentation results in the rendered disparity map

下载: 全尺寸图片幻灯片

表 1 图6~8的评价指标数据对比

Table 1. Comparison of evaluation data of Fig.6-8

Evaluation index	Group 1		Group 2		Group 3
Evaluation index	①	②	①	②	①	②
Precision	91.46%	99.92%	98.37%	99.24%	99.12%	99.17%
Recall	98.65%	98.28%	93.66%	94.55%	98.18%	98.88%
F-score	94.92%	99.09%	96.37%	96.42%	97.95%	98.16%
Jaccard	90.33%	98.20%	92.99%	93.09%	95.99%	95.11%
Conformity	89.29%	98.16%	92.46%	92.58%	95.82%	95.32%

下载: 导出CSV

[1]	Yin W, Feng S, Tao T, et al. High-speed 3D shape measurement using the optimized composite fringe patterns and stereo-assisted structured light system [J]. Optics Express, 2019, 27(3): 2411−2431. doi: 10.1364/OE.27.002411
[2]	Deng R J, Li J, Feng H, et al. Flexible depth segmentation method using phase-shifted wrapped phase sequences [J]. Optics and Lasers in Engineering, 2019, 122: 284−293. doi: 10.1016/j.optlaseng.2019.06.016
[3]	Silberman N, Fergus R. Indoor scene segmentation using a structured light sensor[C]//2011 IEEE international conference on computer vision workshops (ICCV workshops). IEEE, 2011: 601-608.
[4]	Liu Ji, Zeng Wenliang, Liang Xiaosheng. Depth assisted active contour segmentation algorithm [J]. Application Research of Computers, 2020, 37(1): 287−290.
[5]	Lee D S. Effective Gaussian mixture learning for video background subtraction [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2005, 27(5): 827−832. doi: 10.1109/TPAMI.2005.102
[6]	Zhang Y, Qiu Z, Yao T, et al. Fully convolutional adaptation networks for semantic segmentation[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. IEEE, 2018: 6810-6818.
[7]	Danielczuk M, Matl M, Gupta S, et al. Segmenting unknown 3d objects from real depth images using mask r-cnn trained on synthetic data[C]//2019 International Conference on Robotics and Automation (ICRA). IEEE, 2019: 7283-7290.
[8]	Hoiem D, Efros A A, Hebert M. Recovering occlusion boundaries from an image [J]. International Journal of Computer Vision, 2011, 91(3): 328−346. doi: 10.1007/s11263-010-0400-4
[9]	Leng J, Liu Y, Du D, et al. Robust obstacle detection and recognition for driver assistance systems [J]. IEEE Transactions on Intelligent Transportation Systems, 2019, 21(4): 1560−1571.
[10]	Hu Z, Uchimura K. UV-disparity: an efficient algorithm for stereovision based scene analysis[C]//IEEE Proceedings. Intelligent Vehicles Symposium. IEEE, 2005: 48-54.
[11]	Li Xiaohan. Research on real-time detection technology of passable area based on binocular stereovision[D]. Beijing: University of Chinese Academy of Sciences, 2018.
[12]	Zhao M, Huang L, Zhang Q, et al. Quality-guided phase unwrapping technique: comparison of quality maps and guiding strategies [J]. Applied Optics, 2011, 50(33): 6214−6224. doi: 10.1364/AO.50.006214

[1]	何信欣, 刘斌, 王春柳, 吴冠豪. 用于高反表面测量的分块平滑自适应条纹投影方法 . 红外与激光工程, 2023, 52(5): 20220825-1-20220825-14. doi: 10.3788/IRLA20220825
[2]	张禹茁, 贾璐璐, 高楠, 孟召宗, 张宗华. 基于相位标靶的相位测量轮廓术投影色差建模与校正 . 红外与激光工程, 2023, 52(8): 20230385-1-20230385-11. doi: 10.3788/IRLA20230385
[3]	张庆辉, 李浩, 吕磊, 卢盛林, 潘威. 基于相移轮廓术的双采样运动物体三维重构 . 红外与激光工程, 2023, 52(12): 20220891-1-20220891-6. doi: 10.3788/IRLA20220891
[4]	王张颖, 张宁宁, 高楠, 李奎, 孟召宗, 张宗华. 基于单色条纹投影的高动态范围物体表面形貌三维测量 . 红外与激光工程, 2023, 52(8): 20230327-1-20230327-9. doi: 10.3788/IRLA20230327
[5]	林森, 赵振禹, 任晓奎, 陶志勇. 基于语义信息补偿全局特征的物体点云分类分割 . 红外与激光工程, 2022, 51(8): 20210702-1-20210702-12. doi: 10.3788/IRLA20210702
[6]	吴荣, 赵世丽, 赵洋, 谢锋云. 条纹投影用于不同景深物体的三维测量 . 红外与激光工程, 2022, 51(11): 20220088-1-20220088-10. doi: 10.3788/IRLA20220088
[7]	冯世杰, 左超, 尹维, 陈钱. 深度学习技术在条纹投影三维成像中的应用 . 红外与激光工程, 2020, 49(3): 0303018-0303018-17. doi: 10.3788/IRLA202049.0303018
[8]	张钊, 韩博文, 于浩天, 张毅, 郑东亮, 韩静. 多阶段深度学习单帧条纹投影三维测量方法 . 红外与激光工程, 2020, 49(6): 20200023-1-20200023-8. doi: 10.3788/IRLA20200023
[9]	王玉伟, 陈向成, 王亚军. 改进的双频几何约束条纹投影三维测量方法 . 红外与激光工程, 2020, 49(6): 20200049-1-20200049-7. doi: 10.3788/IRLA20200049
[10]	李勇, 张广汇, 马利红, 应晓霖, 姚建云. 条纹投影动态三维表面成像技术综述 . 红外与激光工程, 2020, 49(3): 0303005-0303005-13. doi: 10.3788/IRLA202049.0303005
[11]	钟锦鑫, 尹维, 冯世杰, 陈钱, 左超. 基于深度学习的散斑投影轮廓术 . 红外与激光工程, 2020, 49(6): 20200011-1-20200011-11. doi: 10.3788/IRLA20200011
[12]	朱琳琳, 韩璐, 杜泓, 范慧杰. 基于U-Net网络的多主动轮廓细胞分割方法研究 . 红外与激光工程, 2020, 49(S1): 20200121-20200121. doi: 10.3788/IRLA20200121
[13]	殷永凯, 张宗华, 刘晓利, 彭翔. 条纹投影轮廓术系统模型与标定综述 . 红外与激光工程, 2020, 49(3): 0303008-0303008-18. doi: 10.3788/IRLA202049.0303008
[14]	刘东, 严天亮, 王道档, 杨甬英, 黄玮. 条纹投影与相位偏折测量技术研究进展 . 红外与激光工程, 2017, 46(9): 917001-0917001(10). doi: 10.3788/IRLA201746.0917001
[15]	常凌颖, 赵俊香, 郑爱国, 杜丹. 基于孔径分割的全斯托克斯测量仪的误差分析 . 红外与激光工程, 2017, 46(10): 1017004-1017004(8). doi: 10.3788/IRLA201772.1017004
[16]	李彪, 吴海涛, 张建成, 伏燕军. 正弦脉冲宽度调制条纹结合相位编码条纹的三维测量方法 . 红外与激光工程, 2016, 45(6): 617006-0617006(6). doi: 10.3788/IRLA201645.0617006
[17]	田爱玲, 刘婷, 刘剑, 刘丙才, 王红军. 单幅干涉条纹图的高精度波面重建技术 . 红外与激光工程, 2015, 44(4): 1203-1207.
[18]	左洋, 龙科慧, 刘兵, 周磊, 刘金国, 乔克. 高精度光电编码器莫尔条纹信号质量分析方法 . 红外与激光工程, 2015, 44(1): 260-265.
[19]	冯帆, 段发阶, 伯恩, 吕昌荣, 傅骁, 黄婷婷. 基于条纹投射和正弦相位调制的表面形貌测量系统 . 红外与激光工程, 2015, 44(12): 3762-3768.
[20]	邹前进, 陈前荣, 黄振宇, 李华, 黄成功, 亓凤杰, 王彦斌. 激光干扰CCD规律圆形条纹作用机理分析 . 红外与激光工程, 2013, 42(8): 2017-2021.

点击查看大图

计量

文章访问数: 598
HTML全文浏览量: 193
被引次数: 0

全文HTML

0. 引　言

基于条纹投影轮廓术的三维形状测量和三维成像技术的快速发展^[1]，进一步地推动了三维信息（例如视差，深度和点云等）在物体识别，三维场景理解和机器人避障等研究领域的应用和发展。特别是三维场景分割技术，其作为计算机视觉领域的一个主要研究方向，得到了广泛关注。

图像分割是指将图像分成若干具有相似性质的区域的过程，是图像语义理解的重要步骤。传统的三维场景分割方法借鉴RGB图像分割方法，以相邻像素之间在某些方面的一致性关系，如颜色、纹理等特征作为分割依据，提出了基于边缘信息的方法^[2]、基于区域信息的方法^[3,4]和基于阈值的方法^[5]。这类方法在噪声较少的场景中具有良好的分割效果，然而当目标物体周围的噪声区域较多或者具有支撑面时，则会干扰算法对分割界限的判断和特征提取，出现过分割或欠分割的问题。基于深度学习的三维场景分割方法^[6,7]将分割问题转化为像素级的分类问题。此类方法可以准确地对存在遮挡，结构复杂的场景进行有效分割。但是，具有计算量大和泛化能力欠缺的问题。

为了更好地解决分割问题，Derek Hoiem等人^[8]认为单个物体的一致性特征应该由物理上的连通性来定义，在三维场景中表现为某个区域的视差或者深度连续性。其中，U-V视差图的提出，使研究者们开始关注视差连续性在物体检测中的重要性。具体来说，通过统计视差图中每一行或每一列的各个视差值所包含的像素点个数，可以得到U-视差图和V-视差图。在V-视差图中，三维空间中的水平面可被投影成斜率不为0的倾斜直线。因此在自动驾驶或机器人导航领域，常通过拟合这条直线间接得到场景中的可通行区域^[9]，如路面等。在U-视差图中，非0区域包含了垂直于道路的障碍物区域，例如灌木丛，花坛，行人和车辆等物体^[10,11]，经常用于辅助道路检测。值得注意是，水平面在该图像空间的投影像素值比较小，可通过图像处理的方法进行去除。不难看出，利用U-视差图的投影特性，即便物体与水平面具有支撑关系，也可以将其正确分离出来。

文中的研究对象是基于正弦条纹投影的结构光设备所得到的相位图和视差图。目前，针对具有相位信息的三维场景分割的研究还较少。Ji Deng等人^[2]首次提出了一种利用包裹相位的分割算法，其认为物体边缘的深度点具有相移不变性，通过检测不同频率的相位图的跳变点（abrupt-change points）得到物体之间的边界线。这种方法可以有效分割不同深度的物体，然而噪声区域会干扰算法对边界点的提取。再者，视差图或者深度图是由一系列计算得到的，由于误差的传递，反映在深度图上的噪声区域的构成是复杂的。因此除了依赖相位信息，有必要直接对结果图的噪声形态进行分析和研究。

针对现有三维场景分割算法的局限性，文中提出了一种适用于含噪声的多物体场景的分割算法。其贡献点主要分为两点：充分利用物体的视差连续的特点，对其在U-视差图的投影特性进行深入研究和分析，初步完成了对目标物体的位置定位和区域分割；还引入了相位信息，通过计算分割区域对应的相位对比度，利用噪声和物体的不同值域，进一步对分结果进行噪声去除。

4. 结　论

近年来，面向运动物体的实时三维成像技术的研究和应用成果显著。值得注意的是，在结构光三维重建中，相移轮廓术也在向高精度实时重建的方向发展。这类方法同时结合了时域信息和频域信息，将会开启目标检测和跟踪，三维场景理解，人机交互等领域的新的方向。图像分割作为计算机视觉任务的重要步骤，也被广泛关注。在这种趋势下，文中基于物体具有视差连续性的特性，提出了一种针对多物体场景的分割算法。通过构建U-视差图，降低了对不同物体的提取难度，简化了计算复杂度；并利用条纹调制度对阴影的辨别能力，进一步去除噪声区域，提高了分割精度。不同环境下的实验结果充分验证了提出算法的可行性和有效性，可以快速高效分离出场景中的有效区域，并对噪声、遮挡等问题具有一定的鲁棒性。

文中首次提出了基于U-视差图的图像分割方法，在几个方面有待进一步的研究和改进：(1)利用视差信息，分割出的物体存在部分边缘缺失的问题。需要进一步研究边缘等高频区域在U-视差图的投影特点。(2)条纹调制度可以解决的噪声问题具有局限性，阈值处理方法单一，其对噪声去除的范围是不可控的。因此如何更充分地利用相位信息提高分割精度，将是未来需要解决的问题。

姓名
邮箱
手机号码
标题
留言内容
验证码

留言板

基于视差和条纹调制度分析的多物体场景分割

doi: 10.3788/IRLA20200085

Segmentation in multi-objects scene based on disparity and fringe modulation analysis

计量

基于视差和条纹调制度分析的多物体场景分割

doi: 10.3788/IRLA20200085

西安交通大学机械工程学院，陕西西安 710049

English Abstract

Segmentation in multi-objects scene based on disparity and fringe modulation analysis

School of Mechanical Engineering, Xi'an Jiaotong University, Xi'an 710049, China

全文HTML

1.1. 正弦条纹投影三维测量原理

1.2. U-视差图的计算和投影特性

2.1. 基于U-视差图分析的初步分割

2.2. 基于条纹调制度计算的噪声去除

目录

留言板

基于视差和条纹调制度分析的多物体场景分割

doi: 10.3788/IRLA20200085

Segmentation in multi-objects scene based on disparity and fringe modulation analysis

计量

出版历程

基于视差和条纹调制度分析的多物体场景分割

doi: 10.3788/IRLA20200085

西安交通大学 机械工程学院，陕西 西安 710049

English Abstract

Segmentation in multi-objects scene based on disparity and fringe modulation analysis

School of Mechanical Engineering, Xi'an Jiaotong University, Xi'an 710049, China

全文HTML

1.1. 正弦条纹投影三维测量原理

1.2. U-视差图的计算和投影特性

2.1. 基于U-视差图分析的初步分割

2.2. 基于条纹调制度计算的噪声去除

目录

西安交通大学机械工程学院，陕西西安 710049