基于Mask-RCNN海上升压站数字式仪表读数的自动识别算法

汤鹏; 刘毅; 魏宏光; 董秀芬; 严国斌; 张迎宾; 袁亚君; 王增光; 范亚南; 马鹏阁

doi:10.3788/IRLA20211057

基于Mask-RCNN海上升压站数字式仪表读数的自动识别算法

doi: 10.3788/IRLA20211057

汤鹏^{1, 2,},
刘毅³,
魏宏光²,
董秀芬¹,
严国斌⁴,
张迎宾⁴,
袁亚君⁴,
王增光³,
范亚南³,
马鹏阁²

1.
中国长江三峡集团有限公司，北京 100038
2.
郑州航空工业管理学院智能工程学院，河南郑州 450015
3.
中国航空工业集团公司洛阳电光设备研究所，河南洛阳 471000
4.
三峡新能源海上风电运维江苏有限公司，江苏盐城 224008

基金项目: 中国长江三峡集团有限公司科研资助项目(202003036)

详细信息

作者简介:
汤鹏，男，工程师，博士，主要从事机器人导航算法开发、电驱动系统设计等方面的研究

中图分类号: TP391.41; TP242; P75

Automatic recognition algorithm of digital instrument reading in offshore booster station based on Mask-RCNN

1.
China Three Gorges Corporation, Beijing 100038, China
2.
School of Intelligent Engineering, Zhengzhou Institute of Aeronautics Industry Management, Zhengzhou 450015, China
3.
Luoyang Institute of Electro-Optical Equipment, Aviation Industry Corporation of China, Luoyang 471000, China
4.
Three Gorges New Energy Offshore Wind Power Operation and Maintenance Jiangsu Co., Ltd, Yancheng 224008, China

摘要: 海上升压站采用挂轨机器人开展巡检作业，利用机器视觉手段自动识别数字式仪表读数，替代人工记录。提出了一种基于 Mask-RCNN深度学习方法的数字仪表读数自动识别算法。将不同类型的数字仪表原始图像制作成数据集，利用深度学习算法进行训练，根据损失函数变化曲线对算法进行参数优化得到训练后的模型，再进行数字仪表图像的识别分析。采用灰度世界算法和霍夫变换等算法进行图像预处理，可有效改善数字识别的准确度。最后，实验对比了YOLOv3和Mask-RCNN深度学习算法的识别性能，结果表明前者具有较高的检测速度，后者具有更高的准确率。后者的识别率为99.52%，满足海上升压站远程监控对数字仪表读数正确率高的要求。
- 图像处理 /
- 数字式仪表识别 /
- Mask-RCNN /
- YOLOv3
Abstract: The offshore booster station adopts the rail hanging robot to carry out patrol inspection, and the machine vision method is used to automatically identify the digital instrument reading instead of manual recording. An automatic recognition algorithm of digital instrument reading based on Mask-RCNN deep learning method was presented. The original images of different types of digital instruments were made into data sets, trained by deep learning algorithm, the parameters of the algorithm were optimized according to the change curve of loss function, the trained model was obtained, and then the digital instrument images were recognized and analyzed. The gray world algorithm and Hough transform were used for image preprocessing, which can effectively improve the accuracy of digital recognition. Finally, the recognition performance of YOLOv3 and Mask-RCNN deep learning algorithm was compared in the experiment. The results show that the former has higher detection speed and the latter has higher accuracy. The recognition rate of the latter is 99.52%, it meets the requirement that remote monitoring of offshore booster station requires high accuracy of digital instrument reading.
- image processing /
- digital instrument recognition /
- Mask-RCNN /
- YOLOv3
图 1 GrayWorld算法亮度均衡前后图像

Figure 1. Images before and after brightness equalization with GrayWorld algorithm

下载: 全尺寸图片幻灯片

图 2 校正倾斜图像的实验效果

Figure 2. Corrected tilted-image experiment effect

下载: 全尺寸图片幻灯片

图 3 YOLOv3数字识别流程

Figure 3. YOLOv3 digital identification process

下载: 全尺寸图片幻灯片

图 4 Mask-RCNN结构

Figure 4. Mask-RCNN structure

下载: 全尺寸图片幻灯片

图 5 回归窗口

Figure 5. Return to the window

下载: 全尺寸图片幻灯片

图 6 Feature map图示

Figure 6. Feature map graphic

下载: 全尺寸图片幻灯片

图 7 部分数据集

Figure 7. Partial data set

下载: 全尺寸图片幻灯片

图 8 损失变化曲线

Figure 8. Loss function curve

下载: 全尺寸图片幻灯片

图 9 实验结果图

Figure 9. Experimental result diagram

下载: 全尺寸图片幻灯片

表 1 不同识别方法在数据集上的比较

Table 1. Comparison of different recognition methods on data sets

Model Test set
/frame Accuracy Time consuming/ms

YOLOv3 100 99.03% 20.2
Mask-RCNN 100 99.52% 212

下载: 导出CSV

[1]	Duan Huichuan, Zhang Haibo, Zhang Shuguang, et al. Research on instrument digital recognition based on fuzzy theory [J]. Instrument Technique and Sensor, 2004(4): 37-39. (in Chinese) doi: 10.3969/j.issn.1002-1841.2004.04.018
[2]	Guo Shuang. Research on automatic identification method of nixie tube digital instrument [J]. Communications Technology, 2004, 45(4): 37-39. (in Chinese)
[3]	Lu Weina, Liu Changrong, Zheng Yucai, et al. A digital instrument character recognition method based on template matching [J]. Modern Computer, 2008(3): 70-72, 86. (in Chinese) doi: 10.3969/j.issn.1007-1423-B.2008.03.024
[4]	Li Suping. Digital instrument recognition technology based on image processing [J]. Mechanicaland Electronical Engineer-ing, 2013, 19(6): 84-86, 90. (in Chinese) doi: 10.3969/j.issn.1007-080x.2013.06.017
[5]	Akula A, Singh A, Ghosh R, et al. Target recognition in infrared imagery using convolutional neural network[C]//Proceedings of International Conference on Computer Vision and Image Processing, 2017.
[6]	Girshick R, Donahue J, Darrell T, et al. Rich feature hierarchies for accurate object detection and semantic segmen-tation[C]//CVPR. IEEE, 2014.
[7]	Redmon J, Divvala S, Girshick R, et al. You only look once: Unified, real-time object detection[C]//Computer Vision & Pattern Recognition. IEEE, 2016.
[8]	Liu W, Anguelov D, Erhan D, et al. SSD: Single shot MultiBox detector[C]//European Conference on Computer Vision. Springer International Publishing, 2016.
[9]	Lin T Y, Dollar P, Girshick R, et al. Feature pyramid networks for object detection[C]// 2017 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). IEEE Computer Society, 2017.
[10]	Zhuo Lei, Zhou Lv, Yang Lihong. Numeral recognition of calculator based on threading method [J]. Software Engineering, 2018, 21(12): 1-3. (in Chinese)
[11]	Lin Jianping, Liao Yipeng. Automatic recognition of digital instrument reading based on OpenCV and LSSVM [J]. Microcomputer & its Applications, 2017, 36(2): 37-40. (in Chinese)
[12]	Guo Lanying. Han Ruizhi, Cheng Xin. Digital instrument recognition method based on deformable convolutional neural network [J]. Computer Science, 2020, 47(10): 187-193. (in Chinese) doi: 10.11896/jsjkx.191000035
[13]	Liu Jing. Research on automatic character recognition of digital instrument based on image processing [J]. Information Technology, 2020, 44(4): 84-87, 91. (in Chinese)
[14]	Redmon J, Farhadi A. YOLOv3: An Incremental improvement [J]. arXiv e-prints, 2018: 1804.02767.
[15]	Gong An, Zhang Yang, Tang Yonghong. Identification method of electric energy representation based on yolov3 network [J]. Computer Systems & Applications, 2020, 29(1): 196-202. (in Chinese)
[16]	何配林. 基于深度学习的工业仪表识别读数算法研究及应用[D]. 电子科技大学, 2020. He Peilin. Research and application of reading recognition algorithm for industrial instruments based on deep learning[D]. Chengdu: University of Electronic Science and Technology of China, 2020. (in Chinese)
[17]	Wang Sen, Yang Kejian. Research and implementation of image scaling algorithm based on bilinear interpolation [J]. Techniques of Automation and Applications, 2008(7): 44-45, 35. (in Chinese) doi: 10.3969/j.issn.1003-7241.2008.07.014

[1]	李鹏越, 续欣莹, 唐延东, 张朝霞, 韩晓霞, 岳海峰. 基于并行多轴自注意力的图像去高光算法 . 红外与激光工程, 2024, 53(3): 20230538-1-20230538-11. doi: 10.3788/IRLA20230538
[2]	赵晓枫, 徐叶斌, 吴飞, 牛家辉, 蔡伟, 张志利. 基于并行注意力机制的地面红外目标检测方法（特邀） . 红外与激光工程, 2022, 51(4): 20210290-1-20210290-8. doi: 10.3788/IRLA20210290
[3]	黄宜帆, 贺岩, 胡善江, 侯春鹤, 朱小磊, 李凯鹏, 刘芳华, 陈勇强, 郭守川. 海洋激光雷达图像处理提取海水深度的方法 . 红外与激光工程, 2021, 50(6): 20211034-1-20211034-8. doi: 10.3788/IRLA20211034
[4]	陈明, 赵连飞, 苑立民, 徐峰, 韩默. 基于特征选择YOLOv3网络的红外图像绝缘子检测方法 . 红外与激光工程, 2020, 49(S2): 20200401-20200401. doi: 10.3788/IRLA20200401
[5]	付伟伟, 黄坤. 基于微纳器件的全光图像处理技术及应用 . 红外与激光工程, 2020, 49(9): 20201040-1-20201040-14. doi: 10.3788/IRLA20201040
[6]	田永胜, 侯金, 龙银福, 唐翠姣, 黄玉春, 杨春勇, 陈少平. 光纤倾斜耦合角度的快速精密图像测量 . 红外与激光工程, 2019, 48(10): 1013001-1013001(8). doi: 10.3788/IRLA201948.1013001
[7]	孔明, 杨天琪, 单良, 郭天太, 王道档, 徐良. 图像能量与对比度的霾检测算法 . 红外与激光工程, 2018, 47(8): 826001-0826001(6). doi: 10.3788/IRLA201847.0826001
[8]	赵永强, 李宁, 张鹏, 姚嘉昕, 潘泉. 红外偏振感知与智能处理 . 红外与激光工程, 2018, 47(11): 1102001-1102001(7). doi: 10.3788/IRLA201847.1102001
[9]	秦齐, 刘艳, 刘欢欢, 时川, 谭中伟. 图像处理在光纤光斑微位移传感中的应用 . 红外与激光工程, 2018, 47(10): 1022004-1022004(7). doi: 10.3788/IRLA201847.1022004
[10]	郭伟, 董丽虹, 王海斗, 马润波, 向明, 徐滨士. 喷涂层下基体中裂纹缺陷的超声红外识别方法 . 红外与激光工程, 2018, 47(S1): 36-43. doi: 10.3788/IRLA201847.S104001
[11]	骆媛, 张科, 纪明. 增强无人机态势感知的彩色图像融合方法 . 红外与激光工程, 2016, 45(S1): 200-206. doi: 10.3788/IRLA201645.S126002
[12]	张智, 林栩凌, 何红艳. 一种基于量子力学的遥感图像滤波方法研究 . 红外与激光工程, 2016, 45(S2): 140-144. doi: 10.3788/IRLA201645.S226001
[13]	莫春红, 刘波, 丁璐, 陈二瑞, 郭高. 一种梯度阈值自动调焦算法 . 红外与激光工程, 2014, 43(1): 323-327.
[14]	马媛花, 胡炳樑, 李然, 孙朗, 孙念, 王峥杰. 采用Gyrator变换的泰伯效应及图像去噪 . 红外与激光工程, 2014, 43(2): 665-670.
[15]	任广辉, 王刚毅, 金炎胜. 利用FPGA的高性能向导滤波器设计 . 红外与激光工程, 2013, 42(2): 537-542.
[16]	朱维文, 赵跃进, 朱慧时, 李冰, 孔令琴, 董立泉. 改进的均值滤波算法在太赫兹成像中的应用 . 红外与激光工程, 2013, 42(5): 1241-1246.
[17]	宋春华, 高仕博, 程咏梅. 自主空中加油视觉导航系统中的锥套检测算法 . 红外与激光工程, 2013, 42(4): 1089-1094.
[18]	张法全, 王国富, 曾庆宁, 叶金才. 利用重心原理的图像目标最小外接矩形快速算法 . 红外与激光工程, 2013, 42(5): 1382-1387.
[19]	李运达, 李琦, 刘正君, 王骐. 太赫兹计算机辅助层析图像重构算法仿真研究 . 红外与激光工程, 2013, 42(5): 1228-1235.
[20]	董建婷, 杨小乐, 董杰. 面阵CMOS图像传感器性能测试及图像处理 . 红外与激光工程, 2013, 42(12): 3396-3401.

点击查看大图

图(9) / 表(1)

计量

文章访问数: 597
HTML全文浏览量: 209
PDF下载量: 61
被引次数: 0

全文HTML

0. 引　言

海上升压站由于其地理位置的特殊性，使其设备维护、常规检查等任务难度加大且耗时耗力。由于海上升压站结构固定，空间紧凑，较适合选用挂轨机器人进行巡检作业。挂轨机器人搭载具有上下升降功能的全方位云台，安装可见光相机实现对室内各设备的近距离全方位巡检。升压站中使用的工业仪表大部分为数字式仪表。数字式仪表具有读数准确方便、测量速度快、能提供数字信号输出、方便进行目视观察和数字记录等优点，在升压站的机房中也被大量应用。然而，海上升压站距离海岸远，工作环境不适合人工采集，亟需开发自动读数识别算法。

海上升压站的数字式仪表数字识别是自动巡检中的重要任务。数字式仪表识别的方法经过多年的发展，在这一领域也取得了一些进展。国内较早开始数字仪表识别的是段会川等^[1]，提出了一种基于模糊理论的仪表数字识别方法，构建了一种基于模糊算法的数字识别器，能够快速进行数字的识别，但对采集图片的质量要求较大，对于倾斜图像不具备较好的分割效果，进而可能会造成数字的残缺，影响识别效果。郭爽^[2]、卢卫娜等^[3]都是用模板匹配的方法进行数字识别，针对参考文献[2]中传统的模板匹配方法对因干扰稍有变形、位移、旋转的图像难以判别的问题，参考文献[3]中提出了一种改进的标准模板匹配方法，对每类数字的各种干扰进行细分，制作多个模板进行匹配，在一定程度上降低了因干扰而带来的识别误差，但制作的模板数量大大增加，使方法复杂度增加。李素萍^[4]提出了一种基于图像处理技术的数字仪表识别方法，利用模式识别的方法对数字进行识别，对于比较清晰、完整、竖直的数字具有很好的识别率。近年来，深度学习的神经网络发展迅速，在数字式仪表识别领域引入了卷积神经网络（Convolu-tional Neural Network，CNN）^[5]，它对于单个数字的识别效果较好，但对于干扰较多的数字式仪表的数字识别，准确率较低。目前应用比较多的目标检测算法包括RCNN（Regions with CNN features）^[6]系列、YOLO（You Only Look Once）^[7]系列、SSD（Single Shot Multibox Detector）^[8]等，它们在一些大目标、轻量化的应用场景中前景广阔，具有较高的精确度，但对于一些尺度较小的目标检测有所缺陷。

海上升压站的内部结构较适合使用挂轨机器人，机器人可对数字式仪表进行定位拍摄，在一定程度上减少外在环境的干扰，同时数字式仪表图像数字像素信息少，数字间的粘连大而造成分割较难。针对以上的问题，提出了基于Mask-RCNN网络的数字仪表识别方法，Mask-RCNN网络在Faster-RCNN的基础上增加了一个FCN语义分割网络分支，用于对目标进行像素级的语义分割。用ROI Align层替换ROI Pooling层，取消了量化操作，避免了量化引入的误差，提升了精度。同时使用基于残差网络ResNet101和特征金字塔网络（Feature Pyramid Network, FPN）^[9]共同组成的特征提取网络替代CNN特征提取网络，优化了目标检测中的多尺度问题，提高了小物体、像素信息少等目标的检测性能。

1. 数字仪表识别方法

1.1. 模板匹配法

基于模板匹配的数字识别方法^[3]首先是对采集的图像进行直方图增强、滤除噪声等预处理，然后构建改进的仪表数字模板，进行数字的识别。整个过程较为复杂，需要构建多个模板，同时若采集到的数字出现变形、位移、旋转等情况，会造成数字难以被识别，可靠性较低。

1.2. 穿线法

由于仪表数字大多是由七段数码管组合而成的，只有横竖的布置方式，可以用基于穿线法进行仪表数字的特征识别^[10]。该方法通过图像预处理、数字的定位进行分割，再将分割的单个数字使用穿线识别法进行数字的识别。该方法较其他方法原理简单，但对数字分割要求过高，数字在比较规整的条件下才会有较好的识别效果，且不能识别小数点。

1.3. 基于机器学习的数字识别

机器学习是模式识别的重要方法。将采集到的图片经过倾斜校正、形态学处理、基于连通域的方法来进行数字的定位与分割，最后将分割后的单个字符使用LSSVM算法识别仪表数字^[11]。机器学习的方法相比前两种方法有着更好的适应性和识别率。

1.4. 基于深度学习的数字识别

近年来，计算机视觉发展迅速，基于深度学习的目标检测方法逐渐成为主流方法。目前常用的目标检测深度学习算法有YOLO系列和R-CNN系列算法。YOLO算法在大目标、轻量化的场景中具有较好的检测效果，同时具有较快的检测速度，但对小目标的检测效果不是很好。R-CNN网络在检测的精度方面具有较好的效果，Mask-RCNN网络采用特征金字塔网络进行多维度特征提取，同时增加了一个FCN语义分割网络，在完成目标定位和分类的同时，实现对目标轮廓像素级的语义分割，大大提高了目标检测的精度，但同时减弱了目标检测的速度。文中主要针对深度学习方法用于数字识别开展应用研究。

4. 结　论

针对海上升压站距离海岸远，工作环境复杂，人工采集数字式仪表数值较困难的问题，文中分别使用YOLOv3算法和Mask-RCNN算法对数字式仪表进行数字识别。先将采集到的图片进行预处理，对图像进行校正，然后输入到检测网络中进行特征提取、分类和回归，同时将置信度标注要图像上。经过对比分析发现，YOLOv3算法进行数字识别具有耗时短的优势，可用于需要实时检测的工程中，而Mask-RCNN算法进行数字识别具有精度高的优势，但检测速度较慢，可用于对精度有较高要求的工程中。

参考文献 (17)

姓名
邮箱
手机号码
标题
留言内容
验证码

留言板

基于Mask-RCNN海上升压站数字式仪表读数的自动识别算法

doi: 10.3788/IRLA20211057

作者简介:
汤鹏，男，工程师，博士，主要从事机器人导航算法开发、电驱动系统设计等方面的研究

Automatic recognition algorithm of digital instrument reading in offshore booster station based on Mask-RCNN

计量

基于Mask-RCNN海上升压站数字式仪表读数的自动识别算法

doi: 10.3788/IRLA20211057

1. 中国长江三峡集团有限公司，北京 100038

2. 郑州航空工业管理学院智能工程学院，河南郑州 450015

3. 中国航空工业集团公司洛阳电光设备研究所，河南洛阳 471000

4. 三峡新能源海上风电运维江苏有限公司，江苏盐城 224008

作者简介:
汤鹏，男，工程师，博士，主要从事机器人导航算法开发、电驱动系统设计等方面的研究

English Abstract

Automatic recognition algorithm of digital instrument reading in offshore booster station based on Mask-RCNN

全文HTML

1.1. 模板匹配法

1.2. 穿线法

1.3. 基于机器学习的数字识别

1.4. 基于深度学习的数字识别

2.1. 图像预处理

2.1.1. 屏幕区域矫正

2.1.2. 图像倾斜校正

2.2. 基于YOLOv3网络的数字仪表识别算法

2.3. 基于Mask-RCNN网络的数字仪表识别算法

3.1. 实验环境

3.2. 实验数据

3.3. 实验结果分析

目录

Model	Test set /frame	Accuracy	Time consuming/ms
YOLOv3	100	99.03%	20.2
Mask-RCNN	100	99.52%	212

留言板

基于Mask-RCNN海上升压站数字式仪表读数的自动识别算法

doi: 10.3788/IRLA20211057

作者简介: 汤鹏，男，工程师，博士，主要从事机器人导航算法开发、电驱动系统设计等方面的研究

Automatic recognition algorithm of digital instrument reading in offshore booster station based on Mask-RCNN

计量

出版历程

基于Mask-RCNN海上升压站数字式仪表读数的自动识别算法

doi: 10.3788/IRLA20211057

1. 中国长江三峡集团有限公司，北京 100038 2. 郑州航空工业管理学院 智能工程学院，河南 郑州 450015 3. 中国航空工业集团公司洛阳电光设备研究所，河南 洛阳 471000 4. 三峡新能源海上风电运维江苏有限公司，江苏 盐城 224008

作者简介: 汤鹏，男，工程师，博士，主要从事机器人导航算法开发、电驱动系统设计等方面的研究

English Abstract

Automatic recognition algorithm of digital instrument reading in offshore booster station based on Mask-RCNN

全文HTML

1.1. 模板匹配法

1.2. 穿线法

1.3. 基于机器学习的数字识别

1.4. 基于深度学习的数字识别

2.1. 图像预处理

2.1.1. 屏幕区域矫正

2.1.2. 图像倾斜校正

2.2. 基于YOLOv3网络的数字仪表识别算法

2.3. 基于Mask-RCNN网络的数字仪表识别算法

3.1. 实验环境

3.2. 实验数据

3.3. 实验结果分析

目录

作者简介:
汤鹏，男，工程师，博士，主要从事机器人导航算法开发、电驱动系统设计等方面的研究

1. 中国长江三峡集团有限公司，北京 100038

2. 郑州航空工业管理学院智能工程学院，河南郑州 450015

3. 中国航空工业集团公司洛阳电光设备研究所，河南洛阳 471000

4. 三峡新能源海上风电运维江苏有限公司，江苏盐城 224008

作者简介:
汤鹏，男，工程师，博士，主要从事机器人导航算法开发、电驱动系统设计等方面的研究