微透镜阵列光学实现卷积运算

费宇航; 隋修宝; 王庆宝; 陈钱; 顾国华

doi:10.3788/IRLA20210887

微透镜阵列光学实现卷积运算

doi: 10.3788/IRLA20210887

南京理工大学电子工程与光电技术学院，江苏南京 210094

基金项目: 国家自然科学基金（11773018）；江苏省研究生科研与实践创新计划项目（SJCX21_0112）

详细信息

作者简介:
费宇航，女，硕士生，主要从事光计算和光子集成芯片方面的研究

隋修宝，男，教授，博士，主要从事红外探测理论与仪器研制以及光计算等方面的研究

中图分类号: O439

Optically realize convolution operation of microlens array

School of Electronic and Optical Engineering, Nanjing University of Science and Technology, Nanjing 210094, China

摘要: 卷积作为一种简单的线性平移不变运算，被广泛应用于图像处理的各个领域，其衍生出的卷积神经网络更是在人工智能领域中大放异彩。为了应对后摩尔时代AI推理芯片算力受限的问题，光学神经网络应运而生。光学卷积神经网络作为其中一个重要的研究热点对光学神经网络的发展起到了重要的推动作用。设计了一种光学卷积系统，基于微透镜阵列与透镜组成的匀光光路对光场所携带的图像做二维卷积，该系统可以光学实现图像平滑和锐化。当使用空间光调制器来投影卷积核和输入图像时，系统可以实现各种步长的三种卷积形式，也可以通过多次投影/平铺实现多通道的三维卷积，进而为实现光学卷积神经网络用于复杂的图像处理任务奠定基础。
- 光学卷积 /
- 微透镜阵列 /
- 匀光系统 /
- 图像处理
Abstract: As a simple linear translation invariant operation, convolution has been widely used in various fields of image processing, and the convolutional neural network derived from it is brilliant in the field of artificial intelligence. In order to deal with the problem of limited computing power of AI reasoning chip in the post-Moore era, optical neural network came into being. As one of the important research hotspots, optical convolutional neural network plays an important role in promoting the development of optical neural network. An optical convolution system was designed, based on the uniform light path formed by micro lens array and lens, the image carried in the light place was convoluted in two-dimensions. The system can complete simple image smoothing and sharpening in the optical path. When the spatial light modulator is used to realize the convolution kernel and input surface, the system can realize three convolution forms of various step sizes, and can also realize multi-channel three-dimensional convolution through multiple projection or flattening, thus laying a foundation for the realization of optical convolution neural network for complex image processing tasks.
- optical convolution /
- microlens array /
- unifying system /
- image processing
图 1 光学卷积系统的结构示意图

Figure 1. Structure diagram of optical convolution system

下载: 全尺寸图片幻灯片

图 2 窗口划分示意图

Figure 2. Diagram of window division

下载: 全尺寸图片幻灯片

图 3 (a) P₂接收到的输入分布； (b) P₂处放置的卷积核的形状与数值

Figure 3. (a) The distribution of input signal feed to P₂; (b) The shape and value of kernel which set in P₂

下载: 全尺寸图片幻灯片

图 4 光线标记

Figure 4. Ray marking

下载: 全尺寸图片幻灯片

图 5 仿真光路

Figure 5. Simulate the optical path

下载: 全尺寸图片幻灯片

图 6 (a) 高斯算子；(b) Prewitt算子的变体；(c) Prewitt沿x方向的梯度；(d) 改进的算子沿x方向得到的图像梯度

Figure 6. (a) Gaussian operator; (b) Variant of Prewitt operator; (c) Prewitt's gradient along the x direction; (d) The image gradient obtained by the improved operator along the x direction

下载: 全尺寸图片幻灯片

图 7 光学卷积神经网络的示意图

Figure 7. Diagram of optical convolution neural network

下载: 全尺寸图片幻灯片

图 8 步长为1的valid卷积的预处理结果

Figure 8. Pre-processing result of valid convolution with stride 1

下载: 全尺寸图片幻灯片

[1]	Castleman K R, 朱志刚, 林学闵, 等. 数字图像处理[M]. 北京: 电子工业出版社, 1998: 123-145. Castleman K R, Zhu Z, Lin X, et al. Digital Image Processing[M]. Beijing: Publishing House of Electronics Industry, 1998: 123-145. (in Chinese)
[2]	Goodfellow I J, Bulatov Y, Ibarz J, et al. Multi-digit number recognition from street view imagery using deep convolutional neural networks [J]. arXiv preprint arXiv, 2013, 1312: 6082.
[3]	薛珊, 张振, 吕琼莹, 等. 基于卷积神经网络的反无人机系统图像识别方法[J]. 红外与激光工程, 2020, 49(7): 20200154. doi: 10.3788/IRLA20200154 Xue S, Zhang Z, Lv Q Y, et al. Image recognition method of anti UAV system based on convolutional neural network [J]. Infrared and Laser Engineering, 2020, 49(7): 20200154. (in Chinese) doi: 10.3788/IRLA20200154
[4]	Long J, Shelhamer E, Darrell T. Fully convolutional networks for semantic segmentation [J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2015, 39(4): 640-651.
[5]	王中宇, 倪显扬, 尚振东. 利用卷积神经网络的自动驾驶场景语义分割[J]. 光学精密工程, 2019, 27(11): 2429-2438. doi: 10.3788/OPE.20192711.2429 Wang Z Z, Ni X Y, Sheng Z D. Autonomous driving semantic segmentation with convolution neural networks [J]. Optics and Precision Engineering, 2019, 27(11): 2429-2438. (in Chinese) doi: 10.3788/OPE.20192711.2429
[6]	Chao D, Chen C L, He K, et al. Learning a deep convolutional network for image super-resolution[C]//ECCV, Springer International Publishing, 2014, 8692: 184-199.
[7]	郝建坤, 黄玮, 刘军, 等. 空间变化PSF非盲去卷积图像复原法综述[J]. 中国光学, 2016, 9(1): 41-50. doi: 10.3788/co.20160901.0041 Hao J K, Huang W, Liu J, et al. Review of non-blind deconvolution image restoration based on spatially-varying PSF [J]. Chinese Optics, 2016, 9(1): 41-50. (in Chinese) doi: 10.3788/co.20160901.0041
[8]	朱明, 杨航, 贺柏根, 等. 联合梯度预测与导引滤波的图像运动模糊复原[J]. 中国光学, 2013, 6(6): 850-855. Zhu M, Yang H, He B G, et al. Image motion blurring restoration of joint gradient prediction and guided filter [J]. Chinese Optics, 2013, 6(6): 850-855. (in Chinese)
[9]	张旭, 于明鑫, 祝连庆, 等. 基于全光衍射深度神经网络的矿物拉曼光谱识别方法[J]. 红外与激光工程, 2020, 49(10): 20200221. Zhang X, Yu M X, Zhu L Q, et al. Raman mineral recognition method based on all-optical diffraction deep neural network [J]. Infrared and Laser Engineering, 2020, 49(10): 20200221. (in Chinese)
[10]	郭玉彬, 邢培. 一种全光模糊智能信息处理系统设计[J]. 光学精密工程, 1998, 6(1): 23-30. doi: 10.3321/j.issn:1004-924X.1998.01.005 Guo Y B, Xing P. The design of an all optical signal processing system with fuzzy intelligence networks [J]. Optics and Precision Engineering, 1998, 6(1): 23-30. (in Chinese) doi: 10.3321/j.issn:1004-924X.1998.01.005
[11]	Xu S, Wang J, Wang R, et al. High-accuracy optical convolution unit architecture for convolutional neural networks by cascaded acousto-optical modulator arrays [J]. Optics Express, 2019, 27(14): 19778-19787. doi: 10.1364/OE.27.019778
[12]	Mario Miscuglio, Zibo Hu, Shurui Li, et al. Massively parallel amplitude-only Fourier neural network [J]. Optica, 2020, 7(12): 1812-1819. doi: 10.1364/OPTICA.408659
[13]	Wu Q, Fei Y, Liu J, et al. High speed and reconfigurable optronic neural network with digital nonlinear activation [J]. Optik, 2021, 247: 168043. doi: 10.1016/j.ijleo.2021.168043
[14]	Gu Z, Gao Y, Liu X. Optronic convolutional neural networks of multi-layers with different functions executed in optics for image classification [J]. Optics Express, 2021, 29(4): 5877-5889. doi: 10.1364/OE.415542
[15]	Sadeghzadeh H, Koohi S, Paranj A F. Free-space optical neural network based on optical nonlinearity and pooling operations [J]. IEEE Access, 2021, 9: 146533-146549. doi: 10.1109/ACCESS.2021.3123230

[1]	周围, 王明慧, 安广鑫, 郑泓飙, 李星宇, 孟庆宜. 基于微流控芯片的牛乳体细胞均匀分布与计数方法研究 . 红外与激光工程, 2023, 52(8): 20230265-1-20230265-13. doi: 10.3788/IRLA20230265
[2]	黄宜帆, 贺岩, 胡善江, 侯春鹤, 朱小磊, 李凯鹏, 刘芳华, 陈勇强, 郭守川. 海洋激光雷达图像处理提取海水深度的方法 . 红外与激光工程, 2021, 50(6): 20211034-1-20211034-8. doi: 10.3788/IRLA20211034
[3]	剪欣, 周泉, 杨天龙. 封闭料场斗轮机智能控制系统关键技术的研究 . 红外与激光工程, 2021, 50(S2): 20200099-1-20200099-8. doi: 10.3788/IRLA20200099
[4]	苏鹏程, 陈宇, 张家铭, 杨超. 基于六边形紧密拼接结构的仿生复眼系统设计 . 红外与激光工程, 2021, 50(4): 20200338-1-20200338-9. doi: 10.3788/IRLA20200338
[5]	黄邵祺, 宋泽园, 潘明亮, 龙严, 戴博, 张大伟. 高填充因子微透镜阵列的快速制备及特性分析 . 红外与激光工程, 2021, 50(10): 20200476-1-20200476-5. doi: 10.3788/IRLA20200476
[6]	付伟伟, 黄坤. 基于微纳器件的全光图像处理技术及应用 . 红外与激光工程, 2020, 49(9): 20201040-1-20201040-14. doi: 10.3788/IRLA20201040
[7]	王腾飞, 陈永和, 傅雨田. 基于微场镜阵列的红外光场中继成像系统 . 红外与激光工程, 2020, 49(7): 20190548-1-20190548-6. doi: 10.3788/IRLA20190548
[8]	田永胜, 侯金, 龙银福, 唐翠姣, 黄玉春, 杨春勇, 陈少平. 光纤倾斜耦合角度的快速精密图像测量 . 红外与激光工程, 2019, 48(10): 1013001-1013001(8). doi: 10.3788/IRLA201948.1013001
[9]	徐正奎, 李晓斌, 乐丽珠, 于振龙, 何俊, 王春兴. 红外双波叠层结构探测器微透镜阵列的设计 . 红外与激光工程, 2019, 48(8): 803003-0803003(5). doi: 10.3788/IRLA201948.0803003
[10]	王佳华, 杜少军, 张烜喆, 李俊, 王彦, 刘青松. 四焦距聚焦型光场计算成像系统的设计 . 红外与激光工程, 2019, 48(2): 218003-0218003(7). doi: 10.3788/IRLA201948.0218003
[11]	孙玉博, 熊玲玲, 张普, 王明培, 刘兴胜. 半导体激光器光束匀化系统的光学设计 . 红外与激光工程, 2019, 48(12): 1205003-1205003(6). doi: 10.3788/IRLA201948.1205003
[12]	赵永强, 李宁, 张鹏, 姚嘉昕, 潘泉. 红外偏振感知与智能处理 . 红外与激光工程, 2018, 47(11): 1102001-1102001(7). doi: 10.3788/IRLA201847.1102001
[13]	秦齐, 刘艳, 刘欢欢, 时川, 谭中伟. 图像处理在光纤光斑微位移传感中的应用 . 红外与激光工程, 2018, 47(10): 1022004-1022004(7). doi: 10.3788/IRLA201847.1022004
[14]	费小亮, 任侃, 钱惟贤, 汪鹏程, 陈钱. 红外面阵旋转搜索系统下的恒虚警检测方法 . 红外与激光工程, 2016, 45(2): 204003-0204003(7). doi: 10.3788/IRLA201645.0204003
[15]	李以贵, 颜平, 黄远, 杉山进. 基于X光移动光刻技术的PMMA微透镜阵列制备 . 红外与激光工程, 2016, 45(6): 620001-0620001(5). doi: 10.3788/IRLA201645.0620001
[16]	马媛花, 胡炳樑, 李然, 孙朗, 孙念, 王峥杰. 采用Gyrator变换的泰伯效应及图像去噪 . 红外与激光工程, 2014, 43(2): 665-670.
[17]	于双双, 史宣, 杜吉, 孟军合. 基于二维微透镜阵列增大手术显微镜出瞳直径方法研究 . 红外与激光工程, 2014, 43(10): 3342-3346.
[18]	刘志辉, 石振东, 杨欢, 李国俊, 方亮, 周崇喜. 衍射微透镜阵列用于半导体激光光束匀化 . 红外与激光工程, 2014, 43(7): 2092-2096.
[19]	董建婷, 杨小乐, 董杰. 面阵CMOS图像传感器性能测试及图像处理 . 红外与激光工程, 2013, 42(12): 3396-3401.
[20]	宋春华, 高仕博, 程咏梅. 自主空中加油视觉导航系统中的锥套检测算法 . 红外与激光工程, 2013, 42(4): 1089-1094.

点击查看大图

图(8)

计量

文章访问数: 495
HTML全文浏览量: 175
PDF下载量: 146
被引次数: 0

全文HTML

0. 引　言

卷积运算具有线性和平移不变性，常用于图像处理任务中的线性空间滤波系统。由于光子通量的随机性等原因，探测器接收到的图像会包含着不同程度的噪声。大多数情况下，这些噪声可以通过图像平滑技术进行抑制或去除。常见的平滑算法中的高斯滤波和均值滤波^[1]都是基于卷积运算实现的。此外，能够增强图像细节边缘和轮廓，便于后期对目标进行识别的图像锐化，也是通过一系列算子的组合对输入图像做卷积实现的。

然而，诸如上述基于卷积运算实现的经典的图像处理任务，其卷积核都是人工预先设定的。由于成像环境的多变性，这种方法很多时候并不能得到很好的效果。卷积神经网络（CNN）的提出就解决了该问题。在CNN中，卷积核不再是像平滑和锐化任务中使用的算子那样是固定的，而是可以通过计算机学习得到最适合的样式。从而用于实现图像识别^[2-3]、图像分割^[4-5]以及图像复原^[6-8]等任务。近年来，由于摩尔定律达到了瓶颈，计算机芯片的集成度的增长速度难以满足大数据时代的计算需求。光学研究领域的研究者们为了解决这个问题，提出了光学神经网络^[9-10]，期望利用光子这个高速、并行性强且抗电磁干扰的介质，来代替电子实现低延迟、高带宽且能耗低的神经网络。对于光学卷积神经网络而言，光学实现卷积层很重要。徐绍夫^[11]等人通过两个声光调制器阵列分别加载输入图像和卷积核，一次加载一个窗口的输入图像，反复使用两个阵列来实现一层卷积层。参考文献[12-13]基于卷积定理，利用光学4 f系统很巧妙地实现了光学卷积层。

此外，除了光学卷积神经网络的卷积层，卷积操作也可以用于实现池化层^[14-15]，来减少网络的参数量。Hoda^[15]等人提出的运动池化，通过在4 f系统的频谱面放置高斯掩模来实现，在减少参数量的同时，还提高了网络的平移不变性。

文中设计了一款光学系统，论述了系统的工作原理以及可行性分析。该系统用于对光场所携带的图像信息做卷积运算。其中卷积核是任意的正值，因此能够基于固定的算子实现图像模糊/锐化。此外，该系统也可以用作光学卷积神经网络的卷积处理单元。

1. 二维离散卷积原理

二维离散卷积是基于两个矩阵之间的运算，可以分为same、valid、full卷积三种类型。运算时，根据三种类型决定是否需要对图像进行边缘填充，然后使用核在图像上以步长大小滑动，并做元素对应相乘再求和的运算。例如图像$ {{x}} = \left[ {\begin{array}{*{20}{c}} 6&3&5 \\ 2&7&1 \\ 3&1&2 \end{array}} \right] $，卷积核$ {{k}} = \left[ {\begin{array}{*{20}{c}} 4&2 \\ 1&5 \end{array}} \right] $，步长为1， valid卷积的输出y为：

$$ {{y}} = \left[ {\begin{array}{*{20}{c}} {\sum {\left( {\begin{array}{*{20}{c}} {6 \times 4}&{3 \times 2} \\ {2 \times 1}&{7 \times 5} \end{array}} \right)} }&{\sum {\left( {\begin{array}{*{20}{c}} {3 \times 4}&{5 \times 2} \\ {7 \times 1}&{1 \times 5} \end{array}} \right)} } \\ {\sum {\left( {\begin{array}{*{20}{c}} {2 \times 4}&{7 \times 2} \\ {3 \times 1}&{1 \times 5} \end{array}} \right)} }&{\sum {\left( {\begin{array}{*{20}{c}} {7 \times 4}&{1 \times 2} \\ {1 \times 1}&{2 \times 5} \end{array}} \right)} } \end{array}} \right] $$

(1)

公式（1）中，一个∑内包含的是一个窗口内的点乘运算。实际上，可以将上述计算看做x^'与k^'的矩阵乘法（其中x^'是将原输入x的每个窗口内的数值按列堆叠，k^'则是将卷积核拉成一行）。公式（2）所示的y^'便是y拉成一行的结果。

$$ {{{y}}'} = \left[ {\begin{array}{*{20}{c}} 4&2&1&5 \end{array}} \right] \times \left[ {\begin{array}{*{20}{c}} {\begin{array}{*{20}{c}} 6&3 \\ 3&5 \end{array}}&{\begin{array}{*{20}{c}} 2&7 \\ 7&1 \end{array}} \\ {\begin{array}{*{20}{c}} 2&7 \\ 7&1 \end{array}}&{\begin{array}{*{20}{c}} 3&1 \\ 1&2 \end{array}} \end{array}} \right] $$

(2)

3. 矩阵解释

对于二维输入${\left[ {{{m}},{{n}}} \right]^{\rm{{T}}}}$，经过一个传输矩阵为$ T = \left[ {\begin{array}{*{20}{c}} a&b \\ c&d \end{array}} \right] $的线性无损系统后，输出${\left[ {{{h}},{{k}}} \right]^{\rm{T}}}$。

$$ \left[ {\begin{array}{*{20}{c}} {{h}} \\ {{k}} \end{array}} \right] = \left[ {\begin{array}{*{20}{c}} {{a}}&{{b}} \\ {{c}}&{{d}} \end{array}} \right] \times \left[ {\begin{array}{*{20}{c}} {{m}} \\ {{n}} \end{array}} \right] $$

(4)

因为无损，所以需要满足：

$$ \begin{split} {m^2} + {n^2} = & {h^2} + {k^2} = ({a^2} + {b^2}){m^2} + ({c^2} + {d^2}){n^2} +\\ & 2\left( {ac + bd} \right)mn \end{split} $$

(5)

对于任意的m、n，公式（5）都要成立，因此$\left\{ {\begin{array}{*{20}{c}} {{a^2} + {b^2} = {c^2} + {d^2} = 1} \\ {ac + bd = 0} \end{array}} \right.$，传输矩阵T为酉矩阵。同理，对于其他维度的输入也可以得到此结果。因此，任意线性无损系统的传输矩阵为酉矩阵。

P₂处的强度调制操作相当于一衰减片，其传输矩阵为对角矩阵。根据奇异值分解原理，任何矩阵M都可以分解为两个酉矩阵与对角矩阵的乘法（$ M = U\Sigma {V^ + } $）。因此，L1，L2与P₂组成的系统可以实现任意正值的传输矩阵。

在图1中，使用微透镜阵列将输入图像划分成许多小块，进行并行处理。每一个小块都经历相同的传输矩阵M。将输入的每一个小块做列堆叠，传输矩阵拉成一行，此时图2所示的情况中的输出表示为：

$$ y = \left[ {\begin{array}{*{20}{c}} a&b&c&d \end{array}} \right] \times \left[ {\begin{array}{*{20}{c}} {{X_1}}&{{X_3}}&{{X_9}}&{{X_{11}}} \\ {{X_2}}&{{X_4}}&{{X_{10}}}&{{X_{12}}} \\ {{X_5}}&{{X_7}}&{{X_{13}}}&{{X_{15}}} \\ {{X_6}}&{{X_8}}&{{X_{14}}}&{{X_{16}}} \end{array}} \right] $$

(6)

根据第1节中的公式（2）可知此处实现了卷积运算。

6. 结　论

文中设计了一款光学系统，基于微透镜阵列与透镜组构成的匀光系统，对光场所携带的图像信息做卷积运算。一方面，可以实现固定的算子做图像模糊或者锐化，用于图像处理系统的预处理；另一方面也可以用作光学卷积神经网络的卷积单元。相较于参考文献[11]中实现一次卷积需要给卷积单元多次加载信息，文中的光学卷积系统仅需加载一次调制信息。然而，由于系统使用透射率作为卷积核的值，只能实现数值范围在0~1的卷积核，这给网络算力带来了上限。在使用SLM投影的有源系统中，可以通过对输入图像的预处理实现各种步长的3种卷积。同一个输入，多次投影卷积核，可以实现多通道输出。同一个卷积核，多通道输入可以同时平铺在输入面。因此，该系统有希望实现多通道的光学卷积神经网络用于一些复杂的图像处理任务。

参考文献 (15)

姓名
邮箱
手机号码
标题
留言内容
验证码

留言板

微透镜阵列光学实现卷积运算

doi: 10.3788/IRLA20210887

作者简介:
费宇航，女，硕士生，主要从事光计算和光子集成芯片方面的研究

隋修宝，男，教授，博士，主要从事红外探测理论与仪器研制以及光计算等方面的研究

Optically realize convolution operation of microlens array

计量

微透镜阵列光学实现卷积运算

doi: 10.3788/IRLA20210887

南京理工大学电子工程与光电技术学院，江苏南京 210094

作者简介:
费宇航，女，硕士生，主要从事光计算和光子集成芯片方面的研究

隋修宝，男，教授，博士，主要从事红外探测理论与仪器研制以及光计算等方面的研究

English Abstract

Optically realize convolution operation of microlens array

School of Electronic and Optical Engineering, Nanjing University of Science and Technology, Nanjing 210094, China

全文HTML

目录

留言板

微透镜阵列光学实现卷积运算

doi: 10.3788/IRLA20210887

作者简介: 费宇航，女，硕士生，主要从事光计算和光子集成芯片方面的研究 隋修宝，男，教授，博士，主要从事红外探测理论与仪器研制以及光计算等方面的研究

Optically realize convolution operation of microlens array

计量

出版历程

微透镜阵列光学实现卷积运算

doi: 10.3788/IRLA20210887

南京理工大学 电子工程与光电技术学院，江苏 南京 210094

作者简介: 费宇航，女，硕士生，主要从事光计算和光子集成芯片方面的研究 隋修宝，男，教授，博士，主要从事红外探测理论与仪器研制以及光计算等方面的研究

English Abstract

Optically realize convolution operation of microlens array

School of Electronic and Optical Engineering, Nanjing University of Science and Technology, Nanjing 210094, China

全文HTML

目录

作者简介:
费宇航，女，硕士生，主要从事光计算和光子集成芯片方面的研究

隋修宝，男，教授，博士，主要从事红外探测理论与仪器研制以及光计算等方面的研究

南京理工大学电子工程与光电技术学院，江苏南京 210094

作者简介:
费宇航，女，硕士生，主要从事光计算和光子集成芯片方面的研究

隋修宝，男，教授，博士，主要从事红外探测理论与仪器研制以及光计算等方面的研究