[0019] 下面结合附图对本发明作进一步描述。
[0020] 本发明提供了一种基于特征增强卷积神经网络的裂缝检测网络LFDNet。该裂缝检测网络LFDNet包括三部分:特征提取模块、特征融合模块以及注意力机制模块。首先,特征提取模块通过基本卷积神经网络提取目标浅层特征信息、深层特征信息;然后特征融合模块将提取的特征信息中的浅层特征和深层特征融合,形成包含上下文信息的融合特征,用于解决浅层特征图中目标语义信息弱、检测精度低的问题;再然后注意力机制模块通过融合全局像素关联空间注意力,增强对关键目标信息贡献大的区域,来增强网络LFDNet对特定目标的检测能力。
[0021] 参照图1是本发明的整体实施方案流程图,一种基于特征增强的隧道裂缝快速检测方法,按照如下步骤进行:
[0022] 步骤(1)使用特征提取模块、特征融合模块和注意力机制模块,构建初始卷积神经网络LFDNet;
[0023] 步骤(2)在MS COCO数据集上对初始卷积神经网络LFDNet进行预训练,得到基础检测模型。
[0024] 步骤(3)收集多种场景下的隧道裂缝图片,标注所有收集的裂缝图片中的裂缝,从而形成一个专门的隧道裂缝数据集。收集的多种场景下的隧道裂缝图片包括:高对比度/低对比度、强光照/弱光照、图片有噪点污染/图片无噪点污染。使用隧道裂缝数据集对步骤(2)中的基础检测模型进行进一步训练,得到最终的裂缝检测网络LFDNet。
[0025] 步骤(4)将测试裂缝图片输入最终的裂缝检测网络LFDNet,检测出该裂缝图片中是否存在裂缝以及裂缝的位置信息。
[0026] 步骤(1)所述构建卷积神经网络LFDNet,具体实现过程如下:
[0027] 1.1构建特征提取模块,使用ResNet‑101作为主干网络用于提取隧道裂缝特征图信息;
[0028] 1.2提取到特征图(记为特征图1、特征图2、特征图3、特征图4和特征图5)之后。构建特征融合模块:从特征图5开始,使用1*1的卷积核来降维深层特征图的通道,使得深层特征图和浅层特征图的通道数一致;然后对降维的深层特征图上采样放大到和浅层特征图的尺寸一致;最后利用矩阵multi操作将具有相同通道和尺寸的浅层特征图和深层特征图融合,得到融合特征图。
[0029] 具体过程如图2所示:特征图1是由卷积层1的输出,特征图尺寸最大,语义最浅;依次特征图2、特征图3、特征图4、是分别由卷积层2、卷积层3和卷积层4输出,而由卷积层5输出的特征图5尺寸最小,语义最强。将特征图5上采样到与特征图4相同的尺寸,然后与特征图4进行第1次融合得到融合特征图1,此时的融合特征图相比与原先的特征图4具有了更强的语义。再然后将融合特征图1上采样得到与特征图3相同的尺寸,进行第,2次融合得到融合特征图2,重复多次融合得到融合特征图1、融合特征图2、融合特征图3和融合特征图4。
[0030] 1.3将步骤1.2得到的融合特征图1、融合特征图2、融合特征图3和融合特征图4送入注意力机制模块,提取不同维度信息,得到包含关键信息的特征图,具体流程如图3所示:
[0031] 其中,输入融合特征图为X∈Rh*w*c,首先,通过横向卷积和纵向卷积操作,沿通道维度得到两个新的特征描述分别为:
[0032] Fc∈Rhwc*1,Fl∈R1*hwc,
[0033] 并通过矩阵multi操作融合新的特征描述:
[0034] Xnew=Fc×Fl
[0035] 然后,通过一个标准的卷积激活函数ReLU对融合后新的特征描述进行激活,获得最终的注意力图A(x),整个注意力图提取过程描述如下所示:
[0036]
[0037] 其中:γ∈[0,1).
[0038] 进一步步骤1.3的操作可以描述为:首先,空间注意力机制通过计算不同维度(横向和纵向)的特征信息寻找隧道裂缝在图片中的位置;然后,通过卷积激活函数对特定区域进行注意力学习,得到包含特定区域上下文信息的注意力特征图。
[0039] 如图4所示,所述步骤(2)具体实现过程如下:
[0040] 2.1将步骤(1)构成的卷积神经网络LFDNet,设置多个步长的学习批次,批处理数设置为64。动量设为0.8,初始权值设置为0.01,每1000次学习后衰减为原来的1/10。
[0041] 2.2网上下载MS COCO数据集,使用MS COCO数据集对卷积神经网络LFDNet进行训练,获得基础检测模型。
[0042] 所述步骤(3)具体实现过程如下:
[0043] 3.1收集多种场景下的隧道裂缝图片,标注所有收集的裂缝图片中的裂缝,从而形成一个专门的隧道裂缝数据集。收集的多种场景下的隧道裂缝图片包括:高对比度/低对比度、强光照/弱光照、图片有噪点污染/图片无噪点污染。
[0044] 3.2使用隧道裂缝数据集对步骤(2)中的基础检测模型进行进一步训练,得到最终的裂缝检测网络LFDNet。
[0045] 所述步骤(4)具体实现过程如下:
[0046] 将测试图像输入到卷积神经网络检测模型LFDNet中,获得裂缝检测结果。若输入的隧道图片中包含裂缝,则能够得到图片中的裂缝位置等信息将测试裂缝图片输入最终的裂缝检测网络LFDNet,获得裂缝检测结果,若输入的测试裂缝图片中包含裂缝,则能够检测出该测试裂缝图片中裂缝的位置信息。