基于改进空洞卷积神经网络的丘陵山区田间道路

2021/07/09

0 引言

丘陵山区占中国国土面积的 70%左右，是中国粮油糖作物及薯类、果桑茶麻、蔬菜、青饲料等特色经济作物的重要生产基地[1]。农村劳动力的缺乏以及生产率提升的迫切需求，使得丘陵山区亟需各种自动化程度高、安全性好的智能农业机械。机器视觉系统是智能农机搭载的主要环境感知装备之一，其主要任务是完成对可行驶区域、障碍物或作物的检测。丘陵山区田间道路场景复杂，道路宽度不一、曲率变化大、形态复杂，路内路边杂草泥土等障碍物散布，给智能农机的自主导航与避障带来较大的困难。因此，针对丘陵山区田间道路的复杂场景识别研究变得尤为重要。

根据识别的内容和范围，基于图像处理的道路场景识别可分为低层次的道路识别和高层次的道路场景理解[2]。道路识别一般采用图像分割法将道路区域和非道路区域区分开。道路场景理解则是在像素级对场景中检测到的各类对象进行语义分割，能够更精确地识别出道路区域及周围的环境对象，为自主导航和避障提供支持。在道路场景识别方法中，深度学习具有精准性高、鲁棒性强等优点，成为道路场景识别的重要发展方向[3]。

近年来在道路场景理解研究中，Oliveira等[4]使用卷积神经网络（convolutional neural networks，CNN）算法学习场景中的高阶特征进行单目道路场景分割，通过应用在一个普通图像数据集上的训练算法对其他测试图像进行分类，生成训练标签；然后使用基于颜色层融合的新纹理描述子来获取道路区域的最大一致性；最后将离线和在线信息结合起来对城市道路区域进行检测。Coombes等[5]提出基于HSV（hue saturation value）色彩空间的语义分割算法，使用CNN来分割解释场景，通过训练基于颜色的贝叶斯网络分类器对每个分割的聚类进行语义分类，利用亮度特征识别飞机场滑行道上的表面线，然后与 CNN分割相融合，给出改进的分类结果。Wang等[6]提出一种利用相对位置先验信息和语义分割相联合的方法来估计城市道路布局和分割城市场景。Cordts等[7]和Zhang等[8]利用多传感器信息融合技术提高城市交通道路场景理解的准确性。Chen等[9]提出了一种基于视差建议的检测方法，在立体视差的基础上快速提取检测对象的候选帧，保证了候选帧在不同扰动下的鲁棒性。

上述文献的场景理解方法基本上是为解决特定结构化场景下的智能导航问题而提出，具有特定的功能，仅适用于特定的环境。由于基于卷积神经网络的深度学习能够自动学习图像的层级特征，在物体识别和像素标注上表现出优秀性能，因此成为图像语义分割的重要方法之一。轩永仓[10]将大田场景对象分为 7类，采用基于全卷积神经网络 VGG-16结构的 FCN-32s、FCN-16s和FCN-8s 3种模型进行语义分割，测试结果表明 FCN-8s的总体效果最好，在大田应用场景下的统计像素准确率可达90.87%。该模型应用场景为平原大田环境，图像较为简单，训练集分辨率为 256×256像素，对分割的细节要求不高。张利刚[11]将VGG-16中的18层卷积层和池化层均改为空洞卷积层和空洞池化层，构建了全空洞卷积神经网络，使用该网络在MIT Scene Parsing Dataset下训练测试，统计像素准确率达到 72.81%，比 FCN-8s高1.49%。该方法未保留池化层，网络采用了大量膨胀信息，对一些大物体有较好分割效果，但对小物体的分割不够准确，边缘也较模糊。

本文针对丘陵山区田间道路无车道线、边界模糊、环境复杂多变等特点，利用全卷积神经网络 VGG-16结构，融合空洞卷积构造预测精度更高的前端模块，并利用不同膨胀系数空洞卷积层的级联进行多尺度上下文聚合，构建了基于改进空洞卷积神经网络的田间道路场景识别模型，对复杂非结构化田间道路图像进行语义分割，以获取道路的可行区域和障碍物等信息，为后续丘陵山区智能农机的自主导航奠定基础。

1 丘陵山区田间道路场景对象分类

道路一般分为结构化道路和非结构化道路[12]。目前针对结构化道路的图像识别技术相对成熟。非结构化道路一般指无车道线和无明显边界的非主干道或乡村道路。对非结构化道路的准确识别是当前道路环境感知的主要研究内容之一[13]。

随着丘陵山区农田整治与农田基础设施建设的推进，田间、居民点、仓库之间普遍建立起0.8～1.2 m宽的田间便道[14]（如图1所示）。

图1 丘陵山区田间道路场景图像语义分割实例Fig.1 Example of semantic segmentation of field road scene in hilly areas

这些道路属于典型的非结构化道路，主要特点包括：1）道路形状变化多样，蜿蜒曲折，坡度大；2）路况复杂，道路两旁多为不同类型的作物和杂草，道路边缘多被杂草和作物枝叶覆盖，路面上的阴影千差万别；3）路面状况受季节和天气的影响较大，不同季节和天气情况下道路的颜色和纹理特征差异较大。这些复杂的场景特征为田间道路及道路上障碍物的识别带来较大困难。因此，要实现智能农机在田间道路上基于机器视觉的自主导航，需通过多重处理区分出田间道路、周围环境，以及道路上的物体。

上一篇：农机和农艺技术结合中存在的问题及措施探讨
下一篇：没有了

Top