Page 107 - 安防19年12月刊_150dpi
P. 107

基于深度学习的车辆检测




                     □ 文/时文忠  王忠荣




                         随着社会的发展和人民生活水平的提升,汽车保有                      组成,网络、损失函数和数据,网络用于提取特征,数
                     量在不断的快速增长,从一些大城市的车辆限号和限                         据用于模型拟合,损失函数决定如何训练。同理,对一
                     行可以看出来,交通监管面临巨大的压力。各种交通卡                        个模型的改进也可以从这三个方面入手:首先网络方
                     口和红绿灯路口都安装了智能监控,随着人工智能的发                        面,改进车辆检测算法的网络,在三个方面影响检测
                     展,这些繁重的工作可以借助计算机视觉来辅助处理。                        性能:网络深度、下采样率和感受野大小;其次数据方
                     让计算机自动处理这些图像数据,最重要的就是需要                         面,本文使用在图像分类领域表现很好的mixup数据增

                     定位图像中车辆的位置,即车辆检测。本文将深入研究                        广方法;最后损失函数方面,本文使用焦点损失和困难
                     目前的一些目标检测算法并提出本文的检测算法。                          样本挖掘提升效果。
                                                                     数据集
                     相关工作                                               目前的公开数据集不多,本文通过采集大量交通

                         随着目标检测精度和速度要求越来越高,传统方                       卡口的视频和图像数据,然后使用一些目标检测工具进
                     法已经不能满足需求了。近年来,深度学习技术得到                         行人工标注。本文使用自建和公开数据集共计25000张
                     了广泛的应用,产生了一系列目标检测算法,例如两阶                        图像,按照9:1的比例划分为检测模型的训练集和验证
                     段目标检测算法,Girshick等在2014年提出的R-CNN                 集。
                     算法一举夺得当年Pascal VOC比赛的冠军。SPP-Net                    在数据预处理方面,本文使用了常见的数据增广
                     提出空间金字塔池化,Fast  R-CNN[3]在R-CNN中加                方法,比如随机裁剪,随机翻转,随机旋转(-30-+30
                     入RoIPooling层调整特征图的尺寸,Faster  R-CNN提             度),另外还使用了一种在图像分类领域表现较好的
                     出RPN取代以前的选择性搜索方法来更快的生成更                         mixup数据增广方法。
                     准确的候选框,所有步骤由卷积神经网络完成,Faster                     网络结构
                     R-CNN是第一个端到端的两阶段目标检测方法。另外                          在目标检测网络的骨干网络部分,在Darknet基础
                     一大类是单阶段检测算法,以SSD(Single Shot MultiBox           上进行改进,得到扩张卷积暗网络,由48层1*1卷积或
                     Detector)系列、YOLO(You Only Look Once)系列、         者3*3卷积网络构成的全卷积网络,在网络最后一个模
                     RetinaNet等为典型代表,基于全局回归和分类的框架,                   块使用Dilated Convolution(扩张卷积),扩张卷积的最
                     从图像像素直接映射到目标边界框和类别概率,可以极                        大优点在于不做池化或者下采样的操作,可以增大感
                     大较少开销提升效率,目前大多数单阶段行人检测器                         受野,让每个卷积输出都包含较大范围的信息,同时尽

                     都可以做到实时检测。                                      可能保留较大的特征图和图像的空间信息,这对于小
                                                                     目标检测非常关键。对于目标检测问题,使用扩张卷积
                     本文方法                                            可以极大的保留空间信息。使用扩张卷积时,由于特征

                         在深度学习领域,一个深度学习模型由三大部分                       图不减小,这会极大增加计算量,与一般的网络结构不



                                                                     第五届深圳国际无人机展览会(2020年8月深圳会展中心) www.china-drone.com.cn  89




          ᇆିࢌ๙ JOEE                                                                                                       ྒ௹ඹ
   102   103   104   105   106   107   108   109   110   111   112