Page 107 - 安防19年12月刊_150dpi
P. 107
基于深度学习的车辆检测
□ 文/时文忠 王忠荣
随着社会的发展和人民生活水平的提升,汽车保有 组成,网络、损失函数和数据,网络用于提取特征,数
量在不断的快速增长,从一些大城市的车辆限号和限 据用于模型拟合,损失函数决定如何训练。同理,对一
行可以看出来,交通监管面临巨大的压力。各种交通卡 个模型的改进也可以从这三个方面入手:首先网络方
口和红绿灯路口都安装了智能监控,随着人工智能的发 面,改进车辆检测算法的网络,在三个方面影响检测
展,这些繁重的工作可以借助计算机视觉来辅助处理。 性能:网络深度、下采样率和感受野大小;其次数据方
让计算机自动处理这些图像数据,最重要的就是需要 面,本文使用在图像分类领域表现很好的mixup数据增
定位图像中车辆的位置,即车辆检测。本文将深入研究 广方法;最后损失函数方面,本文使用焦点损失和困难
目前的一些目标检测算法并提出本文的检测算法。 样本挖掘提升效果。
数据集
相关工作 目前的公开数据集不多,本文通过采集大量交通
随着目标检测精度和速度要求越来越高,传统方 卡口的视频和图像数据,然后使用一些目标检测工具进
法已经不能满足需求了。近年来,深度学习技术得到 行人工标注。本文使用自建和公开数据集共计25000张
了广泛的应用,产生了一系列目标检测算法,例如两阶 图像,按照9:1的比例划分为检测模型的训练集和验证
段目标检测算法,Girshick等在2014年提出的R-CNN 集。
算法一举夺得当年Pascal VOC比赛的冠军。SPP-Net 在数据预处理方面,本文使用了常见的数据增广
提出空间金字塔池化,Fast R-CNN[3]在R-CNN中加 方法,比如随机裁剪,随机翻转,随机旋转(-30-+30
入RoIPooling层调整特征图的尺寸,Faster R-CNN提 度),另外还使用了一种在图像分类领域表现较好的
出RPN取代以前的选择性搜索方法来更快的生成更 mixup数据增广方法。
准确的候选框,所有步骤由卷积神经网络完成,Faster 网络结构
R-CNN是第一个端到端的两阶段目标检测方法。另外 在目标检测网络的骨干网络部分,在Darknet基础
一大类是单阶段检测算法,以SSD(Single Shot MultiBox 上进行改进,得到扩张卷积暗网络,由48层1*1卷积或
Detector)系列、YOLO(You Only Look Once)系列、 者3*3卷积网络构成的全卷积网络,在网络最后一个模
RetinaNet等为典型代表,基于全局回归和分类的框架, 块使用Dilated Convolution(扩张卷积),扩张卷积的最
从图像像素直接映射到目标边界框和类别概率,可以极 大优点在于不做池化或者下采样的操作,可以增大感
大较少开销提升效率,目前大多数单阶段行人检测器 受野,让每个卷积输出都包含较大范围的信息,同时尽
都可以做到实时检测。 可能保留较大的特征图和图像的空间信息,这对于小
目标检测非常关键。对于目标检测问题,使用扩张卷积
本文方法 可以极大的保留空间信息。使用扩张卷积时,由于特征
在深度学习领域,一个深度学习模型由三大部分 图不减小,这会极大增加计算量,与一般的网络结构不
第五届深圳国际无人机展览会(2020年8月深圳会展中心) www.china-drone.com.cn 89
ᇆିࢌ๙ JOEE ྒ௹ඹ