热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

一种交通视频数据的车辆检测与分类模型

1.文章信息本次介绍的是题目为《Detectionandclassificationofvehiclesfortrafficvideoanalytics》的目标检测类文章2018年

1.文章信息

本次介绍的是题目为《Detection and classification of vehicles for traffic video analytics》的目标检测类文章

2018年发表在Procedia Computer Science上的一篇会议论文,会议为INNS Conference on Big Data and Deep Learning 2018

2.摘要

本文提出了一种基于CV技术的交通视频分析系统,该系统可以自动收集重要的统计数据,包括车辆计数、车辆类型分类、从视频中估计车辆速度和车道使用监控等。该系统的核心是交通视频中的车辆检测和分类。为此,本文对比了两个模型,一是MoG+SVM系统,二是基于Faster RCNN的模型。实验表明,Faster RCNN在检测静态、重叠或夜间条件下的车辆时优于MoG,并且在基于外观分类车辆类型的任务上也优于SVM

3.数据集

本文使用了两个数据集,分别为:

(1)印尼收费公路数据集(自有数据集)

通过相机从人行天桥上手动获取于两个著名印尼收费公路Jagorawi收费公路和Kapuk收费公路,数据为包括夜间视频的近一周数据。视频数据集的分辨率4096*2160,每秒22

(2)公共数据集MIT Traffic

麻省理工交通数据集是为交通场景分析拥挤场景的研究而设计的。包含一个90分钟长的交通视频序列,由一台固定的照相机记录下来。尺寸720*480,被分为20个片段

进入模型部分

图像中特定物体的检测是一个困难的问题,因为图像中物体的本质往往是不同大小、不同方向的物体,而且物体的重叠会检测结果为目标遮挡物。这些问题需要一种具有几个特性的检测算法,如平移不变性、旋转不变性和尺度不变性

4.模型一:基于MoG+SVM

模型一的思路是,先利用混合高斯背景减法(mixture of Gaussian background subtraction)来检测移动车辆在视频中的位置。从这些检测区域,我们形成图像的边界框,并使用经过训练的支持向量机(SVM)分类器对车辆类型进行分类,包括轿车、送货车(皮卡、带集装箱的车辆)、卡车、大型卡车和公共汽车

背景减法是用来检测在参考背景图像中不存在的图像新对象的方法。其基本原理是,一幅含有多个待检测目标的新图像被参考图像减去,生成一幅新图像,该图像对两幅图像的进行编码,并根据给定差异阈值判定是否为识别目标

背景相减检测车辆的图像处理步骤如下图

对于MoG检测方法,文章使用MoG来检测像素值的变化,减去背景图像,只留下前景对象。提取前景对象并使用一个边界框分割提取适当的图像来训练SVM模型让其基于图像分类,类别包括前面提到的五个汽车类一个额外的非汽车类。然后将图像调整为64x64的印度尼西亚收费公路数据集和32x32的麻省理工交通数据集。其中,麻省理工交通数据集由于车辆距离更远所以尺寸小。SVM的性能评价使用5折交叉验证,即80%的训练和20%的测试数据随机分割

此模型具体流程框图如下

5.模型二:基于Faster RCNN

模型二的思路是,训练RCNN(专门为检测和定位图像中的目标而设计的深度学习模型)来同时检测和分类交通场景视频帧中的车辆。通过这些交通场景中车辆的包围盒检测,我们可以对这些被检测车辆的位置进行短期跟踪,提取估计的速度车道位置等信息

从第一个数据集中交通场景的不同位置条件中抽取1058张图像进行标注。对第二个数据集抽样353张图像。基于这些图像,文章使用Faster RCNN进行训练,检测出相应的车辆类。同样使用5折交叉验证方案,即80%的训练和20%的测试数据随机分割

Faster RCNN框架结构如下图所示

Faster RCNN检测可能出现在视频某帧中的任何车辆的边界框类别。根据前边提到的六个类别和车辆边界框的位置对图像进行标注,并在这些图像上训练Faster RCNN,使Faster RCNN既可以对单个模型中的车辆进行检测,也可以对车型进行分类。如果边界框的检测值与标注框的交并比(并集上的交集)大于0.5,则视为边界框正确。而初始检测区域是由anchor box决定的,如下图

印尼数据中,文章使用尺寸为[64,128,256,512]和宽高比为[1:1,1:1.5,1.5:1]的anchor box对图片进行扫描,而对于MIT数据,文章使用尺寸为[32,64,128]和比例为[1:1,1:2,2:1]的anchor box对图片进行扫描寻找检测目标

6.追踪车辆及其行为的方法

文章使用OpenCV两种跟踪算法。对于印尼数据使用中值流跟踪算法,因为由于收费车道个人偏好的限制,大部分车辆会规则的直线移动,车辆尺寸变化不显著;对于MIT数据使用KCF跟踪算法,因为MIT数据集的车辆在十字路口展示了更多样化的运动,目标的尺度变化也更多样化

(1)估计车辆速度

针对印尼数据进行速度估计。连续跟踪30,使用相似三角形原理来完成跟踪任务。首先标定一个标准参照物,它不随时间的推移在录像中发生任何变化,记录此标定对象的实际宽度W米,距离摄像机的距离D米,再测量该标记对象在视频中出现时的宽度像素值P,于是可以计算相机的焦点F为

利用F,可以估计相机中其他物体的距离(单位米),为此需要知道被估计物体的宽度,假设正常车辆送货车宽度1.8米,公共汽车卡车的宽度为2.5米。还需要知道车辆在相机中的像素宽度,此值使用车辆检测包围框的宽度值。利用焦点公式,可以算出车辆与相机的估计距离

为了估计速度,计算在一个固定时间段内所涉及的车辆距离差。使用5帧的差值来估计车辆的速度,从而取五帧的平均速度来最小化不稳定的跟踪边界框对速度估计的影响。视频速率单位为帧/秒记为fps,则可估计车辆的速度

3.6这个系数是为了把速度单位从m/s换成km/h

(2)不同类型车辆的车道使用情况

手动定义每个场景的不同车道,车道的起点终点分别定义为p1p2,车辆包围框的中心点定义为p3,三个点都为二维坐标向量,则该车到每条指定车道的距离

就可据此判断车辆的车道使用

7.实验结果

模型一:使用两种不同的支持向量机对模型在两个数据集上进行测试,五折交叉验证准确率结果如下

模型二:使用Faster RCNN的模型五折交叉验证准确率结果如下

对于印度尼西亚收费公路数据集和麻省理工交通数据集,Faster RCNN在交叉验证精度方面优于这两个基于SVM的分类模型。另外,与麻省理工学院交通数据集的结果相比,印度尼西亚收费公路数据集的精度结果范围差异很大。文章认为这是由于印度尼西亚收费公路数据集存在较大的可变性,它不仅包括两个不同的地点,而且还包括光照条件的不同时间(白天和晚上)。而麻省理工学院的交通数据集只有一个场景有统一的照明条件(记录只进行了90分钟)

综上,本文介绍了一种交通视频自动分析系统。该系统能够自动统计车辆数量,对车辆进行分类,估计行驶车辆的速度,确定车道使用情况。下图为流量监控系统的接口实示例

8.创新点

(1)比较了混合高斯(MoG)背景减法+支持向量机(SVM)的车辆分类模型与Faster RCNN同时检测和分类车辆类别的性能。从本文实验中,发现了MoG + SVM系统的几个缺点,使其不适合在真实世界环境中的动态场景的交通视频分析。Faster RCNN方法作为基于外观的方法,在检测重叠车辆或在夜间低光条件下的车辆时优于MoGFaster RCNN的方法更适合交通视频分析的问题

(2)建立了一个系统,可以从车辆检测系统的结果估计其他重要信息的车辆,如估计速度车道使用

Attention

如果你和我一样是轨道交通、道路交通、城市规划相关领域的,可以加微信:Dr_JinleiZhang,备注“进群”,加入交通大数据交流群!希望我们共同进步!


推荐阅读
  • 人工智能推理能力与假设检验
    最近Google的Deepmind开始研究如何让AI做数学题。这个问题的提出非常有启发,逻辑推理,发现新知识的能力应该是强人工智能出现自我意识之前最需要发展的能力。深度学习目前可以 ... [详细]
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • sklearn数据集库中的常用数据集类型介绍
    本文介绍了sklearn数据集库中常用的数据集类型,包括玩具数据集和样本生成器。其中详细介绍了波士顿房价数据集,包含了波士顿506处房屋的13种不同特征以及房屋价格,适用于回归任务。 ... [详细]
  • 学习SLAM的女生,很酷
    本文介绍了学习SLAM的女生的故事,她们选择SLAM作为研究方向,面临各种学习挑战,但坚持不懈,最终获得成功。文章鼓励未来想走科研道路的女生勇敢追求自己的梦想,同时提到了一位正在英国攻读硕士学位的女生与SLAM结缘的经历。 ... [详细]
  • 在Android开发中,使用Picasso库可以实现对网络图片的等比例缩放。本文介绍了使用Picasso库进行图片缩放的方法,并提供了具体的代码实现。通过获取图片的宽高,计算目标宽度和高度,并创建新图实现等比例缩放。 ... [详细]
  • [译]技术公司十年经验的职场生涯回顾
    本文是一位在技术公司工作十年的职场人士对自己职业生涯的总结回顾。她的职业规划与众不同,令人深思又有趣。其中涉及到的内容有机器学习、创新创业以及引用了女性主义者在TED演讲中的部分讲义。文章表达了对职业生涯的愿望和希望,认为人类有能力不断改善自己。 ... [详细]
  • 推荐系统遇上深度学习(十七)详解推荐系统中的常用评测指标
    原创:石晓文小小挖掘机2018-06-18笔者是一个痴迷于挖掘数据中的价值的学习人,希望在平日的工作学习中,挖掘数据的价值, ... [详细]
  • 浏览器中的异常检测算法及其在深度学习中的应用
    本文介绍了在浏览器中进行异常检测的算法,包括统计学方法和机器学习方法,并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测,可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率,而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]
  • 手把手教你使用GraphPad Prism和Excel绘制回归分析结果的森林图
    本文介绍了使用GraphPad Prism和Excel绘制回归分析结果的森林图的方法。通过展示森林图,可以更加直观地将回归分析结果可视化。GraphPad Prism是一款专门为医学专业人士设计的绘图软件,同时也兼顾统计分析的功能,操作便捷,可以帮助科研人员轻松绘制出高质量的专业图形。文章以一篇发表在JACC杂志上的研究为例,利用其中的多因素回归分析结果来绘制森林图。通过本文的指导,读者可以学会如何使用GraphPad Prism和Excel绘制回归分析结果的森林图。 ... [详细]
  • 本文介绍了Python语言程序设计中文件和数据格式化的操作,包括使用np.savetext保存文本文件,对文本文件和二进制文件进行统一的操作步骤,以及使用Numpy模块进行数据可视化编程的指南。同时还提供了一些关于Python的测试题。 ... [详细]
  • 【论文】ICLR 2020 九篇满分论文!!!
    点击上方,选择星标或置顶,每天给你送干货!阅读大概需要11分钟跟随小博主,每天进步一丢丢来自:深度学习技术前沿 ... [详细]
  • Opencv提供了几种分类器,例程里通过字符识别来进行说明的1、支持向量机(SVM):给定训练样本,支持向量机建立一个超平面作为决策平面,使得正例和反例之间的隔离边缘被最大化。函数原型:训练原型cv ... [详细]
  • 2017亚马逊人工智能奖公布:他们的AI有什么不同?
    事实上,在我们周围,“人工智能”让一切都变得更“智能”极具讽刺意味。随着人类与机器智能之间的界限变得模糊,我们的世界正在变成一个机器 ... [详细]
  • Two Sigma人均22万英镑~
    近期原创文章: ... [详细]
  • 「爆干7天7夜」入门AI人工智能学习路线一条龙,真的不能再透彻了
    前言应广大粉丝要求,今天迪迦来和大家讲解一下如何去入门人工智能,也算是迪迦对自己学习人工智能这么多年的一个总结吧,本条学习路线并不会那么 ... [详细]
author-avatar
玩上加瘾_926
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有