目标检测算法之FastR-CNN算法详解

作者：风云再起2012668 | 来源：互联网 | 2023-09-18 16:55

在介绍FastR-CNN之前我们先介绍一下SPPNet一、SPPNetSPP：SpatialPyramidPooling（空间金字塔池化）众所周知，CNN一般都含有卷积部分和全连

在介绍Fast R-CNN之前我们先介绍一下SPP Net

一、SPP Net

SPP：Spatial Pyramid Pooling（空间金字塔池化）

众所周知，CNN一般都含有卷积部分和全连接部分，其中，卷积层不需要固定尺寸的图像，而全连接层是需要固定大小的输入。

所以当全连接层面对各种尺寸的输入数据时，就需要对输入数据进行crop（crop就是从一个大图扣出网络输入大小的patch，比如227×227），或warp（把一个边界框bounding box的内容resize成227×227）等一系列操作以统一图片的尺寸大小，比如224*224（ImageNet）、32*32(LenNet)、96*96等。

所以，在R-CNN中，才会将每个Region Proposal缩放成（wrap）成统一的227x227并输入到CNN。

但warp/crop这种预处理，导致问题要么被拉伸变形，要么物体不全，限制了识别精确度。换句话说，一张16:9的图片硬是被resize成1:1，你说图片失真不？

二、SPP Net的特点

1. SPP不在限制输入图像的尺度，在最后一个卷积层，接入了金字塔池化，保证传到下一层全连接层的输入固定。

简言之，CNN原本只能固定输入，固定输出，CNN加上SPP之后，便能任意输入、固定输出。

ROI池化层一般跟在卷积层后面，此时网络的输入可以是任意尺度的，在SPP layer中每一个pooling的filter会根据输入调整大小，而SPP的输出是固定维数的向量，然后给到全连接FC层。

2. 只对原图提取一次卷积特征，得到整张图的卷积特征feature map，然后找到每个候选框在feature map上的映射patch，将次patch作为每个候选框的卷积特征输入到SPP layer和之后的层，完成特征提取工作。节省了大量的时间，比R-CNN有100倍左右的提速

三、Fast R-CNN

Fast R-CNN就是在R-CNN的基础上采纳了SPP Net的方法，使得性能进一步提高。

与R-CNN相比，Fast R-CNN主要有两点不同：一是最后一个卷积层加入了ROI pooling layer，二是损失函数使用了多任务损失函数（multi-task loss），将边框回归Bounding Box Regression直接加入到CNN网络中训练

（1）ROI pooling layer实际上是SPP Net的一个精简版，SPP Net对每个proposal使用了不同大小的金字塔映射，而ROI pooling layer只需要采样到一个7x7的特征图。对于VGG16网络conv5_3有512个特征图，这样所有region proposal对应了一个7*7*512维度的特征向量作为全连接层的输入。也就是说，它可以把不同大小的输入映射到一个固定尺度的特征向量。

（2）R-CNN训练过程分为了三个阶段，而Fast R-CNN直接使用了softmax替代SVM分类，同时利用多任务损失函数边框回归也加入到网络中，整个训练过程就是端到端的（region proposal提取除外）

也就是说，R-CNN的处理流程是先提proposal，然后CNN提取特征，之后用SVM分类器，最后再做box regression。而在Fast R-CNN中，把box regression与region分类合并成multi-task模型，实际实验也证明，这两个任务能够共享卷积特征，并相互促进。

原来的方法：许多候选框（比如2k个）-->CNN-->得到每个候选框的特征-->分类 + 回归

现在的方法：一张完整的图片-->CNN-->得到每个候选框的特征-->分类 + 回归

容易看出，提速的原因在于，不像R-CNN把每个候选区域给深度网络提特征，而是整张图提一次特征，再把候选框映射到conv5上，而SPP只需要计算一次特征，剩下的只需要在conv5层上操作就可以了。

性能上的提升也是明显的：

参考地址：

https://cloud.tencent.com/developer/news/281788

推荐阅读

io
浏览器中的异常检测算法及其在深度学习中的应用

本文介绍了在浏览器中进行异常检测的算法，包括统计学方法和机器学习方法，并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测，可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率，而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]

蜡笔小新 2023-12-12 16:22:39
io
阿里Treebased Deep Match(TDM) 学习笔记及技术发展回顾

本文介绍了阿里Treebased Deep Match(TDM)的学习笔记，同时回顾了工业界技术发展的几代演进。从基于统计的启发式规则方法到基于内积模型的向量检索方法，再到引入复杂深度学习模型的下一代匹配技术。文章详细解释了基于统计的启发式规则方法和基于内积模型的向量检索方法的原理和应用，并介绍了TDM的背景和优势。最后，文章提到了向量距离和基于向量聚类的索引结构对于加速匹配效率的作用。本文对于理解TDM的学习过程和了解匹配技术的发展具有重要意义。 ... [详细]

蜡笔小新 2023-12-14 19:24:58
io
【论文】ICLR 2020 九篇满分论文！！！

点击上方，选择星标或置顶，每天给你送干货！阅读大概需要11分钟跟随小博主，每天进步一丢丢来自：深度学习技术前沿 ... [详细]

蜡笔小新 2023-10-17 18:45:53
io
【机器学习】生成式对抗网络模型综述

生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型，可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]

蜡笔小新 2023-12-14 17:51:18
io
Android开发笔记：使用Picasso加载网络图片等比例缩放

在Android开发中，使用Picasso库可以实现对网络图片的等比例缩放。本文介绍了使用Picasso库进行图片缩放的方法，并提供了具体的代码实现。通过获取图片的宽高，计算目标宽度和高度，并创建新图实现等比例缩放。 ... [详细]

蜡笔小新 2023-12-14 17:34:00
io
云原生边缘计算之KubeEdge简介及功能特点

本文介绍了云原生边缘计算中的KubeEdge系统，该系统是一个开源系统，用于将容器化应用程序编排功能扩展到Edge的主机。它基于Kubernetes构建，并为网络应用程序提供基础架构支持。同时，KubeEdge具有离线模式、基于Kubernetes的节点、群集、应用程序和设备管理、资源优化等特点。此外，KubeEdge还支持跨平台工作，在私有、公共和混合云中都可以运行。同时，KubeEdge还提供数据管理和数据分析管道引擎的支持。最后，本文还介绍了KubeEdge系统生成证书的方法。 ... [详细]

蜡笔小新 2023-12-14 16:49:01
io
Java工具类库Hutool介绍及功能概述

本文介绍了Java工具类库Hutool，该工具包封装了对文件、流、加密解密、转码、正则、线程、XML等JDK方法的封装，并提供了各种Util工具类。同时，还介绍了Hutool的组件，包括动态代理、布隆过滤、缓存、定时任务等功能。该工具包可以简化Java代码，提高开发效率。 ... [详细]

蜡笔小新 2023-12-14 14:29:36
io
sklearn数据集库中的常用数据集类型介绍

本文介绍了sklearn数据集库中常用的数据集类型，包括玩具数据集和样本生成器。其中详细介绍了波士顿房价数据集，包含了波士顿506处房屋的13种不同特征以及房屋价格，适用于回归任务。 ... [详细]

蜡笔小新 2023-12-13 17:45:15
io
也就是|小窗_卷积的特征提取与参数计算

篇首语：本文由编程笔记#小编为大家整理，主要介绍了卷积的特征提取与参数计算相关的知识，希望对你有一定的参考价值。Dense和Conv2D根本区别在于，Den ... [详细]

蜡笔小新 2023-12-13 12:59:48
io
计算成像的原理与应用研究

本文探讨了计算成像的原理与应用研究。首先介绍了小孔成像实验和软件方面的相关内容。随后从傅里叶光学的角度简单谈了成像的过程。成像是观测样品分布的一种方法，通过成像系统接收光的强度来呈现图像。视网膜作为接收端接收到的图像实际上是由像元组成的矩阵，每个元素代表相应位置像元接收光的强度。大脑通过对图像的分析，得出一系列信息，如识别物体、判断距离等。计算成像是一种采集记录系统，通过处理数据得到样品分布与像的对应关系，用于后续问题的分析。 ... [详细]

蜡笔小新 2023-12-13 11:40:23
io
抽空写了一个ICON图标的转换程序

抽空写了一个ICON图标的转换程序，支持png\jpe\bmp格式到ico的转换。具体的程序就在下面，如果看的人多，过两天再把思路写一下。 ... [详细]

蜡笔小新 2023-10-17 22:04:30
io
cs231n Lecture 3 线性分类笔记（一）

内容列表线性分类器简介线性评分函数阐明线性分类器损失函数多类SVMSoftmax分类器SVM和Softmax的比较基于Web的可交互线性分类器原型小结注：中文翻译 ... [详细]

蜡笔小新 2023-10-17 19:40:56
io
PRML读书会第十四章 Combining Models（committees，Boosting，AdaBoost，决策树，条件混合模型）...

主讲人网神（新浪微博:豆角茄子麻酱凉面）网神(66707180)18:57:18大家好，今天我们讲一下第14章combiningmodel ... [详细]

蜡笔小新 2023-10-17 17:04:24
io
03 基于纹理特征的人脸活体检测01

1.活体相关文献综述调研参考：https:blog.csdn.netCVAIDLarticledetails845673192.基于LBP纹理特征的检测1）基于LBP_256特征提 ... [详细]

蜡笔小新 2023-10-16 08:40:17
io
机器学习之数据均衡算法种类大全+Python代码一文详解

目录前言一、为什么要做数据均衡？二、数据场景1.大数据分布不均衡2.小数据分布不均衡三、均衡算法类型1.过采样2.欠采样3.组合采样四、算法具体种类1 ... [详细]

蜡笔小新 2023-10-15 23:34:41

风云再起2012668

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章