开源KerasFasterRCNN模型介绍及代码结构解析

作者：手机用户2502853923 | 来源：互联网 | 2023-12-10 17:44

本文介绍了开源KerasFasterRCNN模型的环境需求和代码结构，包括FasterRCNN源码解析、RPN与classifier定义、data_generators.py文件的功能以及损失计算。同时提供了该模型的开源地址和安装所需的库。

开源Keras Faster RCNN 模型介绍

1. 环境需求
2. keras Faster RCNN代码结构
3. FaterRCNN源码解析
4. RPN 与 classifier定义
5. data_generators.py:传递图像参数&＃xff0c;增广配置参数&＃xff0c;是否进行图像增广
6. 损失计算 losses.py

开源Keras Faster RCNN 模型地址&＃xff1a;https://github.com/jinfagang/keras_frcnn

1. 环境需求

1、由于该源代码由keras单独库编写所以需要下载keras,必须是2.0.3版本

pip install keras&＃61;&＃61;2.0.3

2、该源码读取图片以及处理图片标记图片工具使用opecv需要安装

pip install opencv-python
2. keras Faster RCNN代码结构

源码组成结构&＃xff1a;

在这里插入图片描述

3. FaterRCNN源码解析

detector&＃xff1a;FasterRCNNDetector目标检测器代码

img_input &＃61; Input(shape&＃61;input_shape_img)roi_input &＃61; Input(shape&＃61;(None, 4))# define the base network (resnet here, can be VGG, Inception, etc)shared_layers &＃61; nn.nn_base(img_input, trainable&＃61;True)# define the RPN, built on the base layersnum_anchors &＃61; len(cfg.anchor_box_scales) * len(cfg.anchor_box_ratios)rpn &＃61; nn.rpn(shared_layers, num_anchors)classifier &＃61; nn.classifier(shared_layers, roi_input, cfg.num_rois, nb_classes&＃61;len(classes_count), trainable&＃61;True)model_rpn &＃61; Model(img_input, rpn[:2])model_classifier &＃61; Model([img_input, roi_input], classifier)# this is a model that holds both the RPN and the classifier, used to load/save weights for the modelsmodel_all &＃61; Model([img_input, roi_input], rpn[:2] &＃43; classifier)try:print(&＃39;loading weights from {}&＃39;.format(cfg.base_net_weights))model_rpn.load_weights(cfg.model_path, by_name&＃61;True)model_classifier.load_weights(cfg.model_path, by_name&＃61;True)except Exception as e:print(e)print(&＃39;Could not load pretrained model weights. Weights can be found in the keras application folder &＃39;&＃39;https://github.com/fchollet/keras/tree/master/keras/applications&＃39;)optimizer &＃61; Adam(lr&＃61;1e-5)optimizer_classifier &＃61; Adam(lr&＃61;1e-5)model_rpn.compile(optimizer&＃61;optimizer,loss&＃61;[losses_fn.rpn_loss_cls(num_anchors), losses_fn.rpn_loss_regr(num_anchors)])model_classifier.compile(optimizer&＃61;optimizer_classifier,loss&＃61;[losses_fn.class_loss_cls, losses_fn.class_loss_regr(len(classes_count) - 1)],metrics&＃61;{&＃39;dense_class_{}&＃39;.format(len(classes_count)): &＃39;accuracy&＃39;})model_all.compile(optimizer&＃61;&＃39;sgd&＃39;, loss&＃61;&＃39;mae&＃39;)
4. RPN 与 classifier定义

RPN结构

def rpn(base_layers, num_anchors):x &＃61; Convolution2D(512, (3, 3), padding&＃61;&＃39;same&＃39;, activation&＃61;&＃39;relu&＃39;, kernel_initializer&＃61;&＃39;normal&＃39;, name&＃61;&＃39;rpn_conv1&＃39;)(base_layers)x_class &＃61; Convolution2D(num_anchors, (1, 1), activation&＃61;&＃39;sigmoid&＃39;, kernel_initializer&＃61;&＃39;uniform&＃39;,name&＃61;&＃39;rpn_out_class&＃39;)(x)x_regr &＃61; Convolution2D(num_anchors * 4, (1, 1), activation&＃61;&＃39;linear&＃39;, kernel_initializer&＃61;&＃39;zero&＃39;,name&＃61;&＃39;rpn_out_regress&＃39;)(x)return [x_class, x_regr, base_layers]

classifier结构

def classifier(base_layers, input_rois, num_rois, nb_classes&＃61;21, trainable&＃61;False):# compile times on theano tend to be very high, so we use smaller ROI pooling regions to workaroundif K.backend() &＃61;&＃61; &＃39;tensorflow&＃39;:pooling_regions &＃61; 14input_shape &＃61; (num_rois, 14, 14, 1024)elif K.backend() &＃61;&＃61; &＃39;theano&＃39;:pooling_regions &＃61; 7input_shape &＃61; (num_rois, 1024, 7, 7)# ROI pooling计算定义out_roi_pool &＃61; RoiPoolingConv(pooling_regions, num_rois)([base_layers, input_rois])out &＃61; classifier_layers(out_roi_pool, input_shape&＃61;input_shape, trainable&＃61;True)out &＃61; TimeDistributed(Flatten())(out)# 分类out_class &＃61; TimeDistributed(Dense(nb_classes, activation&＃61;&＃39;softmax&＃39;, kernel_initializer&＃61;&＃39;zero&＃39;),name&＃61;&＃39;dense_class_{}&＃39;.format(nb_classes))(out)# note: no regression target for bg class# 回归out_regr &＃61; TimeDistributed(Dense(4 * (nb_classes - 1), activation&＃61;&＃39;linear&＃39;, kernel_initializer&＃61;&＃39;zero&＃39;),name&＃61;&＃39;dense_regress_{}&＃39;.format(nb_classes))(out)return [out_class, out_regr]
5. data_generators.py:传递图像参数&＃xff0c;增广配置参数&＃xff0c;是否进行图像增广

IoU计算&＃xff1a;

from __future__ import absolute_import import numpy as np import cv2 import random import copy from . import data_augment import threading import itertools#并集 def union(au, bu, area_intersection):area_a &＃61; (au[2] - au[0]) * (au[3] - au[1])area_b &＃61; (bu[2] - bu[0]) * (bu[3] - bu[1])area_union &＃61; area_a &＃43; area_b - area_intersectionreturn area_union#交集 def intersection(ai, bi):x &＃61; max(ai[0], bi[0])y &＃61; max(ai[1], bi[1])w &＃61; min(ai[2], bi[2]) - xh &＃61; min(ai[3], bi[3]) - yif w < 0 or h < 0:return 0return w*h#交并比 def iou(a, b):# a and b should be (x1,y1,x2,y2)if a[0] >&＃61; a[2] or a[1] >&＃61; a[3] or b[0] >&＃61; b[2] or b[1] >&＃61; b[3]:return 0.0area_i &＃61; intersection(a, b)area_u &＃61; union(a, b, area_i)return float(area_i) / float(area_u &＃43; 1e-6)
6. 损失计算 losses.py

rpn的损失回归和分类

def rpn_loss_regr(num_anchors):def rpn_loss_regr_fixed_num(y_true, y_pred):if K.image_dim_ordering() &＃61;&＃61; &＃39;th&＃39;:x &＃61; y_true[:, 4 * num_anchors:, :, :] - y_predx_abs &＃61; K.abs(x)x_bool &＃61; K.less_equal(x_abs, 1.0)return lambda_rpn_regr * K.sum(y_true[:, :4 * num_anchors, :, :] * (x_bool * (0.5 * x * x) &＃43; (1 - x_bool) * (x_abs - 0.5))) / K.sum(epsilon &＃43; y_true[:, :4 * num_anchors, :, :])else:x &＃61; y_true[:, :, :, 4 * num_anchors:] - y_predx_abs &＃61; K.abs(x)x_bool &＃61; K.cast(K.less_equal(x_abs, 1.0), tf.float32)return lambda_rpn_regr * K.sum(y_true[:, :, :, :4 * num_anchors] * (x_bool * (0.5 * x * x) &＃43; (1 - x_bool) * (x_abs - 0.5))) / K.sum(epsilon &＃43; y_true[:, :, :, :4 * num_anchors])return rpn_loss_regr_fixed_numdef rpn_loss_cls(num_anchors):def rpn_loss_cls_fixed_num(y_true, y_pred):if K.image_dim_ordering() &＃61;&＃61; &＃39;tf&＃39;:return lambda_rpn_class * K.sum(y_true[:, :, :, :num_anchors] * K.binary_crossentropy(y_pred[:, :, :, :], y_true[:, :, :, num_anchors:])) / K.sum(epsilon &＃43; y_true[:, :, :, :num_anchors])else:return lambda_rpn_class * K.sum(y_true[:, :num_anchors, :, :] * K.binary_crossentropy(y_pred[:, :, :, :], y_true[:, num_anchors:, :, :])) / K.sum(epsilon &＃43; y_true[:, :num_anchors, :, :])return rpn_loss_cls_fixed_num

fastrcnn的分类和回归

def class_loss_regr(num_classes):def class_loss_regr_fixed_num(y_true, y_pred):x &＃61; y_true[:, :, 4*num_classes:] - y_predx_abs &＃61; K.abs(x)x_bool &＃61; K.cast(K.less_equal(x_abs, 1.0), &＃39;float32&＃39;)return lambda_cls_regr * K.sum(y_true[:, :, :4*num_classes] * (x_bool * (0.5 * x * x) &＃43; (1 - x_bool) * (x_abs - 0.5))) / K.sum(epsilon &＃43; y_true[:, :, :4*num_classes])return class_loss_regr_fixed_numdef class_loss_cls(y_true, y_pred):return lambda_cls_class * K.mean(categorical_crossentropy(y_true[0, :, :], y_pred[0, :, :]))

加油!

感谢!

努力!

推荐阅读

filter
Python使用Pillow包生成验证码图片的方法

本文介绍了使用Python中的Pillow包生成验证码图片的方法。通过随机生成数字和符号，并添加干扰象素，生成一幅验证码图片。需要配置好Python环境，并安装Pillow库。代码实现包括导入Pillow包和随机模块，定义随机生成字母、数字和字体颜色的函数。 ... [详细]

蜡笔小新 2023-12-10 16:51:25
blob
sklearn数据集库中的常用数据集类型介绍

本文介绍了sklearn数据集库中常用的数据集类型，包括玩具数据集和样本生成器。其中详细介绍了波士顿房价数据集，包含了波士顿506处房屋的13种不同特征以及房屋价格，适用于回归任务。 ... [详细]

蜡笔小新 2023-12-13 17:45:15
install
基于dlib的人脸68特征点提取(眨眼张嘴检测)python版本

文章目录引言开发环境和库流程设计张嘴和闭眼的检测引言(1)利用Dlib官方训练好的模型“shape_predictor_68_face_landmarks.dat”进行68个点标定 ... [详细]

蜡笔小新 2023-12-12 13:27:42
python
EzPP 0.2发布，新增YAML布局渲染功能

EzPP发布了0.2.1版本，新增了YAML布局渲染功能，可以将YAML文件渲染为图片，并且可以复用YAML作为模版，通过传递不同参数生成不同的图片。这个功能可以用于绘制Logo、封面或其他图片，让用户不需要安装或卸载Photoshop。文章还提供了一个入门例子，介绍了使用ezpp的基本渲染方法，以及如何使用canvas、text类元素、自定义字体等。 ... [详细]

蜡笔小新 2023-12-11 12:39:10
future
协程greenletyieldasyncioasync / await协程意义异步编程事件循环快速上手awaitTask对象

本文介绍了协程的概念和意义，以及使用greenlet、yield、asyncio、async/await等技术实现协程编程的方法。同时还介绍了事件循环的作用和使用方法，以及如何使用await关键字和Task对象来实现异步编程。最后还提供了一些快速上手的示例代码。 ... [详细]

蜡笔小新 2023-12-09 01:35:03
future
使用FLASK REST API的机器学习模型

在本教程中，我们将看到如何使用FLASK制作第一个用于机器学习模型的RESTAPI。我们将从创建机器学习模型开始。然后，我们将看到使用Flask创建AP ... [详细]

蜡笔小新 2023-10-17 19:13:12
hash
查找给定字符串的所有不同回文子字符串

查找给定字符串的所有不同回文子字符串原文:https://www ... [详细]

蜡笔小新 2023-10-17 19:11:18
python
python字符串随机生成密码_Mac OS生成随机密码的Python脚本

很多时候在注册一些比较重要的帐号，或者使用一些比较重要的接口的时候，需要使用到随机字符串，为了方便，我们设计这个脚本需要注意 ... [详细]

蜡笔小新 2023-10-17 18:20:12
range
利用PyTorch快速实现分类任务

关于如何快速定义自己的数据集，可以参考我的前一篇文章PyTorch中快速加载自定义数据（入门）_晨曦473的博客-CSDN博客刚开始学习P ... [详细]

蜡笔小新 2023-10-17 18:12:24
python
[翻译]PyCairo指南裁剪和masking

裁剪和masking在PyCairo指南的这个部分，我么将讨论裁剪和masking操作。裁剪裁剪就是将图形的绘制限定在一定的区域内。这样做有一些效率的因素࿰ ... [详细]

蜡笔小新 2023-10-17 17:18:21
future
Netty拆包粘包问题解决 —— 特殊结束符

本文介绍了解决Netty拆包粘包问题的一种方法——使用特殊结束符。在通讯过程中，客户端和服务器协商定义一个特殊的分隔符号，只要没有发送分隔符号，就代表一条数据没有结束。文章还提供了服务端的示例代码。 ... [详细]

蜡笔小新 2023-12-14 18:02:45
md5
开发笔记:加密&json&StringIO模块&BytesIO模块

篇首语：本文由编程笔记#小编为大家整理，主要介绍了加密&json&StringIO模块&BytesIO模块相关的知识，希望对你有一定的参考价值。一、加密加密 ... [详细]

蜡笔小新 2023-12-14 15:18:35
jsp
求解hdu 1003 java题目的动态规划优化方法

本文讨论了如何优化解决hdu 1003 java题目的动态规划方法，通过分析加法规则和最大和的性质，提出了一种优化的思路。具体方法是，当从1加到n为负时，即sum(1,n)sum(n,s)，可以继续加法计算。同时，还考虑了两种特殊情况：都是负数的情况和有0的情况。最后，通过使用Scanner类来获取输入数据。 ... [详细]

蜡笔小新 2023-12-14 13:11:00
filter
也就是|小窗_卷积的特征提取与参数计算

篇首语：本文由编程笔记#小编为大家整理，主要介绍了卷积的特征提取与参数计算相关的知识，希望对你有一定的参考价值。Dense和Conv2D根本区别在于，Den ... [详细]

蜡笔小新 2023-12-13 12:59:48
substring
Html5-Canvas实现简易的抽奖转盘效果

本文介绍了如何使用Html5和Canvas标签来实现简易的抽奖转盘效果，同时使用了jQueryRotate.js旋转插件。文章中给出了主要的html和css代码，并展示了实现的基本效果。 ... [详细]

蜡笔小新 2023-12-13 06:02:20

手机用户2502853923

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章