目标窗口检测算法NMS非极大值抑制

作者：davychen | 来源：互联网 | 2023-10-10 18:56

YOLO在最后的一个步骤就是对SxSx(Bx5C)个向量进行非极大值抑制（Non-maxsuppression），一开始不是太明白非极大值

YOLO在最后的一个步骤就是对 SxSx(Bx5&＃43;C) 个向量进行非极大值抑制&＃xff08;Non-max suppression&＃xff09;&＃xff0c;一开始不是太明白非极大值抑制是如何操作的&＃xff0c;也就是不太清楚YOLO最后做完卷积后如何对求得向量进行预测&＃xff0c;求得目标框位置。

对YOLO代码分析完之后对其他步骤操作有了一个大致的认识之后&＃xff0c;回顾最后一步非极大值抑制&＃xff0c;发现非极大值抑制在R-CNN、Fast-RCNN都有用到的同样的概念&＃xff0c;因此YOLO的论文并没有提到如何进行非极大值抑制。

其实在物体检测领域当中&＃xff0c;非极大值抑制应用十分广泛&＃xff0c;目的是为了消除多余的框&＃xff0c;找到最佳的物体检测的位置。那么具体如何操作呢&＃xff1f;如下图所示&＃xff0c;有三个boundingbox&＃xff0c;其中第一个绿色boundingbox的置信度是0.7&＃xff0c;第二个绿色boundingbox的置信度是0.6&＃xff0c;第三个绿色boundingbox的置信度是0.7。非极大值抑制就是在这三个框当中选出置信度最高&＃xff0c;且最有可能代表是目标的boundingbox。
NMS算法思路来源于&＃xff1a;https://chenzomi12.github.io/2016/12/14/YOLO-nms/在这里插入图片描述
为了研究透NMS到底是如何操作的&＃xff0c;我来随机定义了4个窗口&＃xff0c;置信度分别是[0.5, 0.7, 0.6, 0.7]&＃xff0c;对应上图的多了一个方框。算法的核心&＃xff1a;

把置信度最高的一个boundingbox(bbox)作为目标&＃xff0c;然后对比剩下bbox与目标bbox之间的交叉区域
如果交叉区域大于设定的阈值&＃xff0c;那么在剩下的bbox中去除该bbox&＃xff08;即使该bbox的置信度与目标bbox的置信度一样&＃xff09;—-这个操作就是抑制最大重叠区域
把第二置信度高的bbox作为目标&＃xff0c;重复1、2

dets &＃61; np.array([
[204, 102, 358, 250, 0.5],
[257, 118, 380, 250, 0.7],
[280, 135, 400, 250, 0.6],
[255, 118, 360, 235, 0.7]
])

thresh &＃61; 0.3

import numpy as np

def py_cpu_nms(dets, thresh):
“”“Pure Python NMS baseline.”""
x1 &＃61; dets[:, 0]
y1 &＃61; dets[:, 1]
x2 &＃61; dets[:, 2]
y2 &＃61; dets[:, 3]
scores &＃61; dets[:, 4]

areas &＃61; (x2 - x1 &＃43; 1) * (y2 - y1 &＃43; 1) order &＃61; scores.argsort()[::-1]keep &＃61; [] while order.size > 0:i &＃61; order[0]keep.append(i)xx1 &＃61; np.maximum(x1[i], x1[order[1:]])yy1 &＃61; np.maximum(y1[i], y1[order[1:]])xx2 &＃61; np.minimum(x2[i], x2[order[1:]])yy2 &＃61; np.minimum(y2[i], y2[order[1:]])w &＃61; np.maximum(0.0, xx2 - xx1 &＃43; 1)h &＃61; np.maximum(0.0, yy2 - yy1 &＃43; 1)inter &＃61; w * hovr &＃61; inter / (areas[i] &＃43; areas[order[1:]] - inter)inds &＃61; np.where(ovr <&＃61; thresh)[0]order &＃61; order[inds &＃43; 1]return keep

最后的效果就是得到开始定义的4个bbox中的第4个(3):
![NMS算法思路来源于&＃xff1a;https://chenzomi12.github.io/2016/12/14/YOLO-nms/] 在这里插入图片描述

推荐阅读

io
微软头条实习生分享深度学习自学指南

本文介绍了一位微软头条实习生自学深度学习的经验分享，包括学习资源推荐、重要基础知识的学习要点等。作者强调了学好Python和数学基础的重要性，并提供了一些建议。 ... [详细]

蜡笔小新 2023-12-14 20:58:32
io
云原生边缘计算之KubeEdge简介及功能特点

本文介绍了云原生边缘计算中的KubeEdge系统，该系统是一个开源系统，用于将容器化应用程序编排功能扩展到Edge的主机。它基于Kubernetes构建，并为网络应用程序提供基础架构支持。同时，KubeEdge具有离线模式、基于Kubernetes的节点、群集、应用程序和设备管理、资源优化等特点。此外，KubeEdge还支持跨平台工作，在私有、公共和混合云中都可以运行。同时，KubeEdge还提供数据管理和数据分析管道引擎的支持。最后，本文还介绍了KubeEdge系统生成证书的方法。 ... [详细]

蜡笔小新 2023-12-14 16:49:01
io
提升Python编程效率的十点建议

本文介绍了提升Python编程效率的十点建议，包括不使用分号、选择合适的代码编辑器、遵循Python代码规范等。这些建议可以帮助开发者节省时间，提高编程效率。同时，还提供了相关参考链接供读者深入学习。 ... [详细]

蜡笔小新 2023-12-14 21:51:04
io
logistic回归（线性和非线性）的开发笔记

本文由编程笔记#小编为大家整理，主要介绍了logistic回归（线性和非线性）相关的知识，包括线性logistic回归的代码和数据集的分布情况。希望对你有一定的参考价值。 ... [详细]

蜡笔小新 2023-12-14 21:40:43
io
解决Docker中volume的权限问题的方法

在Docker中，将主机目录挂载到容器中作为volume使用时，常常会遇到文件权限问题。这是因为容器内外的UID不同所导致的。本文介绍了解决这个问题的方法，包括使用gosu和suexec工具以及在Dockerfile中配置volume的权限。通过这些方法，可以避免在使用Docker时出现无写权限的情况。 ... [详细]

蜡笔小新 2023-12-14 18:48:02
io
YOLOv7基于自己的数据集从零构建模型完整训练、推理计算超详细教程

本文介绍了关于人工智能、神经网络和深度学习的知识点，并提供了YOLOv7基于自己的数据集从零构建模型完整训练、推理计算的详细教程。文章还提到了郑州最低生活保障的话题。对于从事目标检测任务的人来说，YOLO是一个熟悉的模型。文章还提到了yolov4和yolov6的相关内容，以及选择模型的优化思路。 ... [详细]

蜡笔小新 2023-12-14 18:28:01
python
Python3中选择文件对话框的格式打开和保存图片

本文介绍了在Python3中如何使用选择文件对话框的格式打开和保存图片的方法。通过使用tkinter库中的filedialog模块的asksaveasfilename和askopenfilename函数，可以方便地选择要打开或保存的图片文件，并进行相关操作。具体的代码示例和操作步骤也被提供。 ... [详细]

蜡笔小新 2023-12-14 17:46:55
io
Android开发笔记：使用Picasso加载网络图片等比例缩放

在Android开发中，使用Picasso库可以实现对网络图片的等比例缩放。本文介绍了使用Picasso库进行图片缩放的方法，并提供了具体的代码实现。通过获取图片的宽高，计算目标宽度和高度，并创建新图实现等比例缩放。 ... [详细]

蜡笔小新 2023-12-14 17:34:00
io
向QTextEdit拖放文件的方法及实现步骤

本文介绍了在使用QTextEdit时如何实现拖放文件的功能，包括相关的方法和实现步骤。通过重写dragEnterEvent和dropEvent函数，并结合QMimeData和QUrl等类，可以轻松实现向QTextEdit拖放文件的功能。详细的代码实现和说明可以参考本文提供的示例代码。 ... [详细]

蜡笔小新 2023-12-14 16:06:38
io
开发笔记:加密&json&StringIO模块&BytesIO模块

篇首语：本文由编程笔记#小编为大家整理，主要介绍了加密&json&StringIO模块&BytesIO模块相关的知识，希望对你有一定的参考价值。一、加密加密 ... [详细]

蜡笔小新 2023-12-14 15:18:35
io
Centos7.6安装Gitlab教程及注意事项

本文介绍了在Centos7.6系统下安装Gitlab的详细教程，并提供了一些注意事项。教程包括查看系统版本、安装必要的软件包、配置防火墙等步骤。同时，还强调了使用阿里云服务器时的特殊配置需求，以及建议至少4GB的可用RAM来运行GitLab。 ... [详细]

蜡笔小新 2023-12-14 14:01:06
io
[译]技术公司十年经验的职场生涯回顾

本文是一位在技术公司工作十年的职场人士对自己职业生涯的总结回顾。她的职业规划与众不同，令人深思又有趣。其中涉及到的内容有机器学习、创新创业以及引用了女性主义者在TED演讲中的部分讲义。文章表达了对职业生涯的愿望和希望，认为人类有能力不断改善自己。 ... [详细]

蜡笔小新 2023-12-14 11:31:05
io
baresip android编译、运行教程1语音通话

本文介绍了如何在安卓平台上编译和运行baresip android，包括下载相关的sdk和ndk，修改ndk路径和输出目录，以及创建一个c++的安卓工程并将目录考到cpp下。详细步骤可参考给出的链接和文档。 ... [详细]

蜡笔小新 2023-12-14 10:53:48
io
使用 Ubuntu 中的 Python 获取浏览器历史记录

使用Ubuntu中的Python获取浏览器历史记录原文: ... [详细]

蜡笔小新 2023-12-14 08:57:59
python
无损压缩算法专题——LZSS算法实现

本文介绍了基于无损压缩算法专题的LZSS算法实现。通过Python和C两种语言的代码实现了对任意文件的压缩和解压功能。详细介绍了LZSS算法的原理和实现过程，以及代码中的注释。 ... [详细]

蜡笔小新 2023-12-13 19:47:31

davychen

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章