当前位置: 开发笔记 > 编程语言 > 正文

Python OpenCV机器学习之图像识别详解

作者：LD系瑰精棂_142 | 来源：互联网 | 2023-06-23 23:55

OpenCV中也提供了一些机器学习的方法，例如DNN等。本文将为大家详细介绍一下OpenCV中利用机器学习实现的一些图片识别功能：人脸识别、车牌识别等，

背景

OpenCV中也提供了一些机器学习的方法，例如DNN；本篇将简单介绍一下机器学习的一些应用，对比传统和前沿的算法，能从其中看出优劣；

一、人脸识别

主要有以下两种实现方法：

1、哈尔（Haar）级联法：专门解决人脸识别而推出的传统算法；

实现步骤：

创建Haar级联器；

导入图片并将其灰度化；

调用函数接口进行人脸识别；

函数原型：

detectMultiScale（img，scaleFactor，minNeighbors）

scaleFactor：缩放尺寸；

minNeighbors：最小像素值；

代码案例：

# 创建Haar级联器
facer = cv2.CascadeClassifier("./haarcascades/haarcascade_frontalface_default.xml")
# 导入人脸图片并灰度化
img = cv2.imread("p3.png")
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
# 调用接口
faces = facer.detectMultiScale(gray, 1.1, 5)

for (x,y,w,h) in faces:
    cv2.rectangle(img, (x,y), (x+w, y+h), (0,0,255), 2)

cv2.imshow("img", img)
cv2.waitKey()

结论：Haar级联法对于完整脸部的检测效果还是不错的，但对于不完整脸部识别效果差，这可能也是传统算法的一个缺陷所在，泛化能力比较差；

拓展：Haar级联器还可以对脸部中细节特征进行识别

代码如下：

# 创建Haar级联器
facer = cv2.CascadeClassifier("./haarcascades/haarcascade_frontalface_default.xml")
eyer = cv2.CascadeClassifier("./haarcascades/haarcascade_eye.xml")
# 导入人脸图片并灰度化
img = cv2.imread("p3.png")
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
# 调用接口
faces = facer.detectMultiScale(gray, 1.1, 5)
i = 0
for (x,y,w,h) in faces:
    cv2.rectangle(img, (x,y), (x+w, y+h), (0,0,255), 2)
    ROI_img = img[y:y+h, x:x+w]
    eyes = eyer.detectMultiScale(ROI_img, 1.1, 5)
    for (x,y,w,h) in eyes:
        cv2.rectangle(ROI_img, (x,y), (x+w, y+h), (0,255,0), 2)
    i += 1
    name = "img"+str(i)
    cv2.imshow(name, ROI_img)
cv2.waitKey()

总结：Haar级联器提供了多种脸部属性的识别，眼睛鼻子嘴巴都可以，但效果不一定那么准确；

二、车牌识别

结构：Haar+Tesseract车牌识别；

说明：Haar级联器仅用于定位车牌的位置，Tesseract用于提取其中的内容；

实现步骤：

1、Haar级联器定位车牌位置；

2、车牌预处理操作（二值化、形态学、滤波去噪、缩放）；

3、调用Tesseract进行文字识别；

注意：这里需要预先安装Tesseract；

代码案例：

import pytesseract
# 创建Haar级联器
carer = cv2.CascadeClassifier("./haarcascades/haarcascade_russian_plate_number.xml")
# 导入人脸图片并灰度化
img = cv2.imread("chinacar.jpeg")
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
# 调用接口 
cars = carer.detectMultiScale(gray, 1.1, 3)
for (x,y,w,h) in cars:
    cv2.rectangle(img, (x,y), (x+w, y+h), (0,0,255), 2)
# 提取ROI
roi = gray[y:y+h, x:x+w]
# 二值化
ret, roi_bin = cv2.threshold(roi, 0, 255, cv2.THRESH_BINARY + cv2.THRESH_OTSU)
# 文字识别
pytesseract.pytesseract.tesseract_cmd = r"D:Tesseract_OCR	esseract.exe"
text = pytesseract.image_to_string(roi, lang="chi_sim+eng",cOnfig="--psm 8 --oem 3")
print(text)
cv2.putText(img, text, (20,100), cv2.FONT_HERSHEY_SIMPLEX, 2, (0,0,255), 3)
cv2.imshow("img", img)
cv2.waitKey()

结论：车牌的位置检测比较准确，但Tesseract的识别并不那么准确，可能用ORC识别会准确一些；当然识别的准确率也和图像处理后比较模糊有关，做一些处理能够提升文字的识别率；

三、DNN图像分类

DNN为深度神经网络，并且是全连接的形式；

注意：OpenCV能够使用DNN模型，但并不能训练；

DNN使用步骤：

读取模型，得到网络结构；

读取数据（图片或视频）

将图片转成张量，送入网络；

模型输出结果；

函数原型：

导入模型：readNet（model，[config]）

图像转张量：blobFromImage（image，scalefactor，size，mean，swapRB，crop）

送入网络：net.setInput（blob）

模型推理：net.forward（）

代码案例：

# 导入模型
cOnfig= "./model/bvlc_googlenet.prototxt"
model = "./model/bvlc_googlenet.caffemodel"
net = dnn.readNetFromCaffe(config, model)

# 加载图片，转成张量
img = cv2.imread("./smallcat.jpeg")
blob = dnn.blobFromImage(img, 1.0, (224,224), (104,117,123))

# 模型推理
net.setInput(blob)
r = net.forward()
idxs = np.argsort(r[0])[::-1][:5]

# 分类结果展示
path = "./model/synset_words.txt"
with open(path, "rt") as f:
    classes = [x[x.find(" ")+1:]for x in f]
for (i, idx) in enumerate(idxs):
# 将结果展示在图像上
    if i == 0:
        text = "Label: {}, {:.2f}%".format(classes[idx],
            r[0][idx] * 100)
        cv2.putText(img, text, (5, 25),  cv2.FONT_HERSHEY_SIMPLEX,
            0.7, (0, 0, 255), 2)
# 显示图像
cv2.imshow("Image", img)
cv2.waitKey(0)

结论：实际上有了模型之后，推理的步骤并不复杂，难点在于前处理与后处理；往往图像的处理上的错误，或者是对结果的处理问题，会导致结果不符，这是需要特别注意的；

到此这篇关于Python OpenCV机器学习之图像识别详解的文章就介绍到这了,更多相关OpenCV 图像识别内容请搜索编程笔记以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程笔记！

推荐阅读

go
【机器学习】生成式对抗网络模型综述

生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型，可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]

蜡笔小新 2023-12-14 17:51:18
ip
Android开发笔记：使用Picasso加载网络图片等比例缩放

在Android开发中，使用Picasso库可以实现对网络图片的等比例缩放。本文介绍了使用Picasso库进行图片缩放的方法，并提供了具体的代码实现。通过获取图片的宽高，计算目标宽度和高度，并创建新图实现等比例缩放。 ... [详细]

蜡笔小新 2023-12-14 17:34:00
go
sklearn数据集库中的常用数据集类型介绍

本文介绍了sklearn数据集库中常用的数据集类型，包括玩具数据集和样本生成器。其中详细介绍了波士顿房价数据集，包含了波士顿506处房屋的13种不同特征以及房屋价格，适用于回归任务。 ... [详细]

蜡笔小新 2023-12-13 17:45:15
js
浏览器中的异常检测算法及其在深度学习中的应用

本文介绍了在浏览器中进行异常检测的算法，包括统计学方法和机器学习方法，并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测，可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率，而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]

蜡笔小新 2023-12-12 16:22:39
go
在Mac上使用Pillow加载不同字体的示例

本文介绍了如何在Mac上使用Pillow库加载不同于默认字体和大小的字体，并提供了一个简单的示例代码。通过该示例，读者可以了解如何在Python中使用Pillow库来写入不同字体的文本。同时，本文也解决了在Mac上使用Pillow库加载字体时可能遇到的问题。读者可以根据本文提供的示例代码，轻松实现在Mac上使用Pillow库加载不同字体的功能。 ... [详细]

蜡笔小新 2023-12-11 18:33:06
go
[译]技术公司十年经验的职场生涯回顾

本文是一位在技术公司工作十年的职场人士对自己职业生涯的总结回顾。她的职业规划与众不同，令人深思又有趣。其中涉及到的内容有机器学习、创新创业以及引用了女性主义者在TED演讲中的部分讲义。文章表达了对职业生涯的愿望和希望，认为人类有能力不断改善自己。 ... [详细]

蜡笔小新 2023-12-14 11:31:05
go
也就是|小窗_卷积的特征提取与参数计算

篇首语：本文由编程笔记#小编为大家整理，主要介绍了卷积的特征提取与参数计算相关的知识，希望对你有一定的参考价值。Dense和Conv2D根本区别在于，Den ... [详细]

蜡笔小新 2023-12-13 12:59:48
ip
Python瓦片图下载、合并、绘图、标记的代码示例

本文提供了Python瓦片图下载、合并、绘图、标记的代码示例，包括下载代码、多线程下载、图像处理等功能。通过参考geoserver，使用PIL、cv2、numpy、gdal、osr等库实现了瓦片图的下载、合并、绘图和标记功能。代码示例详细介绍了各个功能的实现方法，供读者参考使用。 ... [详细]

蜡笔小新 2023-12-13 12:14:55
ip
计算成像的原理与应用研究

本文探讨了计算成像的原理与应用研究。首先介绍了小孔成像实验和软件方面的相关内容。随后从傅里叶光学的角度简单谈了成像的过程。成像是观测样品分布的一种方法，通过成像系统接收光的强度来呈现图像。视网膜作为接收端接收到的图像实际上是由像元组成的矩阵，每个元素代表相应位置像元接收光的强度。大脑通过对图像的分析，得出一系列信息，如识别物体、判断距离等。计算成像是一种采集记录系统，通过处理数据得到样品分布与像的对应关系，用于后续问题的分析。 ... [详细]

蜡笔小新 2023-12-13 11:40:23
ip
【机器学习手册】日期和时区操作的重要性及应用

本文介绍了机器学习手册中关于日期和时区操作的重要性以及其在实际应用中的作用。文章以一个故事为背景，描述了学童们面对老先生的教导时的反应，以及上官如在这个过程中的表现。同时，文章也提到了顾慎为对上官如的恨意以及他们之间的矛盾源于早年的结局。最后，文章强调了日期和时区操作在机器学习中的重要性，并指出了其在实际应用中的作用和意义。 ... [详细]

蜡笔小新 2023-12-12 17:40:14
ip
词袋模型的通俗介绍

词,袋, ... [详细]

蜡笔小新 2023-12-12 08:20:03
ip
Python张量流中的device spec make_merged_spec()方法使用说明

本文介绍了在Python张量流中使用make_merged_spec()方法合并设备规格对象的方法和语法，以及参数和返回值的说明，并提供了一个示例代码。 ... [详细]

蜡笔小新 2023-12-11 12:15:19
ip
揭秘阿里云WAF背后神秘的AI智能防御体系

背景应用安全领域，各类攻击长久以来都危害着互联网上的应用，在web应用安全风险中，各类注入、跨站等攻击仍然占据着较前的位置。WAF(Web应用防火墙)正是为防御和阻断这类攻击而存在 ... [详细]

蜡笔小新 2023-12-11 01:30:52
ip
数据结构与算法的重要性及基本概念、存储结构和算法分析

数据结构与算法在编程领域中的重要性不可忽视，无论从事何种岗位，都需要掌握数据结构和算法。本文介绍了数据结构与算法的基本概念、存储结构和算法分析。其中包括线性结构、树结构、图结构、栈、队列、串、查找、排序等内容。此外，还介绍了图论算法、贪婪算法、分治算法、动态规划、随机化算法和回溯算法等高级数据结构和算法。掌握这些知识对于提高编程能力、解决问题具有重要意义。 ... [详细]

蜡笔小新 2023-12-09 10:17:45
ip
利用ARMA模型对平稳非白噪声序列进行建模的步骤及代码实现

本文介绍了利用ARMA模型对平稳非白噪声序列进行建模的步骤及代码实现。首先对观察值序列进行样本自相关系数和样本偏自相关系数的计算，然后根据这些系数的性质选择适当的ARMA模型进行拟合，并估计模型中的位置参数。接着进行模型的有效性检验，如果不通过则重新选择模型再拟合，如果通过则进行模型优化。最后利用拟合模型预测序列的未来走势。文章还介绍了绘制时序图、平稳性检验、白噪声检验、确定ARMA阶数和预测未来走势的代码实现。 ... [详细]

蜡笔小新 2023-12-09 08:30:08

LD系瑰精棂_142

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章

Python OpenCV机器学习之图像识别详解

目录

背景

一、人脸识别

二、车牌识别

三、DNN图像分类