当前位置: 开发笔记 > 后端 > 正文

利用HOG+SVM训练自己的XML文件

作者：叮叮当叮叮当叮叮当_212 | 来源：互联网 | 2023-06-15 12:26

【原文：http:blog.csdn.netArmilyarticledetails8333862】在人脸检测中，我们一般利用训练好的XML文件去预测图像中是否存在人脸，那么XML文件是

【原文：http://blog.csdn.net/Armily/article/details/8333862】

在人脸检测中，我们一般利用训练好的XML文件去预测图像中是否存在人脸，那么XML文件是如何得到的，按照人脸的XML文件，它应该是提取样本的Haar特征，利用某个机器学习方法，最终得到的。本文主要讨论如何得到自己的XML文件。

在机器学习中，首先应该是采集样本，然后提取他们的特征，本人主要利用HOG特征进行实验。

1、采集样本图像（正样本和负样本），将其归一化到一个的尺度，如48X48.

2、将样本图像的名称写到一个TXT文件，方便程序调用.

3、依次提取每张图像的HOG特征向量.

4、利用SVM进行训练.

5、得到XML文件

具体代码如下：

HOG特征向量计算方法：

利用矩形HOG结构，2×2个cell组成一个block块，每个cell由8×8像素的图像区域组成，步长N为8，而每个cell的梯度方向从0⁰-360⁰分成9个方向块。对于0⁰-180⁰的方向均匀投影到9个方向块，比如0⁰-20⁰投影到a₁块，20⁰-40⁰投影到a₂块。也就是说每个cell要对9维的特征进行梯度幅度投影，形成9维的特征向量，block内的四个cell独立产生9维的特征向量，计算某个cell的特征向量时，投影的时候同一个block内的另外三个cell中的像素也要对这个cell的特征向量进行投影，投影的权重使用三线性插值方法，这样在48×48的图片大小下，利用公式N = ((W–w_b )/stride + 1)*((H-h_b)/stride+1)*bins*n ，

其中W为图片的宽，H为图片的高，w_b和h_b为block的宽与高，stride为cell的大小，bins为投影的区块，n为一个block中包含的cell的个数。

就产生900维的特征向量。

[html] view plain copy

//////////////////extract the hog feature from images //////////////////////////////////////////////////////////////
#define HOG_VECTOR 900 // 图像HOG特征向量 ((48-16)/8 + 1)*(48-16)/8 + 1)*9*4=900
#define TRAIN_IMG_NUM 800 //总共的样本（图像）数
HOGDescriptor hog(cvSize(48,48),cvSize(16,16),cvSize(8,8),cvSize(8,8),9,1,- 1,HOGDescriptor::L2Hys,0.2,false,HOGDescriptor::DEFAULT_NLEVELS); //初始化HOG描述符
vector<float>descrip;
vector<float>totaldescrip(HOG_VECTOR*TRAIN_IMG_NUM); //将所有HOG特征向量保存在vector中
vector<float>::iterator pos;
pos=totaldescrip.begin();
int ImageNum=0;
Mat img;
FILE* f = "pictures.txt"; //存放样本图像
char _filename[1024];
for (;;)
{
char* filename = _filename;
if(f)
{
if(!fgets(filename, (int)sizeof(_filename)-2, f))
break;
//while(*filename && isspace(*filename))
// ++filename;
if(filename[0] == '#')
continue;
int l = strlen(filename);
while(l > 0 && isspace(filename[l-1]))
--l;
filename[l] = '\0';
img = imread(filename);
}
printf("%s:\n", filename);
if(!img.data)
continue;
fflush(stdout);
hog.compute(img,descrip); //计算每幅图像的HOG特征向量
vector<float>::iterator iter;
for (iter=descrip.begin();iter!=descrip.end();iter++,pos++)
{
*pos=*iter;
}
}
float* buf2=&totaldescrip[0];
Mat data_mat(TRAIN_IMG_NUM,HOG_VECTOR,CV_32FC1,buf2);
//将图像标记为两类：1->正样本；2->负样本
Mat res_mat=Mat::ones(TRAIN_IMG_NUM,1,CV_32SC1);
for (int k=400;k<800;k++)
{
res_mat.at<unsigned int>(k, 0)=2;
}
//利用SVM进行训练,生成XML文件
TermCriteria criteria;
SVM svm = SVM ();
SVMParams param;
criteria = cvTermCriteria (CV_TERMCRIT_EPS, 1000, FLT_EPSILON);
param = SVMParams (SVM::C_SVC, SVM::LINEAR, 10.0, 0.09, 1.0, 10.0, 0.5, 1.0, NULL, criteria);
svm.train(data_mat,res_mat,Mat(), Mat(), param);
svm.save ("svm_image.xml");

预测的代码：

[html] view plain copy

hog.compute(img,descrip3);
float* buf3=&descrip3[0];
Mat hog_data_mat(1,900,CV_32FC1,buf3);
SVM svm_hog=CvSVM();
svm_hog.load("svm_image.xml");
float index=0.;
index=svm_hog.predict(hog_data_mat);
cout<<"index="<<index<<endl;

推荐阅读

ci
微软头条实习生分享深度学习自学指南

本文介绍了一位微软头条实习生自学深度学习的经验分享，包括学习资源推荐、重要基础知识的学习要点等。作者强调了学好Python和数学基础的重要性，并提供了一些建议。 ... [详细]

蜡笔小新 2023-12-14 20:58:32
cache
Java工具类库Hutool介绍及功能概述

本文介绍了Java工具类库Hutool，该工具包封装了对文件、流、加密解密、转码、正则、线程、XML等JDK方法的封装，并提供了各种Util工具类。同时，还介绍了Hutool的组件，包括动态代理、布隆过滤、缓存、定时任务等功能。该工具包可以简化Java代码，提高开发效率。 ... [详细]

蜡笔小新 2023-12-14 14:29:36
cache
android listview OnItemClickListener失效原因

最近在做listview时发现OnItemClickListener失效的问题，经过查找发现是因为button的原因。不仅listitem中存在button会影响OnItemClickListener事件的失效，还会导致单击后listview每个item的背景改变，使得item中的所有有关焦点的事件都失效。本文给出了一个范例来说明这种情况，并提供了解决方法。 ... [详细]

蜡笔小新 2023-12-14 14:25:50
ci
sklearn数据集库中的常用数据集类型介绍

本文介绍了sklearn数据集库中常用的数据集类型，包括玩具数据集和样本生成器。其中详细介绍了波士顿房价数据集，包含了波士顿506处房屋的13种不同特征以及房屋价格，适用于回归任务。 ... [详细]

蜡笔小新 2023-12-13 17:45:15
ci
HTML学习02 图像标签的使用和属性

本文介绍了HTML中图像标签的使用和属性，包括定义图像、定义图像地图、使用源属性和替换文本属性。同时提供了相关实例和注意事项，帮助读者更好地理解和应用图像标签。 ... [详细]

蜡笔小新 2023-12-13 11:31:26
ci
flowable工作流流程变量_信也科技工作流平台的技术实践

1背景随着公司业务发展及内部业务流程诉求的增长,目前信息化系统不能够很好满足期望,主要体现如下：目前OA流程引擎无法满足企业特定业务流程需求，且移动端体 ... [详细]

蜡笔小新 2023-12-13 10:17:15
ci
MyBatis多表查询与动态SQL使用

本文介绍了MyBatis多表查询与动态SQL的使用方法，包括一对一查询和一对多查询。同时还介绍了动态SQL的使用，包括if标签、trim标签、where标签、set标签和foreach标签的用法。文章还提供了相关的配置信息和示例代码。 ... [详细]

蜡笔小新 2023-12-12 17:12:51
ci
iOS超签签名服务器搭建及其优劣势

本文介绍了搭建iOS超签签名服务器的原因和优势，包括不掉签、用户可以直接安装不需要信任、体验好等。同时也提到了超签的劣势，即一个证书只能安装100个，成本较高。文章还详细介绍了超签的实现原理，包括用户请求服务器安装mobileconfig文件、服务器调用苹果接口添加udid等步骤。最后，还提到了生成mobileconfig文件和导出AppleWorldwideDeveloperRelationsCertificationAuthority证书的方法。 ... [详细]

蜡笔小新 2023-12-11 20:23:23
wordpress
qemu模拟arm并调试汇编的方法和注意事项

原文地址http://balau82.wordpress.com/2010/02/28/hello-world-for-bare-metal-arm-using-qemu/最开始时 ... [详细]

蜡笔小新 2023-10-17 19:43:26
上传
如何实现织梦DedeCms全站伪静态

本文介绍了如何通过修改织梦DedeCms源代码来实现全站伪静态，以提高管理和SEO效果。全站伪静态可以避免重复URL的问题，同时通过使用mod_rewrite伪静态模块和.htaccess正则表达式，可以更好地适应搜索引擎的需求。文章还提到了一些相关的技术和工具，如Ubuntu、qt编程、tomcat端口、爬虫、php request根目录等。 ... [详细]

蜡笔小新 2023-12-14 19:45:47
上传
kotlin动画实现上下移动、放大缩小、旋转功能

本文介绍了使用kotlin实现动画效果的方法，包括上下移动、放大缩小、旋转等功能。通过代码示例演示了如何使用ObjectAnimator和AnimatorSet来实现动画效果，并提供了实现抖动效果的代码。同时还介绍了如何使用translationY和translationX来实现上下和左右移动的效果。最后还提供了一个anim_small.xml文件的代码示例，可以用来实现放大缩小的效果。 ... [详细]

蜡笔小新 2023-12-14 17:29:08
ci
Spring源码解密之默认标签的解析方式分析

本文分析了Spring源码解密中默认标签的解析方式。通过对命名空间的判断，区分默认命名空间和自定义命名空间，并采用不同的解析方式。其中，bean标签的解析最为复杂和重要。 ... [详细]

蜡笔小新 2023-12-14 17:24:50
上传
如何使用PLEX播放组播、抓取信号源以及设置路由器

本文介绍了如何使用PLEX播放组播、抓取信号源以及设置路由器。通过使用xTeve软件和M3U源，用户可以在PLEX上实现直播功能，并且可以自动匹配EPG信息和定时录制节目。同时，本文还提供了从华为itv盒子提取组播地址的方法以及如何在ASUS固件路由器上设置IPTV。在使用PLEX之前，建议先使用VLC测试是否可以正常播放UDPXY转发的iptv流。最后，本文还介绍了docker版xTeve的设置方法。 ... [详细]

蜡笔小新 2023-12-09 01:31:00
ci
cs231n Lecture 3 线性分类笔记（一）

内容列表线性分类器简介线性评分函数阐明线性分类器损失函数多类SVMSoftmax分类器SVM和Softmax的比较基于Web的可交互线性分类器原型小结注：中文翻译 ... [详细]

蜡笔小新 2023-10-17 19:40:56
x86
Eclipse打开报错：发现了以元素 ‘d:skin’ 开头的无效内容。此处不应含有子元素（解决方法）

【具体报错信息】ErrorparsingD:\android-sdks\system-images\android-22\android-wear\armeabi-v7a\devi ... [详细]

蜡笔小新 2023-10-17 18:53:50

叮叮当叮叮当叮叮当_212

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章