热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

SVM中为何间隔边界的值为正负1

在WB二面中,问到让讲一下SVM算法。我回答的时候,直接答道线性分隔面将样本分为正负两类,取平行于线性切割面的两个面作为间隔边界ÿ

在WB二面中,问到让讲一下SVM算法。

我回答的时候,直接答道线性分隔面将样本分为正负两类,取平行于线性切割面的两个面作为间隔边界,分别为:wx+b=1和wx+ b = -1。

面试官就问,为什么是正负1?

当时没有答上来,看来还是对模型不够理解。

回来查资料和ppt等,解答例如以下:

线性切割面是f(x) = wx + b,该线性切割面是要把样本点分为两类:

对于正样本,都满足:wx + b > 0;

对于负样本。都满足&#xff1a;wx &#43; b <0&#xff1b;

从式子中能够观察到&#xff0c;假设同一时候放大或缩小w和b。最后的结果是不受影响的&#xff0c;还是同一个线性切割面。

因此&#xff0c;我们能够做一个要求&#xff1a;

对于全部正样本。都满足&#xff1a;wx &#43; b >&#61; 1&#xff1b;

对于全部负样本。都满足&#xff1a;wx &#43; b <&#61; -1&#xff1b;

当中&#xff0c;间隔边界外的点相应的是">"或"<"号。而间隔边界上的点&#xff0c;相应的是"&#61;"号。

即得到&#xff1a;

对于间隔边界上的正样本&#xff0c;都满足&#xff1a;wx &#43; b &#61; 1。

对于间隔边界上的负样本。都满足&#xff1a;wx &#43; b &#61; -1&#xff1b;

这就是间隔边界上的值为正负1的由来。


PS1&#xff1a;

硬间隔SVM中&#xff0c;最小化间隔为&#xff1a;

min f(w) &#61; w.T * w / 2

其约束条件为&#xff1a;使全部的样本点都能正确划分&#xff0c;即&#xff1a;

s.t.   y_i(w * x_i &#43; b) >&#61; 1。

注意&#xff1a;不等式是包括等号"&#61;"的&#xff0c;是说。全部的点都在间隔边界之上或之外。不同意出如今间隔边界与分类超平面之间的&#xff01;


PS2&#xff1a;

对于软间隔SVM中的松弛变量的概念。噪声点并不是仅仅能存在于正确间隔边界外&#xff0c;因为有了松弛变量把它拉回来&#xff0c;因此&#xff0c;噪声点是能够到两个间隔边界之中&#xff0c;或者到错误的间隔边界之外的&#xff08;当然&#xff0c;假设仅仅是出如今分类超平面和正确的间隔边界之间&#xff0c;此时该点还是会被正确分类的。可是&#xff0c;此时它还是会为l(w)函数贡献松弛变量e的。&#xff09;。

此时的限制条件为&#xff1a;

s.t. y_i(w * x_i &#43; b) &#43; e_i >&#61; 1&#xff0c;当中&#xff0c;e_i >&#61; 0。



转:https://www.cnblogs.com/mqxnongmin/p/10554654.html



推荐阅读
  • PRML读书会第十四章 Combining Models(committees,Boosting,AdaBoost,决策树,条件混合模型)...
    主讲人网神(新浪微博:豆角茄子麻酱凉面)网神(66707180)18:57:18大家好,今天我们讲一下第14章combiningmodel ... [详细]
  • 阿里Treebased Deep Match(TDM) 学习笔记及技术发展回顾
    本文介绍了阿里Treebased Deep Match(TDM)的学习笔记,同时回顾了工业界技术发展的几代演进。从基于统计的启发式规则方法到基于内积模型的向量检索方法,再到引入复杂深度学习模型的下一代匹配技术。文章详细解释了基于统计的启发式规则方法和基于内积模型的向量检索方法的原理和应用,并介绍了TDM的背景和优势。最后,文章提到了向量距离和基于向量聚类的索引结构对于加速匹配效率的作用。本文对于理解TDM的学习过程和了解匹配技术的发展具有重要意义。 ... [详细]
  • 浏览器中的异常检测算法及其在深度学习中的应用
    本文介绍了在浏览器中进行异常检测的算法,包括统计学方法和机器学习方法,并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测,可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率,而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]
  • Jmeter对RabbitMQ压力测试
    篇首语:本文由编程笔记#小编为大家整理,主要介绍了Jmeter对RabbitMQ压力测试相关的知识,希望对你有一定的参考价值。Jm ... [详细]
  • 1.活体相关文献综述调研参考:https:blog.csdn.netCVAIDLarticledetails845673192.基于LBP纹理特征的检测1)基于LBP_256特征提 ... [详细]
  • Lodop中特殊符号打印设计和预览样式不同的问题解析
    本文主要解析了在Lodop中使用特殊符号打印设计和预览样式不同的问题。由于调用的本机ie引擎版本可能不同,导致在不同浏览器下样式解析不同。同时,未指定文字字体和样式设置也会导致打印设计和预览的差异。文章提出了通过指定具体字体和样式来解决问题的方法,并强调了以打印预览和虚拟打印机测试为准。 ... [详细]
  • EPICS Archiver Appliance存储waveform记录的尝试及资源需求分析
    本文介绍了EPICS Archiver Appliance存储waveform记录的尝试过程,并分析了其所需的资源容量。通过解决错误提示和调整内存大小,成功存储了波形数据。然后,讨论了储存环逐束团信号的意义,以及通过记录多圈的束团信号进行参数分析的可能性。波形数据的存储需求巨大,每天需要近250G,一年需要90T。然而,储存环逐束团信号具有重要意义,可以揭示出每个束团的纵向振荡频率和模式。 ... [详细]
  • 本文介绍了在开发Android新闻App时,搭建本地服务器的步骤。通过使用XAMPP软件,可以一键式搭建起开发环境,包括Apache、MySQL、PHP、PERL。在本地服务器上新建数据库和表,并设置相应的属性。最后,给出了创建new表的SQL语句。这个教程适合初学者参考。 ... [详细]
  • 电销机器人作为一种人工智能技术载体,可以帮助企业提升电销效率并节省人工成本。然而,电销机器人市场缺乏统一的市场准入标准,产品品质良莠不齐。创业者在代理或购买电销机器人时应注意谨防用录音冒充真人语音通话以及宣传技术与实际效果不符的情况。选择电销机器人时需要考察公司资质和产品品质,尤其要关注语音识别率。 ... [详细]
  • 这是原文链接:sendingformdata许多情况下,我们使用表单发送数据到服务器。服务器处理数据并返回响应给用户。这看起来很简单,但是 ... [详细]
  • 如何去除Win7快捷方式的箭头
    本文介绍了如何去除Win7快捷方式的箭头的方法,通过生成一个透明的ico图标并将其命名为Empty.ico,将图标复制到windows目录下,并导入注册表,即可去除箭头。这样做可以改善默认快捷方式的外观,提升桌面整洁度。 ... [详细]
  • 本文介绍了数据库的存储结构及其重要性,强调了关系数据库范例中将逻辑存储与物理存储分开的必要性。通过逻辑结构和物理结构的分离,可以实现对物理存储的重新组织和数据库的迁移,而应用程序不会察觉到任何更改。文章还展示了Oracle数据库的逻辑结构和物理结构,并介绍了表空间的概念和作用。 ... [详细]
  • 目录实现效果:实现环境实现方法一:基本思路主要代码JavaScript代码总结方法二主要代码总结方法三基本思路主要代码JavaScriptHTML总结实 ... [详细]
  • 本文介绍了九度OnlineJudge中的1002题目“Grading”的解决方法。该题目要求设计一个公平的评分过程,将每个考题分配给3个独立的专家,如果他们的评分不一致,则需要请一位裁判做出最终决定。文章详细描述了评分规则,并给出了解决该问题的程序。 ... [详细]
  • sklearn数据集库中的常用数据集类型介绍
    本文介绍了sklearn数据集库中常用的数据集类型,包括玩具数据集和样本生成器。其中详细介绍了波士顿房价数据集,包含了波士顿506处房屋的13种不同特征以及房屋价格,适用于回归任务。 ... [详细]
author-avatar
ig56mkw
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有