svm高斯核为什么惩罚项越大_SVM分类、核函数、损失函数

作者：拍友2502869293 | 来源：互联网 | 2023-10-17 16:42

1、支持向量机：支持向量机（SupportVectorMachine,SVM）是一类按监督学习（supervisedlear

1、支持向量机&＃xff1a;

支持向量机&＃xff08;Support Vector Machine, SVM&＃xff09;是一类按监督学习&＃xff08;supervised learning&＃xff09;方式对数据进行二元分类&＃xff08;binary classification&＃xff09;的广义线性分类器&＃xff08;generalized linear classifier&＃xff09;&＃xff0c;其决策边界是对学习样本求解的最大边距超平面&＃xff08;maximum-margin hyperplane&＃xff09;。

SVM的目的&＃xff1a;寻找到一个超平面使样本分成两类&＃xff0c;并且间隔最大。而我们求得的w就代表着我们需要寻找的超平面的系数。边界上的样本点就是支持向量&＃xff0c;这些点很关键&＃xff0c;这也是”支持向量机“命名的由来。

什么是线性可分&＃xff1f;

在分类问题中给定输入数据和学习目标

&＃xff0c;其中输入数据的每个样本都包含多个特征并由此构成特征空间&＃xff08;feature space&＃xff09;&＃xff1a;

&＃xff0c;而学习目标为二元变量

表示负类&＃xff08;negative class&＃xff09;和正类&＃xff08;positive class&＃xff09;。

若输入数据所在的特征空间存在作为决策边界&＃xff08;decision boundary&＃xff09;的超平面&＃xff08;hyperplane&＃xff09;&＃xff1a;

将学习目标按正类和负类分开&＃xff0c;并使

任意样本的点到平面距离大于等于1:

则称该分类问题具有线性可分性&＃xff0c;参数

分别为超平面的法向量和截距。

满足该条件的决策边界实际上构造了2个平行的超平面&＃xff1a;

作为间隔边界以判别样本的分类&＃xff1a;

, if

所有在上间隔边界上方的样本属于正类&＃xff0c;在下间隔边界下方的样本属于负类。两个间隔边界的距离

被定义为边距&＃xff08;margin&＃xff09;&＃xff0c;位于间隔边界上的正类和负类样本为支持向量&＃xff08;support vector&＃xff09;。

2、损失函数&＃xff1a;

在一个分类问题不具有线性可分性时&＃xff0c;使用超平面作为决策边界会带来分类损失&＃xff0c;即部分支持向量不再位于间隔边界上&＃xff0c;而是进入了间隔边界内部&＃xff0c;或落入决策边界的错误一侧。损失函数可以对分类损失进行量化&＃xff0c;常用的损失函数有&＃xff1a;铰链损失函数&＃xff08;hinge loss&＃xff09;、logistic损失函数&＃xff08;logistic loss&＃xff09;、指数损失函数&＃xff08;exponential loss&＃xff09;。

hinge:

logistic:

exponential:

其中SVM使用的是铰链损失函数。

图中

分类器的经验风险描述了分类器所给出的分类结果的准确程度&＃xff1b;结构风险描述了分类器自身的稳定程度&＃xff0c;复杂的分类器容易产生过拟合&＃xff0c;因此是不稳定的。

最终的SVM损失函数既要考虑到经验风险&＃xff0c;也要考虑到结构风险&＃xff0c;因此最终的损失函数为&＃xff1a;

第一项为经验风险&＃xff0c;度量了模型对训练数据的拟合程度&＃xff1b;第二项为结构风险&＃xff0c;也称正则化项&＃xff0c;度量了模型自身的复杂度&＃xff0c;可以降低过拟合风险&＃xff0c;由于该项为二次幂形式&＃xff0c;所以又叫作L2正则项。

是一个可调参数&＃xff0c;用来权衡经验风险和结构风险&＃xff0c;以加大某一项的惩罚力度。

3、核函数&＃xff1a;

SVM可以通过核方法&＃xff08;kernel method&＃xff09;进行非线性分类&＃xff0c;是常见的核学习&＃xff08;kernel learning&＃xff09;方法之一。常见的核函数有&＃xff1a;多项式核、径向基函数核、拉普拉斯核、Sigmoid核。

一些线性不可分的问题可能是非线性可分的&＃xff0c;即特征空间存在超曲面&＃xff08;hypersurface&＃xff09;将正类和负类分开。使用非线性函数可以将非线性可分问题从原始的特征空间映射至更高维的希尔伯特空间&＃xff08;Hilbert space&＃xff09;H &＃xff0c;从而转化为线性可分问题&＃xff0c;此时作为决策边界的超平面表示如下&＃xff1a;

式中&＃xff1a;

为映射函数

由于映射函数是复杂的非线性函数&＃xff0c;因此其内积的计算是困难的&＃xff0c;此时可使用核方法&＃xff08;kernel method&＃xff09;&＃xff0c;即定义映射函数的内积为核函数&＃xff08;kernel function&＃xff09;。

多项式核&＃xff1a;

径向基函数核(RBF核)又被称为高斯核&＃xff1a;

拉普拉斯核:

Sigmoid核&＃xff1a;

当多项式核的阶为1时&＃xff0c;其被称为线性核&＃xff0c;对应的非线性分类器退化为线性分类器。RBF核也被称为高斯核&＃xff08;Gaussian kernel&＃xff09;&＃xff0c;其对应的映射函数将样本空间映射至无限维空间。

推荐阅读

int
Python正则表达式学习记录及常用方法

本文记录了学习Python正则表达式的过程，介绍了re模块的常用方法re.search，并解释了rawstring的作用。正则表达式是一种方便检查字符串匹配模式的工具，通过本文的学习可以掌握Python中使用正则表达式的基本方法。 ... [详细]

蜡笔小新 2023-12-13 16:37:19
web
绕过WAF的XSS检测机制及构建XSS payload的方法

本文介绍了绕过WAF的XSS检测机制的方法，包括确定payload结构、测试和混淆。同时提出了一种构建XSS payload的方法，该payload与安全机制使用的正则表达式不匹配。通过清理用户输入、转义输出、使用文档对象模型（DOM）接收器和源、实施适当的跨域资源共享（CORS）策略和其他安全策略，可以有效阻止XSS漏洞。但是，WAF或自定义过滤器仍然被广泛使用来增加安全性。本文的方法可以绕过这种安全机制，构建与正则表达式不匹配的XSS payload。 ... [详细]

蜡笔小新 2023-12-11 19:42:30
web
机器学习之数据均衡算法种类大全+Python代码一文详解

目录前言一、为什么要做数据均衡？二、数据场景1.大数据分布不均衡2.小数据分布不均衡三、均衡算法类型1.过采样2.欠采样3.组合采样四、算法具体种类1 ... [详细]

蜡笔小新 2023-10-15 23:34:41
web
Stanford机器学习第九讲. 聚类

原文：http:blog.csdn.netabcjenniferarticledetails7914952本栏目（Machinelearning）包括单参数的线性回归、多参数的线性 ... [详细]

蜡笔小新 2023-10-15 16:17:01
replace
vue使用

关键词： ... [详细]

蜡笔小新 2023-12-14 19:14:56
replace
基于PgpoolII的PostgreSQL集群安装与配置教程

本文介绍了基于PgpoolII的PostgreSQL集群的安装与配置教程。Pgpool-II是一个位于PostgreSQL服务器和PostgreSQL数据库客户端之间的中间件，提供了连接池、复制、负载均衡、缓存、看门狗、限制链接等功能，可以用于搭建高可用的PostgreSQL集群。文章详细介绍了通过yum安装Pgpool-II的步骤，并提供了相关的官方参考地址。 ... [详细]

蜡笔小新 2023-12-14 19:10:25
int
lua语言闭包、模式匹配、日期、编译、模块的特性及应用

本文介绍了lua语言中闭包的特性及其在模式匹配、日期处理、编译和模块化等方面的应用。lua中的闭包是严格遵循词法定界的第一类值，函数可以作为变量自由传递，也可以作为参数传递给其他函数。这些特性使得lua语言具有极大的灵活性，为程序开发带来了便利。 ... [详细]

蜡笔小新 2023-12-14 18:18:21
int
如何在Pygame中使用矩形对表面进行涂色？

本文介绍了在Pygame中使用矩形对表面进行涂色的方法。通过查阅Pygame文档中的blit函数，可以了解到如何将一个表面的特定部分复制到另一个表面的指定位置上。具体的解决方法和参数说明在文中都有详细说明。 ... [详细]

蜡笔小新 2023-12-14 17:07:29
int
PHP图片截取方法及应用实例

本文介绍了使用PHP动态切割JPEG图片的方法，并提供了应用实例，包括截取视频图、提取文章内容中的图片地址、裁切图片等问题。详细介绍了相关的PHP函数和参数的使用，以及图片切割的具体步骤。同时，还提供了一些注意事项和优化建议。通过本文的学习，读者可以掌握PHP图片截取的技巧，实现自己的需求。 ... [详细]

蜡笔小新 2023-12-14 16:44:09
config
Oracle中tnsnames.ora的作用和配置方法

本文介绍了Oracle数据库中tnsnames.ora文件的作用和配置方法。tnsnames.ora文件在数据库启动过程中会被读取，用于解析LOCAL_LISTENER，并且与侦听无关。文章还提供了配置LOCAL_LISTENER和1522端口的示例，并展示了listener.ora文件的内容。 ... [详细]

蜡笔小新 2023-12-14 07:44:06
int
多因子选股模型在实际中的构建步骤及影响因素分析

本文介绍了多因子选股模型在实际中的构建步骤，包括风险源分析、因子筛选和体系构建，并进行了模拟实证回测。在风险源分析中，从宏观、行业、公司和特殊因素四个角度分析了影响资产价格的因素。具体包括宏观经济运行和宏经济政策对证券市场的影响，以及行业类型、行业生命周期和行业政策对股票价格的影响。 ... [详细]

蜡笔小新 2023-12-13 22:34:00
int
大量研发销售产品设计市场岗位！

关于我们EMQ是一家全球领先的开源物联网基础设施软件供应商，服务新产业周期的IoT&5G、边缘计算与云计算市场，交付全球领先的开源物联网消息服务器和流处理数据 ... [详细]

蜡笔小新 2023-12-13 21:02:32
int
不同优化算法的比较分析及实验验证

本文介绍了神经网络优化中常用的优化方法，包括学习率调整和梯度估计修正，并通过实验验证了不同优化算法的效果。实验结果表明，Adam算法在综合考虑学习率调整和梯度估计修正方面表现较好。该研究对于优化神经网络的训练过程具有指导意义。 ... [详细]

蜡笔小新 2023-12-13 16:05:14
int
深度学习中的Vision Transformer (ViT)详解

本文详细介绍了深度学习中的Vision Transformer (ViT)方法。首先介绍了相关工作和ViT的基本原理，包括图像块嵌入、可学习的嵌入、位置嵌入和Transformer编码器等。接着讨论了ViT的张量维度变化、归纳偏置与混合架构、微调及更高分辨率等方面。最后给出了实验结果和相关代码的链接。本文的研究表明，对于CV任务，直接应用纯Transformer架构于图像块序列是可行的，无需依赖于卷积网络。 ... [详细]

蜡笔小新 2023-12-12 15:26:38
int
PRML读书会第十四章 Combining Models（committees，Boosting，AdaBoost，决策树，条件混合模型）...

主讲人网神（新浪微博:豆角茄子麻酱凉面）网神(66707180)18:57:18大家好，今天我们讲一下第14章combiningmodel ... [详细]

蜡笔小新 2023-10-17 17:04:24

拍友2502869293

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章