当前位置: 开发笔记 > 编程语言 > 正文

伪知识之通俗易懂得分析SVM中的支持分类的专有名词持续更新:【内向即失败--王奕君】

作者：天才愤青2_735 | 来源：互联网 | 2023-08-14 18:51

该内容面向SVM支持分类的学习，纯属个人见解，内容并不是完全靠谱，仅供参考一．Svm.svc()SVC是SVM的一种Type，是用来支持向量分类SVR是svm的令一种tyep，是用来

该内容面向SVM支持分类的学习，纯属个人见解，内容并不是完全靠谱，仅供参考

一．Svm.svc()

SVC是SVM的一种Type，是用来支持向量分类

SVR是svm的令一种tyep，是用来支持向量回归

SVM模型有两个非常重要的参数C与gamma。

其中 C是惩罚系数，即对误差的宽容度。,过大过小都不好，适中最好，所以这里涉及到了调参的工作

c越高，说明越不能容忍出现误差,容易过拟合。C越小，容易欠拟合。C过大或过小，泛化能力变差仅作了解

Gamma

支持向量的分布，一般来说gamma太小，欠拟合，太大，过拟合，适中，最好。

gamma是选择RBF函数作为kernel后，该函数自带的一个参数。隐含地决定了数据映射到新的特征空间后的分布，gamma越大，支持向量越少，而如果设的过小，则会造成平滑效应太大，无法在训练集上得到特别高的准确率，也会影响测试集的准确率。

二．平滑滤波：

通过平滑滤波来损坏边缘的特征信息。类似与超清，高清，标清的区别

三．核函数： 仅作了解

把点弄成线，把线弄成体，把体弄成高维空间 ，这就是高斯核函数做的事情

作用：将低维空间线性不可分割任务交给核函数，核函数通过高维的映射将线性不可分割的两类点变成线性可分割。再将高维中的判决边界，再映射回低维空间

四．Fit：拟合

拟合就是把平面上一系列的点，用一条光滑的曲线连接起来。

因为这条曲线有无数种可能，从而有各种拟合方法。拟合的曲线一般可以用函数表示，根据这个函数的不同有不同的拟合名字。仅作了解

过拟合，这条坐标上的所有特征信息都连起来。

做的题少考试50分

欠拟合，这条坐标上上的特征信息有许多没有连起来。

做的题太多，太相似考试70分

拟合，就是过拟合与欠拟合之间最适中的一个平滑的曲线。

做的题不多不少，什么种类的题都会做一点，考试90分

五．线性回归，线性拟合
线性回归是外国人的术语，线性拟合是中国人的术语，两者本质上可以等同

两者的含义本质上都是为了说明通过该方法在二维空间中找到一条连接这些特征信息点的

看不见的线。

说的在通俗一点，就是将这些点拟合成一条线，或是点一点点的回归成一条线。

六．非线性回归，非线性拟合

线性是指一条平滑的直线

二元一次方程在坐标系上所显示的出来的结果就是线性的成正比关系是线性

非线性就是指一条曲线

非二元一次方程在坐标系上所显示的出来的结果就是非线性的成反比关系是非线性

线性非线性非线性

线性函数关系是直线，而非线性函数关系是非直线，包括各种曲线、折线、不连续的线等；

七．Clf.fit:

>>> import numpy as np

>>> X = np.array([[-1, -1], [-2, -1], [1, 1], [2, 1]]) ＃数据特征

>>> y = np.array([1, 1, 2, 2]) ＃数据对应的标签

>>> from sklearn.svm import SVC ＃导入svm的svc类（支持向量分类）

>>> clf = SVC() ＃创建分类器对象

>>> clf.fit(X, y) ＃ 用训练数据拟合分类器模型

SVC(C=1.0, cache_size=200, class_weight=None, coef0=0.0,

decision_function_shape=None, degree=3, gamma='auto', kernel='rbf',

max_iter=-1, probability=False, random_state=None, shrinking=True,

tol=0.001, verbose=False)

>>> clf.predict([[-0.8, -1]]) ＃用训练好的分类器去预测[-0.8, -1]数据的标签

[1]

八．Joblib

做模型训练时，需要将模型保存下来，然后放到独立的测试集上测试，下面介绍的是Python中训练模型的保存和再使用。

在机器学习过程中，一般用来训练模型的过程比较长，所以我们一般会将训练的模型进行保存（持久化），然后进行评估，预测等等，这样便可以节省大量的时间。

1. joblib.dump(clf,'../../data/model/randomforest.pkl',compress=3)

2. #load model to clf

3. clf = joblib.load('../../data/model/randomforest.pkl')

Compress=3：压缩=3

压缩：整数为0到9，可选

数据的可选压缩级别。0是没有压缩。

高意味着更多的压缩，但也慢读和

写的时候。使用3的值通常是一个很好的折衷方案。

详情请看说明。

压缩的意义：减少空间占用

推荐阅读

function
机器学习之数据均衡算法种类大全+Python代码一文详解

目录前言一、为什么要做数据均衡？二、数据场景1.大数据分布不均衡2.小数据分布不均衡三、均衡算法类型1.过采样2.欠采样3.组合采样四、算法具体种类1 ... [详细]

蜡笔小新 2023-10-15 23:34:41
function
python创建一个窗口_等一个大佬啊要求用python创建一个窗口，窗口按钮功能是创建一个球体或立方体。明天上课之前交给我...

展开全部下面的代码是创建一个立方体Thisexamplescreatesanddisplaysasimplebox.#Thefirstlineloadstheinit_disp ... [详细]

蜡笔小新 2023-12-13 16:26:09
function
开发笔记:小白python机器学习之路——支持向量机

篇首语：本文由编程笔记#小编为大家整理，主要介绍了小白python机器学习之路——支持向量机相关的知识，希望对你有一定的参考价值。支持 ... [详细]

蜡笔小新 2023-10-15 12:00:18
function
使用机器学习的疾病预测

使用机器学习的疾病预测原文:https://www.gees ... [详细]

蜡笔小新 2023-10-14 16:00:09
function
YOLOv7基于自己的数据集从零构建模型完整训练、推理计算超详细教程

本文介绍了关于人工智能、神经网络和深度学习的知识点，并提供了YOLOv7基于自己的数据集从零构建模型完整训练、推理计算的详细教程。文章还提到了郑州最低生活保障的话题。对于从事目标检测任务的人来说，YOLO是一个熟悉的模型。文章还提到了yolov4和yolov6的相关内容，以及选择模型的优化思路。 ... [详细]

蜡笔小新 2023-12-14 18:28:01
ip
在Windows 8上安装gvim中的插件的错误加载问题

本文讨论了在Windows 8上安装gvim中插件时出现的错误加载问题。作者将EasyMotion插件放在了正确的位置，但加载时却出现了错误。作者提供了下载链接和之前放置插件的位置，并列出了出现的错误信息。 ... [详细]

蜡笔小新 2023-12-14 14:44:00
express
sklearn数据集库中的常用数据集类型介绍

本文介绍了sklearn数据集库中常用的数据集类型，包括玩具数据集和样本生成器。其中详细介绍了波士顿房价数据集，包含了波士顿506处房屋的13种不同特征以及房屋价格，适用于回归任务。 ... [详细]

蜡笔小新 2023-12-13 17:45:15
express
Python正则表达式学习记录及常用方法

本文记录了学习Python正则表达式的过程，介绍了re模块的常用方法re.search，并解释了rawstring的作用。正则表达式是一种方便检查字符串匹配模式的工具，通过本文的学习可以掌握Python中使用正则表达式的基本方法。 ... [详细]

蜡笔小新 2023-12-13 16:37:19
function
浏览器中的异常检测算法及其在深度学习中的应用

本文介绍了在浏览器中进行异常检测的算法，包括统计学方法和机器学习方法，并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测，可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率，而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]

蜡笔小新 2023-12-12 16:22:39
sum
第四章高阶函数（参数传递、高阶函数、lambda表达式）（python进阶）的讲解和应用

本文主要讲解了第四章高阶函数（参数传递、高阶函数、lambda表达式）的相关知识，包括函数参数传递机制和赋值机制、引用传递的概念和应用、默认参数的定义和使用等内容。同时介绍了高阶函数和lambda表达式的概念，并给出了一些实例代码进行演示。对于想要进一步提升python编程能力的读者来说，本文将是一个不错的学习资料。 ... [详细]

蜡笔小新 2023-12-12 15:52:48
jsp
Python中字符串的压缩与解压缩方法及应用

本文介绍了在Python中使用zlib模块进行字符串的压缩与解压缩的方法，并探讨了其在内存优化方面的应用。通过压缩存储URL等长字符串，可以大大降低内存消耗，虽然处理时间会增加，但是整体效果显著。同时，给出了参考链接，供进一步学习和应用。 ... [详细]

蜡笔小新 2023-12-11 17:42:43
function
cs231n Lecture 3 线性分类笔记（一）

内容列表线性分类器简介线性评分函数阐明线性分类器损失函数多类SVMSoftmax分类器SVM和Softmax的比较基于Web的可交互线性分类器原型小结注：中文翻译 ... [详细]

蜡笔小新 2023-10-17 19:40:56
go
Opencv Python版学习笔记（八）字符识别-分类器（SVM，KNearest，RTrees，Boost，MLP）

Opencv提供了几种分类器，例程里通过字符识别来进行说明的1、支持向量机（SVM）：给定训练样本，支持向量机建立一个超平面作为决策平面，使得正例和反例之间的隔离边缘被最大化。函数原型：训练原型cv ... [详细]

蜡笔小新 2023-10-17 17:02:44
function
svm 高斯核为什么惩罚项越大_SVM分类、核函数、损失函数

1、支持向量机：支持向量机（SupportVectorMachine,SVM）是一类按监督学习（supervisedlear ... [详细]

蜡笔小新 2023-10-17 16:42:09
数组
分类与聚类

一：分类1：定义分类其实是从特定的数据中挖掘模式，做出判断的过程。分类是在一群已经知道类别标号的样本中，训练一种分类器 ... [详细]

蜡笔小新 2023-10-13 05:29:06

天才愤青2_735

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章