林轩田机器学习技法（MachineLearningTechniques）笔记（二）

作者：平凡2188 | 来源：互联网 | 2023-10-10 18:22

林轩田机器学习技法（MachineLearningTechniques）笔记（一）林轩田机器学习技法（Mach

林轩田机器学习技法&＃xff08;Machine Learning Techniques&＃xff09;笔记&＃xff08;一&＃xff09;
林轩田机器学习技法&＃xff08;Machine Learning Techniques&＃xff09;笔记&＃xff08;三&＃xff09;

Dual Support Vector Machine

P6 2.1
在这里插入图片描述
L1 讲的是线性支持向量机&＃xff0c;接下来L2讲的是对偶支持向量机。

上节就讲了下求non-linear SVM的方法&＃xff0c;转换到z空间的时候&＃xff0c;QP问题会有 d^~ &＃43; 1 个变数&＃xff08;和N个常数&＃xff09;来解&＃xff0c;要解决 d^~ 很大&＃xff0c;甚至是无穷的问题&＃xff0c;让SVM不依赖于d^~ &＃xff1a;

我们可以把original的SVM转成等效的SVM
在这里插入图片描述
这就是对偶问题&＃xff1a;

我们可以仿照之前regularization&＃xff0c;引入λ&＃xff0c;将条件问题转换为非条件问题&＃xff0c;而λ的个数就是N

定义拉格朗日函数&＃xff0c;相关文献通常把 λ 写成 α

把SVM转换成右式子
在这里插入图片描述
如果满足不了 s.t. 的&＃xff08;b,w&＃xff09;那么1-yn(wTzn&＃43;b)就是整数&＃xff0c;选取max的话&＃xff0c;就会到达无穷大&＃xff0c;因为最终要到是min&＃xff0c;这样就会筛掉这种不满足 s.t. 的&＃xff08;b,w&＃xff09;
如果满足了的话&＃xff0c;yn(wTzn&＃43;b)会是个非负数&＃xff0c;因为有个max且a>&＃61;0&＃xff0c;所以 yn(wTzn&＃43;b)&＃61;0&＃xff08;注意可以不要 $∑\sum$ &＃xff0c;因为a>&＃61;0&＃xff0c;只能是每一项都&＃61;0&＃xff0c;才可以求和&＃61;0&＃xff09;&＃xff0c;那么式子就是 $12wTw\frac{1}{2} w^Tw$ 。
这样即有效地筛掉不满足 s.t. 的数据&＃xff0c;又能找到最小的 $12wTw\frac{1}{2} w^Tw$ 。

P7 2.2
上节把SVM转成拉格朗日式子&＃xff0c;那么&＃xff0c;如何找到该式子的下限&＃xff1f;对于任何(b,w)来说&＃xff0c;都有这个&＃xff1a;
在这里插入图片描述
因为对于任何都成立&＃xff0c;所以取右式子最大的&＃xff0c;还是成立的&＃xff1a;

右式成为拉格朗日的对偶(dual)问题&＃xff0c;如果解决了这个问题&＃xff0c;也就找出SVM的下限。

在这里插入图片描述
因为满足绿色的三个条件&＃xff0c;所以是个强关系&＃xff08;对于QP问题&＃xff09;&＃xff0c;所以就可以直接等同了&＃xff0c;也说明了有组(b,w,α)满足等式两边&＃xff1a;

现在没有什么限制了&＃xff0c;所以开始解这个&＃xff1a;
在这里插入图片描述
因为是min&＃xff0c;所以要求&＃xff1a;

因此我们可以加上这个限制&＃xff0c;并把式子化一化&＃xff1a;

可以看出最后一项是 b*0 &＃xff0c;所以变成&＃xff1a;

同样&＃xff0c;因为min&＃xff0c;所以要给L求个w的偏导&＃61;0&＃xff0c;得出w为一个固定的数&＃xff0c;然后开始化简&＃xff0c;min可以不用看了&＃xff0c;是因为max有了下面一系列规定之后&＃xff0c;式子里头没有b和w&＃xff0c;剩下的就只用考虑 α 就可以了。
在这里插入图片描述
最后成这个满足最佳化的4个条件为KKT。补充一下&＃xff1a;第四点&＃xff08;哈利波特和伏地魔必须活一个&＃xff09;那个&＃xff0c;yn(wTzn&＃43;b)&＃61;1的话&＃xff08;说明点正好在分界线上&＃xff0c;这些α>&＃61;0点就是SV&＃xff09;&＃xff0c;式子自然为0&＃xff0c;>1的话&＃xff0c;根据2.1最后那个图&＃xff0c;使得2.1那个图的式子取min&＃xff0c;那么αn就只能取0了&＃xff0c;所以最终这里的式子也是0。
在这里插入图片描述
最后是funtime小练习巩固&＃xff0c;感觉挺有意思的&＃xff0c;②要去看回 L(b,w,α) 的定义&＃xff0c;就知道了yn和zn&＃61;1&＃xff0c;然后w&＃61; $∑αnynzn\sumα_ny_nz_n$ 就出来了。③是因为sigma的每一项都要是0&＃xff08;KKT下&＃xff09;&＃xff0c;所以就 &＃61; 0&＃xff0c;对于α2(w-3)的问题&＃xff0c;感觉可以不用管具体w和yn&＃xff0c;zn怎么弄的&＃xff0c;总之整体要为0就是了。

P8 2.3
在这里插入图片描述
把上节的式子简单化简一下&＃xff0c;max->min&＃xff0c;然后把平方化开。不加上w &＃61; … 的条件是因为这个十字关注点是在 αn 上。然后发现这是个凸(convex)QP问题&＃xff0c;有N个变量&＃xff08;αn&＃xff09;&＃xff0c;然后又N&＃43;1的条件(constraint)&＃xff08;N个αn要大于零&＃xff0c;1个 $∑n&＃61;1Nynαn&＃61;0\sum_{n&＃61;1}^N y_nα_n&＃61;0$ &＃xff0c;共N&＃43;1个&＃xff09;&＃xff0c;然后开始套QP。
在这里插入图片描述
注&＃xff1a;一般QP输入的时候可以不用把"&＃61;"拆成两个不等式&＃xff0c;直接写&＃xff0c;然后范围bound也可以直接写。

然而&＃xff0c;注意到q是dense的&＃xff0c;稠密的矩阵&＃xff0c;即里面的值很多不是非零的&＃xff0c;计算量和存储量很大&＃xff0c;所以要用一个专门为SVM设计的方法。
在这里插入图片描述
通过KKT的4个条件&＃xff0c;我们可以推出w和b。特别的&＃xff0c;当 $α_n>0$ 的时候&＃xff0c; $1-y_n*(w^Tz_n&＃43;b) &＃61; 1$ &＃xff0c;而&＃xff1d;1 恰好表示点是在SVM胖胖的边界上的(fat boundary)&＃xff0c;至于为什么嘛。。估计又得看看超平面了。
在这里插入图片描述

P9 2.4
在这里插入图片描述
我们在上节知道了α > 0 的时候&＃xff0c;点在边界上。但是在分类线上的点不一定支持向量&＃xff08;可能有α &＃61; 0的情况&＃xff09;&＃xff0c;所以现在称α>0的点为support vectors&＃xff08;SV&＃xff09;&＃xff0c;仅针对这些SV&＃xff08;就是α>0的&＃xff09;做研究&＃xff0c;范围可能会缩小一些。
在这里插入图片描述
因此 w和b 都可以只靠SV算出来&＃xff0c;因为不是SV的话&＃xff0c;即 α &＃61; 0 的话&＃xff0c;它俩没有意义。

SVM和PLA的式子很像&＃xff0c;他们都是 $y_nz_n$ 的线性组合&＃xff0c;其他的w也差不多&＃xff0c;可以说&＃xff0c;w是资料表现出来的。SVM中的w是只由SV表示的&＃xff0c;PLA则是由犯错的点表示出来。哲学上&＃xff0c;我们要知道要用什么东西&＃xff0c;来表现我们的w。

在这里插入图片描述
对比两种SVM的表示方法&＃xff1a;原始(primal)和对偶(dual)&＃xff0c;hard-margin就是ooxx严格分类不容出错的意思。一般是用Dual SVM。

在这里插入图片描述
最后&＃xff1a;虽然说dual svm只和N有关&＃xff0c;但其实 d^~藏在了q中&＃xff0c;接下来会讲解怎么避开这个 d^~。

最最后的总结&＃xff1a;
在这里插入图片描述

推荐阅读

int
浏览器中的异常检测算法及其在深度学习中的应用

本文介绍了在浏览器中进行异常检测的算法，包括统计学方法和机器学习方法，并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测，可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率，而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]

蜡笔小新 2023-12-12 16:22:39
int
P1651 塔 (动态规划) 的最大高度计算方法

本文介绍了P1651题目的描述和要求，以及计算能搭建的塔的最大高度的方法。通过动态规划和状压技术，将问题转化为求解差值的问题，并定义了相应的状态。最终得出了计算最大高度的解法。 ... [详细]

蜡笔小新 2023-12-13 19:52:19
get
Open judge C16H: Magical Balls 快速幂+逆元问题解析

本文主要解析了Open judge C16H问题中涉及到的Magical Balls的快速幂和逆元算法，并给出了问题的解析和解决方法。详细介绍了问题的背景和规则，并给出了相应的算法解析和实现步骤。通过本文的解析，读者可以更好地理解和解决Open judge C16H问题中的Magical Balls部分。 ... [详细]

蜡笔小新 2023-12-14 12:03:27
java
判断数组是否全为0_连续子数组的最大和的解题思路及代码方法一_动态规划

本文介绍了判断数组是否全为0以及求解连续子数组的最大和的解题思路及代码方法一，即动态规划。通过动态规划的方法，可以找出连续子数组的最大和，具体思路是尽量选择正数的部分，遇到负数则不选择进去，遇到正数则保留并继续考察。本文给出了状态定义和状态转移方程，并提供了具体的代码实现。 ... [详细]

蜡笔小新 2023-12-13 19:17:30
express
sklearn数据集库中的常用数据集类型介绍

本文介绍了sklearn数据集库中常用的数据集类型，包括玩具数据集和样本生成器。其中详细介绍了波士顿房价数据集，包含了波士顿506处房屋的13种不同特征以及房屋价格，适用于回归任务。 ... [详细]

蜡笔小新 2023-12-13 17:45:15
express
hdu 5439（找规律）的数列求和问题

本文讨论了一个数列求和问题，该数列按照一定规律生成。通过观察数列的规律，我们可以得出求解该问题的算法。具体算法为计算前n项i*f[i]的和，其中f[i]表示数列中有i个数字。根据参考的思路，我们可以将算法的时间复杂度控制在O(n)，即计算到5e5即可满足1e9的要求。 ... [详细]

蜡笔小新 2023-12-12 14:05:58
express
Which is more efficient: char str[] or char *str?

This article discusses the efficiency of using char str[] and char *str and whether there is any reason to prefer one over the other. It explains the difference between the two and provides an example to illustrate their usage. ... [详细]

蜡笔小新 2023-12-12 10:13:35
post
机器学习之贝叶斯垃圾邮件分类代码

本文介绍了贝叶斯垃圾邮件分类的机器学习代码，代码来源于https://www.cnblogs.com/huangyc/p/10327209.html，并对代码进行了简介。朴素贝叶斯分类器训练函数包括求p(Ci)和基于词汇表的p(w|Ci)。 ... [详细]

蜡笔小新 2023-12-10 12:24:15
get
使用FLASK REST API的机器学习模型

在本教程中，我们将看到如何使用FLASK制作第一个用于机器学习模型的RESTAPI。我们将从创建机器学习模型开始。然后，我们将看到使用Flask创建AP ... [详细]

蜡笔小新 2023-10-17 19:13:12
format
【论文】ICLR 2020 九篇满分论文！！！

点击上方，选择星标或置顶，每天给你送干货！阅读大概需要11分钟跟随小博主，每天进步一丢丢来自：深度学习技术前沿 ... [详细]

蜡笔小新 2023-10-17 18:45:53
format
微软头条实习生分享深度学习自学指南

本文介绍了一位微软头条实习生自学深度学习的经验分享，包括学习资源推荐、重要基础知识的学习要点等。作者强调了学好Python和数学基础的重要性，并提供了一些建议。 ... [详细]

蜡笔小新 2023-12-14 20:58:32
post
在类中定义数组时出错 - Error on defining arrays in class

Iamtryingtomakeaclassthatwillreadatextfileofnamesintoanarray,thenreturnthatarra ... [详细]

蜡笔小新 2023-12-14 17:38:12
post
HDU 2372 El Dorado（DP）的最长上升子序列长度求解方法

本文介绍了解决HDU 2372 El Dorado问题的一种动态规划方法，通过循环k的方式求解最长上升子序列的长度。具体实现过程包括初始化dp数组、读取数列、计算最长上升子序列长度等步骤。 ... [详细]

蜡笔小新 2023-12-14 15:08:18
require
IB 物理真题解析：比潜热、理想气体的应用

本文是对2017年IB物理试卷paper 2中一道涉及比潜热、理想气体和功率的大题进行解析。题目涉及液氧蒸发成氧气的过程，讲解了液氧和氧气分子的结构以及蒸发后分子之间的作用力变化。同时，文章也给出了解题技巧，建议根据得分点的数量来合理分配答题时间。最后，文章提供了答案解析，标注了每个得分点的位置。 ... [详细]

蜡笔小新 2023-12-14 15:00:29
require
C++省略号类型和参数个数不确定函数参数范例

本文介绍了C++中省略号类型和参数个数不确定函数参数的使用方法，并提供了一个范例。通过宏定义的方式，可以方便地处理不定参数的情况。文章中给出了具体的代码实现，并对代码进行了解释和说明。这对于需要处理不定参数的情况的程序员来说，是一个很有用的参考资料。 ... [详细]

蜡笔小新 2023-12-14 12:36:28

平凡2188

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章