当前位置: 开发笔记 > 编程语言 > 正文

一般化理论（六）

作者：firespace | 来源：互联网 | 2023-10-09 19:46

上一节中，我们说我们的假设函数集合是无限大的，那么我们的想法是找到这样的一个成长函数来代替原来的无限大的假设函数集合数目。我们遗留的问题在perceptron的时候，我们的没有找到其成长函数。我们只是

上一节中，我们说我们的假设函数集合是无限大的，那么我们的想法是找到这样的一个成长函数来代替原来的无限大的假设函数集合数目。

我们遗留的问题在perceptron的时候，我们的没有找到其成长函数。我们只是得出其break point 是4，我们猜想是不是其成长函数就是O（N三次方）呢？

下面我们具体的讨论

如果我告诉你一个假设函数集合的break point是2

那么当N=1的时候我们的组合是2，是等于2的一次方的，我们称之为shatter。

那么当N=2的时候我们的组合情况是小于4的，也就是我们称之为不能shatter，经过计算我们得出只有3个组合。

那么当我们的N=3时，情况是什么样的呢？注意我们的break point是2，那么在以后的情况中都不能出现任意两个点的shatter。

比如这种情况，我们shatter了X2和X3：

那么经过的一番尝试，我们最后得出我们最多找到这4个组个的情况：

我们看一下，当N为2的时候我们的组合最多是3种，比2的2次方小了一点点，当我们的N=3的时候组合的情况最多是4种，比2的3次方小了很多。

那么我们的成长函数是不是也是一个多项式呢？

bounding Founction 这个界限函数指的是：当break point 是K的时候的，我们的最多的dichotomy是多少。我们想找到的是我们的界限函数只和N和break point K的值有关，即B(N,K)。我们想知道这个界限函数是不是一个多项式呢？下面我们来填一个表：

注意：我们的横坐标是break point 的值，纵坐标指的是我们的样本集合的数目N 1.首先我们之前将的是当break point 为2的时候，其N为2和3的时候值为3和4 2.我们填写第一列的值，第一列指的是我们的break point 是1，也就是说任意一个点都不能被shatter，指的就是任意一个点，我们都不能既有类别A，又有类别B的情况，最后得出我们只能有1中组合 3.当我们的样本集合点数目小于break point K的时候，这个时候我们的K没有意义了，组合情况就是2的N次方种 4.当N=K的时候，其实就是正好是break point 的时候，我们遇到的情况是2的N次方不行的，只需要减一种就行，也就是2的N次方-1。剩余的没填的部分是我们的重点。假如我们想要填写B（4,3），我们先把其组合的结果穷举出来：

我们把这些11种结果进行分析：

我们发现前八个是这样的特性，X1，X2，X3是一样的，X4是不一样的，而后四个是没有这样的。然后我们把这11个结果用这样的式子表示出来：

然后我们把这11个的的X1，X2，X3 拿出来：

由于刚才说B（4,3）的要求是任何的三个点都不能被shatter，那么X1，X2，X3也不能被shatter。那么：

如果我们只看前八个的X1,X2,X3

在这种情况下任意两个点不能被shatter，因为他们的X4已经被shatter，如果再有两个被shatter，那么就会有三个，不满足了。所以：

最终我们得出：

最终我们推出下面的结论：

最后填表如下：

根据上面的推论，我们可以用归纳法得出如下结论：

那么根据上面的公式我们就能得出perceptron的成长函数的一个上限：

最后的一步我们不能直接的把上面求得的成长函数的上限带入到霍夫丁不等式，因为E(out)(h)是无限多的，原因是我们的真实的数据是无限多的。根据推导求得最后的结果是：

推导的过程还是看原视频把，老师推导的时候也没打算要把推导的过程讲的很仔细。根据上面的公式我们可以看到成长函数是小于O（N的三次方的）那么我们就得出随着N的增大，不等式的右边的值会很小。也就是说如果N足够的大，我们的PLA演算法找到的E（in）（h）真的是可以代表E（out）（h）。

推荐阅读

rsa
【机器学习】生成式对抗网络模型综述

生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型，可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]

蜡笔小新 2023-12-14 17:51:18
function
[译]技术公司十年经验的职场生涯回顾

本文是一位在技术公司工作十年的职场人士对自己职业生涯的总结回顾。她的职业规划与众不同，令人深思又有趣。其中涉及到的内容有机器学习、创新创业以及引用了女性主义者在TED演讲中的部分讲义。文章表达了对职业生涯的愿望和希望，认为人类有能力不断改善自己。 ... [详细]

蜡笔小新 2023-12-14 11:31:05
function
浏览器中的异常检测算法及其在深度学习中的应用

本文介绍了在浏览器中进行异常检测的算法，包括统计学方法和机器学习方法，并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测，可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率，而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]

蜡笔小新 2023-12-12 16:22:39
bit
【论文】ICLR 2020 九篇满分论文！！！

点击上方，选择星标或置顶，每天给你送干货！阅读大概需要11分钟跟随小博主，每天进步一丢丢来自：深度学习技术前沿 ... [详细]

蜡笔小新 2023-10-17 18:45:53
int
提升Python编程效率的十点建议

本文介绍了提升Python编程效率的十点建议，包括不使用分号、选择合适的代码编辑器、遵循Python代码规范等。这些建议可以帮助开发者节省时间，提高编程效率。同时，还提供了相关参考链接供读者深入学习。 ... [详细]

蜡笔小新 2023-12-14 21:51:04
int
JVM 学习总结（三）——对象存活判定算法的两种实现

本文介绍了垃圾收集器在回收堆内存前确定对象存活的两种算法：引用计数算法和可达性分析算法。引用计数算法通过计数器判定对象是否存活，虽然简单高效，但无法解决循环引用的问题；可达性分析算法通过判断对象是否可达来确定存活对象，是主流的Java虚拟机内存管理算法。 ... [详细]

蜡笔小新 2023-12-13 18:59:46
blob
【机器学习手册】日期和时区操作的重要性及应用

本文介绍了机器学习手册中关于日期和时区操作的重要性以及其在实际应用中的作用。文章以一个故事为背景，描述了学童们面对老先生的教导时的反应，以及上官如在这个过程中的表现。同时，文章也提到了顾慎为对上官如的恨意以及他们之间的矛盾源于早年的结局。最后，文章强调了日期和时区操作在机器学习中的重要性，并指出了其在实际应用中的作用和意义。 ... [详细]

蜡笔小新 2023-12-12 17:40:14
object
Python张量流中的device spec make_merged_spec()方法使用说明

本文介绍了在Python张量流中使用make_merged_spec()方法合并设备规格对象的方法和语法，以及参数和返回值的说明，并提供了一个示例代码。 ... [详细]

蜡笔小新 2023-12-11 12:15:19
object
GPT-3发布，动动手指就能自动生成代码的神器来了！

近日，OpenAI发布了最新的NLP模型GPT-3，该模型在GitHub趋势榜上名列前茅。GPT-3使用的数据集容量达到45TB，参数个数高达1750亿，训练好的模型需要700G的硬盘空间来存储。一位开发者根据GPT-3模型上线了一个名为debuid的网站，用户只需用英语描述需求，前端代码就能自动生成。这个神奇的功能让许多程序员感到惊讶。去年，OpenAI在与世界冠军OG战队的表演赛中展示了他们的强化学习模型，在限定条件下以2:0完胜人类冠军。 ... [详细]

蜡笔小新 2023-12-11 11:04:43
object
揭秘阿里云WAF背后神秘的AI智能防御体系

背景应用安全领域，各类攻击长久以来都危害着互联网上的应用，在web应用安全风险中，各类注入、跨站等攻击仍然占据着较前的位置。WAF(Web应用防火墙)正是为防御和阻断这类攻击而存在 ... [详细]

蜡笔小新 2023-12-11 01:30:52
object
机器学习之贝叶斯垃圾邮件分类代码

本文介绍了贝叶斯垃圾邮件分类的机器学习代码，代码来源于https://www.cnblogs.com/huangyc/p/10327209.html，并对代码进行了简介。朴素贝叶斯分类器训练函数包括求p(Ci)和基于词汇表的p(w|Ci)。 ... [详细]

蜡笔小新 2023-12-10 12:24:15
object
建立分类感知器二元模型对样本数据进行分类

本文介绍了建立分类感知器二元模型对样本数据进行分类的方法。通过建立线性模型，使用最小二乘、Logistic回归等方法进行建模，考虑到可能性的大小等因素。通过极大似然估计求得分类器的参数，使用牛顿-拉菲森迭代方法求解方程组。同时介绍了梯度上升算法和牛顿迭代的收敛速度比较。最后给出了公式法和logistic regression的实现示例。 ... [详细]

蜡笔小新 2023-12-09 10:22:15
php
机器学习算法代码实现——线性回归

前言：拿到一个案例，去分析：它该是做分类还是做回归，哪部分该做分类，哪部分该做回归，哪部分该做优化，它们的目标值分别是什么。再挑影响因素，哪些和分类有关的影响因素，哪些和回归有关的 ... [详细]

蜡笔小新 2023-10-17 19:58:52
function
cs231n Lecture 3 线性分类笔记（一）

内容列表线性分类器简介线性评分函数阐明线性分类器损失函数多类SVMSoftmax分类器SVM和Softmax的比较基于Web的可交互线性分类器原型小结注：中文翻译 ... [详细]

蜡笔小新 2023-10-17 19:40:56
int
使用FLASK REST API的机器学习模型

在本教程中，我们将看到如何使用FLASK制作第一个用于机器学习模型的RESTAPI。我们将从创建机器学习模型开始。然后，我们将看到使用Flask创建AP ... [详细]

蜡笔小新 2023-10-17 19:13:12

firespace

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章