热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

一般化理论(六)

上一节中,我们说我们的假设函数集合是无限大的,那么我们的想法是找到这样的一个成长函数来代替原来的无限大的假设函数集合数目。我们遗留的问题在perceptron的时候,我们的没有找到其成长函数。我们只是

上一节中,我们说我们的假设函数集合是无限大的,那么我们的想法是找到这样的一个成长函数来代替原来的无限大的假设函数集合数目。

我们遗留的问题在perceptron的时候,我们的没有找到其成长函数。我们只是得出其break point 是4,我们猜想是不是其成长函数就是O(N三次方)呢?

下面我们具体的讨论


如果我告诉你一个假设函数集合的break point是2

那么当N=1的时候我们的组合是2,是等于2的一次方的,我们称之为shatter。

那么当N=2的时候我们的组合情况是小于4的,也就是我们称之为不能shatter,经过计算我们得出只有3个组合。

那么当我们的N=3时,情况是什么样的呢?注意我们的break point是2,那么在以后的情况中都不能出现任意两个点的shatter。

比如这种情况,我们shatter了X2和X3:

                   

那么经过的一番尝试,我们最后得出我们最多找到这4个组个的情况:

我们看一下,当N为2的时候我们的组合最多是3种,比2的2次方小了一点点,当我们的N=3的时候组合的情况最多是4种,比2的3次方小了很多。

那么我们的成长函数是不是也是一个多项式呢?

bounding Founction 这个界限函数指的是:当break point  是K的时候的,我们的最多的dichotomy是多少。 我们想找到的是我们的界限函数只和N和break point K的值有关,即B(N,K)。 我们想知道这个界限函数是不是一个多项式呢?下面我们来填一个表: 注意:我们的横坐标是break point 的值,纵坐标指的是我们的样本集合的数目N     1.首先我们之前将的是当break point  为2的时候,其N为2和3的时候值为3和4     2.我们填写第一列的值,第一列指的是我们的break point 是1,也就是说任意一个点都不能被shatter,指的就是任意一个点,我们都不能既有类别A,又有类别B的情况,最后得出我们只能有1中组合     3.当我们的样本集合点数目小于break point K的时候,这个时候我们的K没有意义了,组合情况就是2的N次方种     4.当N=K的时候,其实就是正好是break point 的时候,我们遇到的情况是2的N次方不行的,只需要减一种就行,也就是2的N次方-1。 剩余的没填的部分是我们的重点。 假如我们想要填写B(4,3),我们先把其组合的结果穷举出来: 我们把这些11种结果进行分析: 我们发现前八个是这样的特性,X1,X2,X3是一样的,X4是不一样的,而后四个是没有这样的。       然后我们把这11个结果用这样的式子表示出来: 然后我们把这11个的的X1,X2,X3 拿出来: 由于刚才说B(4,3)的要求是任何的三个点都不能被shatter,那么X1,X2,X3也不能被shatter。 那么: 如果我们只看前八个的X1,X2,X3 这种情况下任意两个点不能被shatter,因为他们的X4已经被shatter,如果再有两个被shatter,那么就会有三个,不满足了。 所以: 最终我们得出: 最终我们推出下面的结论: 最后填表如下: 根据上面的推论,我们可以用归纳法得出如下结论:

那么根据上面的公式我们就能得出perceptron的成长函数的一个上限:


最后的一步 我们不能直接的把上面求得的成长函数的上限带入到霍夫丁不等式,因为E(out)(h)是无限多的,原因是我们的真实的数据是无限多的。根据推导求得最后的结果是:    推导的过程还是看原视频把,老师推导的时候也没打算要把推导的过程讲的很仔细。 根据上面的公式我们可以看到成长函数是小于O(N的三次方的)那么我们就得出随着N的增大,不等式的右边的值会很小。 也就是说如果N足够的大,我们的PLA演算法找到的E(in)(h)真的是可以代表E(out)(h)。




推荐阅读
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • [译]技术公司十年经验的职场生涯回顾
    本文是一位在技术公司工作十年的职场人士对自己职业生涯的总结回顾。她的职业规划与众不同,令人深思又有趣。其中涉及到的内容有机器学习、创新创业以及引用了女性主义者在TED演讲中的部分讲义。文章表达了对职业生涯的愿望和希望,认为人类有能力不断改善自己。 ... [详细]
  • sklearn数据集库中的常用数据集类型介绍
    本文介绍了sklearn数据集库中常用的数据集类型,包括玩具数据集和样本生成器。其中详细介绍了波士顿房价数据集,包含了波士顿506处房屋的13种不同特征以及房屋价格,适用于回归任务。 ... [详细]
  • 浏览器中的异常检测算法及其在深度学习中的应用
    本文介绍了在浏览器中进行异常检测的算法,包括统计学方法和机器学习方法,并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测,可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率,而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]
  • 本文由编程笔记#小编为大家整理,主要介绍了logistic回归(线性和非线性)相关的知识,包括线性logistic回归的代码和数据集的分布情况。希望对你有一定的参考价值。 ... [详细]
  • 微软头条实习生分享深度学习自学指南
    本文介绍了一位微软头条实习生自学深度学习的经验分享,包括学习资源推荐、重要基础知识的学习要点等。作者强调了学好Python和数学基础的重要性,并提供了一些建议。 ... [详细]
  • Linux服务器密码过期策略、登录次数限制、私钥登录等配置方法
    本文介绍了在Linux服务器上进行密码过期策略、登录次数限制、私钥登录等配置的方法。通过修改配置文件中的参数,可以设置密码的有效期、最小间隔时间、最小长度,并在密码过期前进行提示。同时还介绍了如何进行公钥登录和修改默认账户用户名的操作。详细步骤和注意事项可参考本文内容。 ... [详细]
  • JVM 学习总结(三)——对象存活判定算法的两种实现
    本文介绍了垃圾收集器在回收堆内存前确定对象存活的两种算法:引用计数算法和可达性分析算法。引用计数算法通过计数器判定对象是否存活,虽然简单高效,但无法解决循环引用的问题;可达性分析算法通过判断对象是否可达来确定存活对象,是主流的Java虚拟机内存管理算法。 ... [详细]
  • 《数据结构》学习笔记3——串匹配算法性能评估
    本文主要讨论串匹配算法的性能评估,包括模式匹配、字符种类数量、算法复杂度等内容。通过借助C++中的头文件和库,可以实现对串的匹配操作。其中蛮力算法的复杂度为O(m*n),通过随机取出长度为m的子串作为模式P,在文本T中进行匹配,统计平均复杂度。对于成功和失败的匹配分别进行测试,分析其平均复杂度。详情请参考相关学习资源。 ... [详细]
  • 不同优化算法的比较分析及实验验证
    本文介绍了神经网络优化中常用的优化方法,包括学习率调整和梯度估计修正,并通过实验验证了不同优化算法的效果。实验结果表明,Adam算法在综合考虑学习率调整和梯度估计修正方面表现较好。该研究对于优化神经网络的训练过程具有指导意义。 ... [详细]
  • 本文介绍了在Python张量流中使用make_merged_spec()方法合并设备规格对象的方法和语法,以及参数和返回值的说明,并提供了一个示例代码。 ... [详细]
  • GPT-3发布,动动手指就能自动生成代码的神器来了!
    近日,OpenAI发布了最新的NLP模型GPT-3,该模型在GitHub趋势榜上名列前茅。GPT-3使用的数据集容量达到45TB,参数个数高达1750亿,训练好的模型需要700G的硬盘空间来存储。一位开发者根据GPT-3模型上线了一个名为debuid的网站,用户只需用英语描述需求,前端代码就能自动生成。这个神奇的功能让许多程序员感到惊讶。去年,OpenAI在与世界冠军OG战队的表演赛中展示了他们的强化学习模型,在限定条件下以2:0完胜人类冠军。 ... [详细]
  • 背景应用安全领域,各类攻击长久以来都危害着互联网上的应用,在web应用安全风险中,各类注入、跨站等攻击仍然占据着较前的位置。WAF(Web应用防火墙)正是为防御和阻断这类攻击而存在 ... [详细]
  • 本文介绍了贝叶斯垃圾邮件分类的机器学习代码,代码来源于https://www.cnblogs.com/huangyc/p/10327209.html,并对代码进行了简介。朴素贝叶斯分类器训练函数包括求p(Ci)和基于词汇表的p(w|Ci)。 ... [详细]
  • 建立分类感知器二元模型对样本数据进行分类
    本文介绍了建立分类感知器二元模型对样本数据进行分类的方法。通过建立线性模型,使用最小二乘、Logistic回归等方法进行建模,考虑到可能性的大小等因素。通过极大似然估计求得分类器的参数,使用牛顿-拉菲森迭代方法求解方程组。同时介绍了梯度上升算法和牛顿迭代的收敛速度比较。最后给出了公式法和logistic regression的实现示例。 ... [详细]
author-avatar
firespace
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有