热门标签 | HotTags
当前位置:  开发笔记 > 后端 > 正文

机器学习基石第十二周笔记

一.QuadraticHypothesis之前学习了线型的分类器,今天将介绍非线性的分类器。下图左边的数据,我们用直线分类器能够很容易的将数据分开&#x

一.Quadratic Hypothesis
之前学习了线型的分类器,今天将介绍非线性的分类器。
下图左边的数据,我们用直线分类器能够很容易的将数据分开,但是右边的数据我们却不行,那么我们该怎么办呢?
这里写图片描述
之前对于线型不可分的数据我们容许有一定的误差,但是这里的误差明显太大了,所以不能应用。但是我们发现该数据是能够用一个圆进行分割的,所以这里我们将应用Circular Separable.
这里写图片描述
这里写图片描述
我们将输入特征进行转换,另z0=1,z1=x1^2,z2=x2^2并将x空间的数据映射到z空间进行显示,发现数据在z空间能够被线型分开,于是我们就能在z空间使用之前所学过的知识进行分类了。
这里写图片描述
我们能够学得的结果如下图所示,能够是圆,椭圆,双曲线和常数,这样我们就相当于用x空间的上述形状对数据进行分类了。
这里写图片描述
但是上述的模型学到的圆等形状他们的原点必须要在圆心,要想突破这个限制我们在从x转换到z空间的时候需要增加移动项的组合。
这里写图片描述
仔细分析会发现,当后三项为0时形状就会退化成直线,所以上述模型里面包含了直线和常数模型。
二.Nonlinear Transform
非线性分类的流程如下所示,首先进行特征转换将x空间转换成z空间,在z空间进行线型分类,然后将分类好的点反转换回x空间。
注:实际上是对x空间的一个点进行转换分类后直接将该点进行标记,而不是将转换的点进行反转换
这里写图片描述

三.Price of Nonlinear Transform
想象很美好,现实很骨感,为了实现上述的φ的转换,我们要付出极大的计算和内存空间,假如我们的原始数据的维数为d,我们要转换的多项式次数为Q,那么我们转换后的数据的维数将会是O(Q^d)这将会额外浪费极大的计算资源和效率。
这里写图片描述
同样的,由于d的增加,我们的VC维也会增加,这就会增加模型的复杂度。
这里写图片描述
所以我们应该如何选取Q也成为了一个难题,如下两幅图,当我们选择大的Q时Ein会下降,但是Eout与Ein的差会变大,选择小的Q,Ein会增加,但是Ein与Eout的差距会变小,这就会形成矛盾。
这里写图片描述
但是我们绝对不要靠我们的眼睛来决定Q的大小,因为第一,我们的眼睛不能够看到大于3维的数据,而我们所用的数据大多是三维以上,第二,我们的眼睛会带入主观偏见,这会妨碍算法求得真正的规律。
这里写图片描述
这里写图片描述

四.Structured Hypothesis Sets
从Q=1到Q=n假设空间的变化及关系如下图所示:
这里写图片描述
VC维和Ein的关系如下图所示:
这里写图片描述
那我们该怎么决定Q呢?我们应该从Q=1开始从简单往难的模型进行试验,如果简单的模型能找到一个小的Ein那么我们就选择它。
这里写图片描述


推荐阅读
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • 本文介绍了设计师伊振华受邀参与沈阳市智慧城市运行管理中心项目的整体设计,并以数字赋能和创新驱动高质量发展的理念,建设了集成、智慧、高效的一体化城市综合管理平台,促进了城市的数字化转型。该中心被称为当代城市的智能心脏,为沈阳市的智慧城市建设做出了重要贡献。 ... [详细]
  • CSS3选择器的使用方法详解,提高Web开发效率和精准度
    本文详细介绍了CSS3新增的选择器方法,包括属性选择器的使用。通过CSS3选择器,可以提高Web开发的效率和精准度,使得查找元素更加方便和快捷。同时,本文还对属性选择器的各种用法进行了详细解释,并给出了相应的代码示例。通过学习本文,读者可以更好地掌握CSS3选择器的使用方法,提升自己的Web开发能力。 ... [详细]
  • sklearn数据集库中的常用数据集类型介绍
    本文介绍了sklearn数据集库中常用的数据集类型,包括玩具数据集和样本生成器。其中详细介绍了波士顿房价数据集,包含了波士顿506处房屋的13种不同特征以及房屋价格,适用于回归任务。 ... [详细]
  • GPT-3发布,动动手指就能自动生成代码的神器来了!
    近日,OpenAI发布了最新的NLP模型GPT-3,该模型在GitHub趋势榜上名列前茅。GPT-3使用的数据集容量达到45TB,参数个数高达1750亿,训练好的模型需要700G的硬盘空间来存储。一位开发者根据GPT-3模型上线了一个名为debuid的网站,用户只需用英语描述需求,前端代码就能自动生成。这个神奇的功能让许多程序员感到惊讶。去年,OpenAI在与世界冠军OG战队的表演赛中展示了他们的强化学习模型,在限定条件下以2:0完胜人类冠军。 ... [详细]
  • 本文介绍了在go语言中利用(*interface{})(nil)传递参数类型的原理及应用。通过分析Martini框架中的injector类型的声明,解释了values映射表的作用以及parent Injector的含义。同时,讨论了该技术在实际开发中的应用场景。 ... [详细]
  • 本文介绍了一道经典的状态压缩题目——关灯问题2,并提供了解决该问题的算法思路。通过使用二进制表示灯的状态,并枚举所有可能的状态,可以求解出最少按按钮的次数,从而将所有灯关掉。本文还对状压和位运算进行了解释,并指出了该方法的适用性和局限性。 ... [详细]
  • 建立分类感知器二元模型对样本数据进行分类
    本文介绍了建立分类感知器二元模型对样本数据进行分类的方法。通过建立线性模型,使用最小二乘、Logistic回归等方法进行建模,考虑到可能性的大小等因素。通过极大似然估计求得分类器的参数,使用牛顿-拉菲森迭代方法求解方程组。同时介绍了梯度上升算法和牛顿迭代的收敛速度比较。最后给出了公式法和logistic regression的实现示例。 ... [详细]
  • cs231n Lecture 3 线性分类笔记(一)
    内容列表线性分类器简介线性评分函数阐明线性分类器损失函数多类SVMSoftmax分类器SVM和Softmax的比较基于Web的可交互线性分类器原型小结注:中文翻译 ... [详细]
  • 深度学习中的Vision Transformer (ViT)详解
    本文详细介绍了深度学习中的Vision Transformer (ViT)方法。首先介绍了相关工作和ViT的基本原理,包括图像块嵌入、可学习的嵌入、位置嵌入和Transformer编码器等。接着讨论了ViT的张量维度变化、归纳偏置与混合架构、微调及更高分辨率等方面。最后给出了实验结果和相关代码的链接。本文的研究表明,对于CV任务,直接应用纯Transformer架构于图像块序列是可行的,无需依赖于卷积网络。 ... [详细]
  • 词袋模型的通俗介绍
    词,袋, ... [详细]
  • 合并列值-合并为一列问题需求:createtabletab(Aint,Bint,Cint)inserttabselect1,2,3unionallsel ... [详细]
  • 本文介绍了如何使用n3-charts绘制以日期为x轴的数据,并提供了相应的代码示例。通过设置x轴的类型为日期,可以实现对日期数据的正确显示和处理。同时,还介绍了如何设置y轴的类型和其他相关参数。通过本文的学习,读者可以掌握使用n3-charts绘制日期数据的方法。 ... [详细]
  • 本文整理了Java中org.apache.solr.common.SolrDocument.setField()方法的一些代码示例,展示了SolrDocum ... [详细]
  • 本文整理了常用的CSS属性及用法,包括背景属性、边框属性、尺寸属性、可伸缩框属性、字体属性和文本属性等,方便开发者查阅和使用。 ... [详细]
author-avatar
你说Dan_795
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有