热门标签 | HotTags
当前位置:  开发笔记 > 人工智能 > 正文

感知机--SVM和神经网络的基础(统计学习方法)

感知机,这个名字真是一言难尽~感知机是二类分类的线性分类模型,输入实例的特征向量,输出类别,正负1.感知机旨在求出将实例划分为正负两类的分离超平面。模型:f(x)sign(wx+b

感知机,这个名字真是一言难尽~

感知机是二类分类的线性分类模型,输入实例的特征向量,输出类别,正负1.感知机旨在求出将实例划分为正负两类的分离超平面。

模型:f(x)=sign(wx+b)  这里w和x都是向量  

分离超平面就是,wx+b=0   

怎么求出这个超平面?需要学习策略:这里用的是经验损失最小化。啥意思?就是,这个超平面分错的误差最小。

最直接想到的是,误分类的点数越少,就代表误差越小咯,但是,这个个数的函数并不是一个连续可导的,对w和b不好做优化。接下来就用到了,误分类点到平面的距离之和。

    分母上是L2范数 ,就是向量元素平方和再求根号。

误分类的点,(xi,yi),<0   那么距离就是

这里的分母可以不考虑,为啥?如果这个L2范数规定为1,就相当于对分离超平面这个方程进行了规范化,就好似3x+y=3,可以规范化为x+y/3-1=0,都是指的同一个平面,所以对要求的最小化没有影响。

  min L(w,b)  就是目标函数

接下来就是如何求解参数的问题啦,就是学习算法

这里用的是随机梯度下降法。

先给初值,然后随机选一个误分类点,进行w和b的更新,直到最后没有误分类点。

为啥用这么一个方法呢?


为啥叫原始形式,因为后面还会讲一个对偶形式。

课本上还证明了,这个算法是收敛的,啥意思?就是能通过有限次迭代,使得没有误分类的点,得到参数的解,当然了,给不同的初值,随机选择的误分类点不同,都会导致解的不同,也就是说,这个算法可以得到不止一个解。

SVM就是在感知机的基础上加了约束条件,使得最后的解只有一个。

接下来是对偶形式

其实很简单,因为下降的步长一直不变,我用一个来记录样本点(xi,yi)被误分类的次数(当步长为1时,若不为1,就是次数乘步长)然后,

w和b,可以表示成 

就是把迭代更新的每一步都加起来


这个对偶形式,可以发现,只需要计算样本点特征向量的内积。可以预先用矩阵存储,Gram矩阵。

OK很简单。


推荐阅读
  • cs231n Lecture 3 线性分类笔记(一)
    内容列表线性分类器简介线性评分函数阐明线性分类器损失函数多类SVMSoftmax分类器SVM和Softmax的比较基于Web的可交互线性分类器原型小结注:中文翻译 ... [详细]
  • 浏览器中的异常检测算法及其在深度学习中的应用
    本文介绍了在浏览器中进行异常检测的算法,包括统计学方法和机器学习方法,并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测,可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率,而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]
  • Opencv提供了几种分类器,例程里通过字符识别来进行说明的1、支持向量机(SVM):给定训练样本,支持向量机建立一个超平面作为决策平面,使得正例和反例之间的隔离边缘被最大化。函数原型:训练原型cv ... [详细]
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • Learning to Paint with Model-based Deep Reinforcement Learning
    本文介绍了一种基于模型的深度强化学习方法,通过结合神经渲染器,教机器像人类画家一样进行绘画。该方法能够生成笔画的坐标点、半径、透明度、颜色值等,以生成类似于给定目标图像的绘画。文章还讨论了该方法面临的挑战,包括绘制纹理丰富的图像等。通过对比实验的结果,作者证明了基于模型的深度强化学习方法相对于基于模型的DDPG和模型无关的DDPG方法的优势。该研究对于深度强化学习在绘画领域的应用具有重要意义。 ... [详细]
  • 背景应用安全领域,各类攻击长久以来都危害着互联网上的应用,在web应用安全风险中,各类注入、跨站等攻击仍然占据着较前的位置。WAF(Web应用防火墙)正是为防御和阻断这类攻击而存在 ... [详细]
  • 建立分类感知器二元模型对样本数据进行分类
    本文介绍了建立分类感知器二元模型对样本数据进行分类的方法。通过建立线性模型,使用最小二乘、Logistic回归等方法进行建模,考虑到可能性的大小等因素。通过极大似然估计求得分类器的参数,使用牛顿-拉菲森迭代方法求解方程组。同时介绍了梯度上升算法和牛顿迭代的收敛速度比较。最后给出了公式法和logistic regression的实现示例。 ... [详细]
  • 读手语图像识别论文笔记2
    文章目录一、前言二、笔记1.名词解释2.流程分析上一篇快速门:读手语图像识别论文笔记1(手语识别背景和方法)一、前言一句:“做完了&#x ... [详细]
  • 【论文】ICLR 2020 九篇满分论文!!!
    点击上方,选择星标或置顶,每天给你送干货!阅读大概需要11分钟跟随小博主,每天进步一丢丢来自:深度学习技术前沿 ... [详细]
  • 1.组合最优化问题定义:是通过数学方法的研究去寻找离散事件的最优编排、分组、次序或筛选等。描述:最优化问题的数学模型的一般描述是,x为决策 ... [详细]
  • OCR:用字符识别方法将形状翻译成计算机文字的过程Matlab:商业数学软件;CUDA:CUDA™是一种由NVIDIA推 ... [详细]
  • 3年半巨亏242亿!商汤高估了深度学习,下错了棋?
    转自:新智元三年半研发开支近70亿,累计亏损242亿。AI这门生意好像越来越不好做了。近日,商汤科技已向港交所递交IPO申请。招股书显示& ... [详细]
  • 程度|也就是_论文精读:Neural Architecture Search without Training
    篇首语:本文由编程笔记#小编为大家整理,主要介绍了论文精读:NeuralArchitectureSearchwithoutTraining相关的知识,希望对你有一定的参考价值。 ... [详细]
  • Two Sigma人均22万英镑~
    近期原创文章: ... [详细]
  • 「爆干7天7夜」入门AI人工智能学习路线一条龙,真的不能再透彻了
    前言应广大粉丝要求,今天迪迦来和大家讲解一下如何去入门人工智能,也算是迪迦对自己学习人工智能这么多年的一个总结吧,本条学习路线并不会那么 ... [详细]
author-avatar
卿为倾峰888
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有