热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

台大林轩田老师机器学习基石学习笔记10

这一堂课是主要讲的是逻辑回归(LogisticRegression)。但是这个回归问题在问题的执行上更像是个分类问题,但是有和分类问题不一

这一堂课是主要讲的是逻辑回归(Logistic Regression)。但是这个回归问题在问题的执行上更像是个分类问题,但是有和分类问题不一样。按照老师的观点:


logistic regression是这样定义的

我们从要解决的问题是:


有一组病人的数据,我们需要根据下一位病人的病症来判断其是否患病。


变成了:


有一组病人的数据,我们需要预测他们在一段时间后患上心脏病的“可能性”,就是我们要考虑的问题。


那么问题来了:
通过二值分类,我们仅仅能够预测病人是否会患上心脏病,不同于此的是,现在我们还关心患病的可能性,即 f(x) = P(+1|x),取值范围是区间 [0,1]。
我们之前的计算bound也好计算回归式也好,那一定是会有大于1或者小于0的数值出现的呀。这时候怎么办呢?
其实我们转换一下思维:
我们能不能找一个映射关系,能够合理将bound通过权重计算得到的数值,经过元算得到一个[0,1]区间的值呢?
逻辑斯蒂回归选择的这个么个映射函数是S型的sigmoid 函数。
这里写图片描述
s 取值范围是整个实数域,
f(x) 单调递增&#xff0c;0 <&#61; f(x) <&#61;1。
这里写图片描述
于是整理一下&#xff0c;让他变成一个合理的h(x)&#xff1a;
这里写图片描述


回归方程出来就够了吗

答案是否定的我们还要知道Ein的表述&#xff0c;因为作为一个优秀的机器学习算法怎么能让Ein很大呢&#xff1a;
我们先看看我们的目标函数&#xff1a;
这里写图片描述
我们知道&#xff1a;
当y &#61; &#43;1 时&#xff0c; P(y|x) &#61; f(x);
当y &#61; -1 时&#xff0c; P(y|x) &#61; 1 - f(x).
在机器学习假设中&#xff0c;数据集D 是由f 产生的&#xff0c;我们可以按照这个思路&#xff0c;考虑f 和假设 h 生成训练数据D的概率。
下面这句话比较拗口&#xff0c;但是好多博主都这样理解&#xff1a;
训练数据的客观存在的&#xff0c;显然越有可能生成该数据集的假设h越大越好。所以此处用的是相乘&#xff08;h的相乘&#xff09;。
最后我们通过化简&#xff08;数学家略过&#xff09;&#xff1a;
这里写图片描述
再将θ换成我逻辑回归的回归函数&#xff1a;
得到
这里写图片描述
这里补充&#xff1a;
来自GAN 的发展对于研究通用人工智能有什么意义&#xff1f; 的一句话


回到根源&#xff0c;什么是机器学习&#xff1f;一句话来概括就是&#xff0c;在训练过程中给予回馈&#xff0c;使得结果接近我们的期望。对于分类问题&#xff08;classification&#xff09;&#xff0c;我们希望 loss 在接近 bound 以后&#xff0c;就不要再有变化&#xff0c;所以我们选择交叉熵&#xff08;Cross Entropy&#xff09;作为回馈&#xff1b;在回归问题&#xff08;regression&#xff09;中&#xff0c;我们则希望 loss 只有在两者一摸一样时才保持不变&#xff0c;所以选择点之间的欧式距离&#xff08;MSE&#xff09;作为回馈。损失函数&#xff08;回馈&#xff09;的选择&#xff0c;会明显影响到训练结果的质量&#xff0c;是设计模型的重中之重。这五年来&#xff0c;神经网络的变种已有不下几百种&#xff0c;但损失函数却寥寥无几。



逻辑回归的误差函数的梯度

梯度的概念是很常规的数学概念了&#xff0c;
这里写图片描述
这个玩意的计算公式是&#xff1a;
这里写图片描述
我们要让他最小&#xff0c;自然是属于极小值的时候最好是最小值的时候&#xff0c;我们有人已经证明了&#xff0c;这个Ein的图像应该是一个抛物线&#xff0c;那么这个抛物线的最小值自然是谷底&#xff0c;所以给出一个思路&#xff1a;
这里写图片描述
这个方法我们又称为&#xff1a;
这里写图片描述
这是个循序渐进的方法。


最经典的优化算法——梯度下降法

要寻找目标函数曲线的波谷&#xff0c;采用贪心法&#xff1a;想象一个小人站在半山腰&#xff0c;他朝哪个方向跨一步&#xff0c;可以使他距离谷底更近&#xff08;位置更低&#xff09;&#xff0c;就朝这个方向前进。这个方向可以通过微分得到。选择足够小的一段曲线&#xff0c;可以将这段看做直线段&#xff0c;为了方便计算&#xff0c;将上式近似可得。
这里写图片描述

但是&#xff1a;
这里写图片描述
下降比较多的或者太小可能不是特别好
【梯度下降的算法等博主闲下来&#xff0c;稍微分享下】
所以我有这么个想法&#xff1a;
距离谷底较远时&#xff0c;步幅大些比较好&#xff1b;
接近谷底时&#xff0c;步幅小些比较好&#xff08;以免跨过界&#xff09;。
距离谷底的远近可以通过梯度的数值大小间接反映&#xff0c;接近谷底时&#xff0c;坡度会减小。
因此&#xff0c;我们希望步幅与梯度数值大小正相关。
当到达迭代次数或者梯度足够接近0&#xff08;算法收敛&#xff09;
原式子可以改写为
这里写图片描述
这个时候当我们找到了谷底&#xff0c;整一个梯度下降执行成功&#xff0c;我们的逻辑回归也到此结束&#xff1a;
这里写图片描述
我们做了实验可以知道&#xff0c;逻辑回归可以很舒服的实现分类问题&#xff0c;这个和PLA的结果一样但是用的是全新的思路【毕竟是基于0\1问题】&#xff1a;
这里写图片描述
之后也是【等博主有时间&#xff0c;上传逻辑回归的实验方式】
补充&#xff1a;


逻辑回归和某个更高阶的【深度学习】算法有神似之处呢&#xff01;


最后总结一下&#xff1a;上图&#xff0c;英文很简单的啦&#xff1a;
这里写图片描述
分别从逻辑回归方程、代价函数、代价函数梯度、到梯度下降优化算法来讲解了这一类的像分类问题的回归问题。


推荐阅读
  • 背景应用安全领域,各类攻击长久以来都危害着互联网上的应用,在web应用安全风险中,各类注入、跨站等攻击仍然占据着较前的位置。WAF(Web应用防火墙)正是为防御和阻断这类攻击而存在 ... [详细]
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • 浏览器中的异常检测算法及其在深度学习中的应用
    本文介绍了在浏览器中进行异常检测的算法,包括统计学方法和机器学习方法,并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测,可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率,而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]
  • 建立分类感知器二元模型对样本数据进行分类
    本文介绍了建立分类感知器二元模型对样本数据进行分类的方法。通过建立线性模型,使用最小二乘、Logistic回归等方法进行建模,考虑到可能性的大小等因素。通过极大似然估计求得分类器的参数,使用牛顿-拉菲森迭代方法求解方程组。同时介绍了梯度上升算法和牛顿迭代的收敛速度比较。最后给出了公式法和logistic regression的实现示例。 ... [详细]
  • 【论文】ICLR 2020 九篇满分论文!!!
    点击上方,选择星标或置顶,每天给你送干货!阅读大概需要11分钟跟随小博主,每天进步一丢丢来自:深度学习技术前沿 ... [详细]
  • 微软头条实习生分享深度学习自学指南
    本文介绍了一位微软头条实习生自学深度学习的经验分享,包括学习资源推荐、重要基础知识的学习要点等。作者强调了学好Python和数学基础的重要性,并提供了一些建议。 ... [详细]
  • 2018年人工智能大数据的爆发,学Java还是Python?
    本文介绍了2018年人工智能大数据的爆发以及学习Java和Python的相关知识。在人工智能和大数据时代,Java和Python这两门编程语言都很优秀且火爆。选择学习哪门语言要根据个人兴趣爱好来决定。Python是一门拥有简洁语法的高级编程语言,容易上手。其特色之一是强制使用空白符作为语句缩进,使得新手可以快速上手。目前,Python在人工智能领域有着广泛的应用。如果对Java、Python或大数据感兴趣,欢迎加入qq群458345782。 ... [详细]
  • YOLOv7基于自己的数据集从零构建模型完整训练、推理计算超详细教程
    本文介绍了关于人工智能、神经网络和深度学习的知识点,并提供了YOLOv7基于自己的数据集从零构建模型完整训练、推理计算的详细教程。文章还提到了郑州最低生活保障的话题。对于从事目标检测任务的人来说,YOLO是一个熟悉的模型。文章还提到了yolov4和yolov6的相关内容,以及选择模型的优化思路。 ... [详细]
  • [译]技术公司十年经验的职场生涯回顾
    本文是一位在技术公司工作十年的职场人士对自己职业生涯的总结回顾。她的职业规划与众不同,令人深思又有趣。其中涉及到的内容有机器学习、创新创业以及引用了女性主义者在TED演讲中的部分讲义。文章表达了对职业生涯的愿望和希望,认为人类有能力不断改善自己。 ... [详细]
  • sklearn数据集库中的常用数据集类型介绍
    本文介绍了sklearn数据集库中常用的数据集类型,包括玩具数据集和样本生成器。其中详细介绍了波士顿房价数据集,包含了波士顿506处房屋的13种不同特征以及房屋价格,适用于回归任务。 ... [详细]
  • 不同优化算法的比较分析及实验验证
    本文介绍了神经网络优化中常用的优化方法,包括学习率调整和梯度估计修正,并通过实验验证了不同优化算法的效果。实验结果表明,Adam算法在综合考虑学习率调整和梯度估计修正方面表现较好。该研究对于优化神经网络的训练过程具有指导意义。 ... [详细]
  • 本文介绍了在Python张量流中使用make_merged_spec()方法合并设备规格对象的方法和语法,以及参数和返回值的说明,并提供了一个示例代码。 ... [详细]
  • Learning to Paint with Model-based Deep Reinforcement Learning
    本文介绍了一种基于模型的深度强化学习方法,通过结合神经渲染器,教机器像人类画家一样进行绘画。该方法能够生成笔画的坐标点、半径、透明度、颜色值等,以生成类似于给定目标图像的绘画。文章还讨论了该方法面临的挑战,包括绘制纹理丰富的图像等。通过对比实验的结果,作者证明了基于模型的深度强化学习方法相对于基于模型的DDPG和模型无关的DDPG方法的优势。该研究对于深度强化学习在绘画领域的应用具有重要意义。 ... [详细]
  • OCR:用字符识别方法将形状翻译成计算机文字的过程Matlab:商业数学软件;CUDA:CUDA™是一种由NVIDIA推 ... [详细]
  • 老牌医药收割AI红利:先投个15亿美元抢中国人才
    萧箫发自凹非寺量子位报道|公众号QbitAI没想到,一场大会把我的“刻板印象”攻破了。2021世界人工智能大会现场,能看见不少熟悉的身影, ... [详细]
author-avatar
手机用户2502880821
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有