热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

神经网络softmax函数,softmax交叉熵损失函数公式

文章转载自Softmax函数的特点和作用和Logistic分类器与softmax分类器,顺便加了一点自己的理解。Logistic分类器分类问题,是机器学习里最基础的问题


文章转载自Softmax函数的特点和作用以及Logistic分类器和Softmax分类器,顺便稍微增加了自己的理解。


Logistic分类器分类问题是机器学习中最基础的问题。


我们从最简单的二分类任务开始考虑。 假设要对西瓜是否成熟进行分类,对于每一个西瓜,都会有{熟、不熟} {熟、不熟}两个结果。 首先,我们必须自己知道西瓜是“熟”的、“不熟”的,或者是根据颜色,或者是根据敲击的声音如何判断。 这是下一步转变为数学映射关系的基础。


为了建立数学模型,必须将这个判断西瓜是否成熟的任务转化为数学关系。 假设“熟”对应于轴上的“1”,不熟对应于轴上的“0”。 下一步是两个映射关系 1 1 , 2 2


1将待分类西瓜样本(假设为s s )映射到一个轴上,#x03D5; 1(s )=z'role='presentation'1) s )=Z1 ) s )=z; 然后使用2(z )2(z )将第一个映射的结果映射到标签分类。 假设分类标记为{ 0,1 } { 0,1 },则通常会选择这样的步骤函数来创建第二个映射2。


2(z )=0,0.5,1,z0z=0z02 ) z )={ 0,z0.5,z=0 1,z0


然而,由于这样的阶跃函数是不连续的,并且在计算过程中不能导出,所以通常使用对数概率函数logistic function来代替它。 需要注意的是,这种替代并不是唯一的对数概率函数(logistic function )具有以下形式:


2(z )=11ez2) z )=11ez


函数的图像如下所示。


可见,zzz大于0时函数值迅速偏向1,小于0时迅速偏向0。 softmax函数


对于二分类任务,由于只有两种结果,#x03D5; 1 ) x ) role='presentat

ion">ϕ1(x)ϕ1(x)将样本 x x 映射到数轴上。而拓展到多分类任务时,假设有n" role="presentation">nn种结果,那么 ϕ1(x) ϕ 1 ( x ) 会映射到一个 n n 维向量(y={c1,c2,...,cn}" role="presentation">y={c1,c2,...,cn}y={c1,c2,...,cn})当中。向量中的每一维,都对应着一个可能的分类结果( ci=0 c i = 0 或1)。由于结果是互斥的,所以 y y 存在以下n" role="presentation">nn种形式:
y1=⎡⎣⎢⎢⎢⎢10⋮0⎤⎦⎥⎥⎥⎥,y2=⎡⎣⎢⎢⎢⎢01⋮0⎤⎦⎥⎥⎥⎥,⋯,yn=⎡⎣⎢⎢⎢⎢00⋮1⎤⎦⎥⎥⎥⎥ y 1 = [ 1 0 ⋮ 0 ] , y 2 = [ 0 1 ⋮ 0 ] , ⋯ , y n = [ 0 0 ⋮ 1 ]

先看下softmax函数的公式:

P(y|x)=eh(x,yi)∑nj=1eh(x,yi) P ( y | x ) = e h ( x , y i ) ∑ j = 1 n e h ( x , y i )

Softmax 的输出表征了不同类别之间的相对概率
假设最后输出的向量是:

v=⎡⎣⎢⎢⎢−32−10⎤⎦⎥⎥⎥ v = [ − 3 2 − 1 0 ]
根据softmax,计算得到:
s=⎡⎣⎢⎢⎢0.00570.83900.04180.1135⎤⎦⎥⎥⎥ s = [ 0.0057 0.8390 0.0418 0.1135 ]
我们可以清晰地看出, s2=0.8390 s 2 = 0.8390 ,对应的概率最大,则更清晰地可以判断预测为第2类的可能性更大。根据向量 v v ,其实也可以判断出那个类别更可能,之所以写成softmax的形式,可能是为了后面的计算能够求导,计算梯度。

参考 Softmax的理解与应用三分钟带你对 Softmax 划重点斯坦福大学深度学习公开课cs231n学习笔记(1)softmax函数理解与应用softmax的多分类周志华的“西瓜书”


推荐阅读
  • 建立分类感知器二元模型对样本数据进行分类
    本文介绍了建立分类感知器二元模型对样本数据进行分类的方法。通过建立线性模型,使用最小二乘、Logistic回归等方法进行建模,考虑到可能性的大小等因素。通过极大似然估计求得分类器的参数,使用牛顿-拉菲森迭代方法求解方程组。同时介绍了梯度上升算法和牛顿迭代的收敛速度比较。最后给出了公式法和logistic regression的实现示例。 ... [详细]
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • 微软头条实习生分享深度学习自学指南
    本文介绍了一位微软头条实习生自学深度学习的经验分享,包括学习资源推荐、重要基础知识的学习要点等。作者强调了学好Python和数学基础的重要性,并提供了一些建议。 ... [详细]
  • 浏览器中的异常检测算法及其在深度学习中的应用
    本文介绍了在浏览器中进行异常检测的算法,包括统计学方法和机器学习方法,并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测,可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率,而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]
  • 本文介绍了绕过WAF的XSS检测机制的方法,包括确定payload结构、测试和混淆。同时提出了一种构建XSS payload的方法,该payload与安全机制使用的正则表达式不匹配。通过清理用户输入、转义输出、使用文档对象模型(DOM)接收器和源、实施适当的跨域资源共享(CORS)策略和其他安全策略,可以有效阻止XSS漏洞。但是,WAF或自定义过滤器仍然被广泛使用来增加安全性。本文的方法可以绕过这种安全机制,构建与正则表达式不匹配的XSS payload。 ... [详细]
  • 本文介绍了在Python张量流中使用make_merged_spec()方法合并设备规格对象的方法和语法,以及参数和返回值的说明,并提供了一个示例代码。 ... [详细]
  • 背景应用安全领域,各类攻击长久以来都危害着互联网上的应用,在web应用安全风险中,各类注入、跨站等攻击仍然占据着较前的位置。WAF(Web应用防火墙)正是为防御和阻断这类攻击而存在 ... [详细]
  • cs231n Lecture 3 线性分类笔记(一)
    内容列表线性分类器简介线性评分函数阐明线性分类器损失函数多类SVMSoftmax分类器SVM和Softmax的比较基于Web的可交互线性分类器原型小结注:中文翻译 ... [详细]
  • 【论文】ICLR 2020 九篇满分论文!!!
    点击上方,选择星标或置顶,每天给你送干货!阅读大概需要11分钟跟随小博主,每天进步一丢丢来自:深度学习技术前沿 ... [详细]
  • 3年半巨亏242亿!商汤高估了深度学习,下错了棋?
    转自:新智元三年半研发开支近70亿,累计亏损242亿。AI这门生意好像越来越不好做了。近日,商汤科技已向港交所递交IPO申请。招股书显示& ... [详细]
  • 本文讨论了在Windows 8上安装gvim中插件时出现的错误加载问题。作者将EasyMotion插件放在了正确的位置,但加载时却出现了错误。作者提供了下载链接和之前放置插件的位置,并列出了出现的错误信息。 ... [详细]
  • 不同优化算法的比较分析及实验验证
    本文介绍了神经网络优化中常用的优化方法,包括学习率调整和梯度估计修正,并通过实验验证了不同优化算法的效果。实验结果表明,Adam算法在综合考虑学习率调整和梯度估计修正方面表现较好。该研究对于优化神经网络的训练过程具有指导意义。 ... [详细]
  • 本博文基于《Amalgamationofproteinsequence,structureandtextualinformationforimprovingprote ... [详细]
  • 本人学习笔记,知识点均摘自于网络,用于学习和交流(如未注明出处,请提醒,将及时更正,谢谢)OS:我学习是为了上 ... [详细]
  • 人工智能推理能力与假设检验
    最近Google的Deepmind开始研究如何让AI做数学题。这个问题的提出非常有启发,逻辑推理,发现新知识的能力应该是强人工智能出现自我意识之前最需要发展的能力。深度学习目前可以 ... [详细]
author-avatar
心语忆录_288
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有