当前位置: 开发笔记 > 编程语言 > 正文

深度学习理论学习_02

作者：十分风格的功夫_723 | 来源：互联网 | 2023-05-17 12:30

在介绍了有关机器学习的一些理论之后，我在入门时比较关心的研究重点就在于深度学习的理论和一些实现性代码。第2章深度学习是什么1.神经网络是什么要谈

在介绍了有关机器学习的一些理论之后，我在入门时比较关心的研究重点就在于深度学习的理论和一些实现性代码。

第2章深度学习是什么

1.神经网络是什么

要谈深度学习（deep learning），就必须要先了解神经网络，或者称为人工神经网络（artifcial neural network，ANN）。神经网络是一种人类由于受到生物神经细胞结构启发而研究出的一种算法体系。

1.1 神经元

神经网络让人觉得难以亲近的地方就在于他的实现原理，至少不如以前接触到的各种基于统计的算法那么直观，例如数据结构和基础算法中一些由加减乘除、比较、循环、分支、数据读写等基础操作组成的复杂算法。而神经网络和这种方式的感觉还是不一样的。

所以先把神经网络中的一个最小单元——神经元拿出来谈谈。

这就是一个最简单的神经元了，有一个输入，一个输出，所以它表达的含义和一个普通的函数没有什么区别。不过，通常一个神经元由“线性模型”和“激励函数”两个部分组成。

假设神经元的函数表达为f(x)=x+1，则当输入为x=1时，输出为f(x)=2；输入为x=100时，输出为f(x)=101……很好理解

那么接下来

x既然可以是一个一维向量，那其实也可以是多维的。按照一维向量的处理方式，我们可以建立一个有n个输入项的神经元f(x)，把它展开写就是f(x1,x2,x3...xn)，然后函数的输出值output=f(x)，将函数f(x)写成f(x)=wx+b

这种方式也是神经元最核心的部分对x所做的线性处理，其中x是一个1*n的矩阵，而w是一个n*1权重矩阵，b是一个偏置项。直观来看，一个神经元的工作就是讲w和x作内积，加上b后产生一个线性输出。单个神经元工作起来基本就是这样，只不过后面还有一个激励函数而已（后面介绍）。

那么问题就来了，在神经元中，这个权重w是谁来定的？

在第一章中所说的机器学习中，其实就已经有一种计算方法了。没错，利用机器学习的回归功能中所谈到的Loss函数来描述拟合和真观测的差异，即残差。

1.2 激励函数

激励函数（actvation function）也是神经元中重要的组成部分。激励函数在一个神经元当中跟随在f(x)=wx+b之后，用来加入一些非线性因素。（找图贴图挺不妨方便的，这里就不贴各种激励函数的表达式和图像了，有需要可以百度下）

Sigmoid函数：表达式

或者写成

Tanh函数：双曲正切函数，表达式

ReLU函数：ReLU函数是目前大多数卷积神经网络CNN（convolutional neural networks）中喜欢使用的激励函数，全名rectified linear units。这个函数的形式是，在原点左侧部分斜率为0，原点右侧是一条斜率为1的直线。它具有很多优秀的特性，所以很多网络中都会用到。

1.3 神经网络

一旦多个神经元首尾相接形成一个类似网络的结构来工作的时候，那就可以被称为神经网络了。一般也没有人会规定网络必须有多少层，每层有多少个神经元节点，符合要求的网络设计说穿了都是根据需求、经验和相关理论试出来的。

这是一个比较简单的神经网络结构。在一个神经网络中通常会分这样几层：输入层（input layer）、隐藏层（hidden layer，也叫隐含层）、输出层（output layer）。

输入层在整个网络的最前端部分，直接接受输入的向量，它是不对数据作任何处理的，所以通常这一层是不计入层数的。

隐藏层可以有一层或者多层，50甚至上百层的网络也有存在。

输出层是最后一层，用来输出整个网络处理的值，这个值可能是一个分类向量值，也可能是一个类似线性回归那样产生的连续的值，也可能是别的复杂类型的值或者向量，根据不用的需求输出层的构造也不尽相同。

有一点必须注意，在学习神经网络（深度学习）的过程中你会不断发现不同形式的网络，但是你极少能发现在这些网络的诞生过程中有完整的、严谨的、普适的、毋庸置疑的推导过程。“深度学习越学越像老中医：年轻的时候不敢轻易开方子，等熬成了老中医的时候才发现里面门道太深，深到研究了一辈子也没办法总结出完整的、可以精确推导的公式或定理，大部分情况只能通过自己的经验和实现结果调整药方。”

~~了解到这里我心里一凉，哎，我一个理性的工科生竟然在研究生选了条最玄学的研究方向，下半辈子特么怕是要gg啊~~

2.深度神经网络

深度神经网络（deep neural networks，DNN）的学习过程也就是我们常说的深度学习Deep Learning，这个Deep指的是神经网络的深度，也就是层数比较多。在传统的机器学习中，人们输入给模型的学习样本都是要经过高度提炼处理的向量内容，而不能像深度学习一样直接把一张图、一段语音、一段视频的多媒体资料给机器去学习，因此深度学习的“深度”，应该也意味着其能够学习到一些较直观的数据而言更加深层次的东西。

在这里强调一下，在很多初学者中有一些误区，很多人会认为深度学习在任何情况下都优于传统的机器学习，但实际上并不是的。机器学习的指标描述更直观，运算数据量更小，具有良好的解释特性；而一些特征提取比较困难、数据量大、而且没法用线性关系或者统计概率关系直接描述的信息，则用深度学习处理会显得更合适。

3.深度学习为什么这么强

神经网络，尤其是深度神经网络之所以这么吸引人，主要是因为它能够通过大量的线性分类器和非线性关系的组合来完成平时非常棘手的线性不可分的问题。

(1)不用再提取特征：以往使用的朴素贝叶斯、决策树、支持向量机SVM这些分类器模型中，提取特征是一个非常重要的前置工作，需要清晰而干净的数据。而神经网络中，由于巨量的线性分类器的堆叠以及卷积网络的使用，它对噪声的忍耐力、对多通道数据上投射出来的不同特征偏向的敏感程度会自动重视或忽略，这样训练的样本就不需要人为处理了。

(2)处理线性不可分：神经网络可以通过大量的线性分类器的堆叠使得整个模型可以将线性不可分的问题变得可分。神经网络的神经元可以有很多层，每层可以有很多个神经元，整个网络的规模可以有几千甚至几万个神经元，那么在这种情况下几乎可以描绘出任意的线性不可分的模型了，所以传统分类模型中无法通过简单的线性分类器和非线性分类器处理的复杂学习场景就能够通过海量的分类器的叠加来实现。

4.小结

深度学习是一种前景非常好的应用领域，它几乎在任何一个细分领域都可以有比较好的应用，并且能够产生大量的剩余价值，发展生产力。而且随着计算机计算性能的不断提升，深度学习的应用也将积累更快，落地更廉价。我们有充分的理由相信，深度学习的发展将是未来几十年内世界科技发展的最为重要的领域之一。

本文的大量内容摘录自高扬所著《白话深度学习与TensorFlow》，仅作为本人学习过程中的摘录和心得记录，更多细节请购买此书

推荐阅读

js
浏览器中的异常检测算法及其在深度学习中的应用

本文介绍了在浏览器中进行异常检测的算法，包括统计学方法和机器学习方法，并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测，可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率，而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]

蜡笔小新 2023-12-12 16:22:39
js
【机器学习】生成式对抗网络模型综述

生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型，可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]

蜡笔小新 2023-12-14 17:51:18
input
也就是|小窗_卷积的特征提取与参数计算

篇首语：本文由编程笔记#小编为大家整理，主要介绍了卷积的特征提取与参数计算相关的知识，希望对你有一定的参考价值。Dense和Conv2D根本区别在于，Den ... [详细]

蜡笔小新 2023-12-13 12:59:48
merge
Python张量流中的device spec make_merged_spec()方法使用说明

本文介绍了在Python张量流中使用make_merged_spec()方法合并设备规格对象的方法和语法，以及参数和返回值的说明，并提供了一个示例代码。 ... [详细]

蜡笔小新 2023-12-11 12:15:19
ip
揭秘阿里云WAF背后神秘的AI智能防御体系

背景应用安全领域，各类攻击长久以来都危害着互联网上的应用，在web应用安全风险中，各类注入、跨站等攻击仍然占据着较前的位置。WAF(Web应用防火墙)正是为防御和阻断这类攻击而存在 ... [详细]

蜡笔小新 2023-12-11 01:30:52
ip
cs231n Lecture 3 线性分类笔记（一）

内容列表线性分类器简介线性评分函数阐明线性分类器损失函数多类SVMSoftmax分类器SVM和Softmax的比较基于Web的可交互线性分类器原型小结注：中文翻译 ... [详细]

蜡笔小新 2023-10-17 19:40:56
ip
【论文】ICLR 2020 九篇满分论文！！！

点击上方，选择星标或置顶，每天给你送干货！阅读大概需要11分钟跟随小博主，每天进步一丢丢来自：深度学习技术前沿 ... [详细]

蜡笔小新 2023-10-17 18:45:53
ip
python打卡记录去重_Python零基础学习笔记与记录之一（了解Python这个小伙伴）

本人学习笔记，知识点均摘自于网络，用于学习和交流(如未注明出处，请提醒，将及时更正，谢谢)OS:我学习是为了上 ... [详细]

蜡笔小新 2023-10-17 16:05:58
ip
人工智能推理能力与假设检验

最近Google的Deepmind开始研究如何让AI做数学题。这个问题的提出非常有启发，逻辑推理，发现新知识的能力应该是强人工智能出现自我意识之前最需要发展的能力。深度学习目前可以 ... [详细]

蜡笔小新 2023-10-17 10:01:37
input
Tensorflow 训练自己的cnn模型行人识别

代码如下：#coding:utf-8importstring,os,sysimportnumpyasnpimportmatplotlib.py ... [详细]

蜡笔小新 2023-10-16 16:57:06
input
干货 | 携程AI推理性能的自动化优化实践

作者简介携程度假AI研发团队致力于为携程旅游事业部提供丰富的AI技术产品，其中性能优化组为AI模型提供全方位的优化方案，提升推理性能降低成本࿰ ... [详细]

蜡笔小新 2023-10-16 14:03:03
input
「爆干7天7夜」入门AI人工智能学习路线一条龙，真的不能再透彻了

前言应广大粉丝要求，今天迪迦来和大家讲解一下如何去入门人工智能，也算是迪迦对自己学习人工智能这么多年的一个总结吧，本条学习路线并不会那么 ... [详细]

蜡笔小新 2023-10-16 12:17:31
input
深度学习与神经网络——邱锡鹏

深度学习与神经网络——邱锡鹏-一、绪论人工智能的一个子领域神经网络：一种以（人工)）神经元为基本单元的模型深度学习：一类机器学习问题，主要解决贡献度分配问题知识结构：路线图：顶 ... [详细]

蜡笔小新 2023-10-16 05:57:42
select
机器学习之数据均衡算法种类大全+Python代码一文详解

目录前言一、为什么要做数据均衡？二、数据场景1.大数据分布不均衡2.小数据分布不均衡三、均衡算法类型1.过采样2.欠采样3.组合采样四、算法具体种类1 ... [详细]

蜡笔小新 2023-10-15 23:34:41
js
Stanford机器学习第九讲. 聚类

原文：http:blog.csdn.netabcjenniferarticledetails7914952本栏目（Machinelearning）包括单参数的线性回归、多参数的线性 ... [详细]

蜡笔小新 2023-10-15 16:17:01

十分风格的功夫_723

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章