机器学习算法篇卷积神经网络基础（ConvolutionalNeuralNetwork）

作者：潘PanPanPq | 来源：互联网 | 2023-10-12 19:50

定义：

首先来了解一下深度学习的定义：深度学习是以数据的原始形态作为算法输入，经过算法层层抽象将原始数据逐层抽象为自身任务所需的最终特征表示，最后以特征到任务目标的映射作为结束，从原始数据到最终任务目标，“一条龙服务” 并无夹杂任何人为操作。普通话说就是“省去了人为的特征工程，实现完全封闭。是一种‘端到端’的学习方式”，而传统机器学习的天花板是由特征工程决定的。

卷积神经网路：是一类特殊的人工神经网络，其最主要的特点是卷积运算操作。可以理解为是一种层次模型，其输入是原始数据，如图像、原始音频数据等。其中，不同类型操作在卷积神经网络中一般称作“层”:卷积操作对应“卷积层”，池化操作对应“池化层”。

准备知识：

卷积核：是一个函数，可以看作对某个局部的加权求和；它是对应局部感知，它的原理是在观察某个物体时我们既不能观察每个像素也不能一次观察整体，而是先从局部开始认识，这就对应了卷积。卷积核的大小一般有1x1,3x3和5x5的尺寸。

机器学习算法篇--卷积神经网络基础（Convolutional Neural Network）

卷积步长：每做一个卷积所移动的距离
前馈运算：概括的说就是“预测和推理”，卷积神经网络通过卷积操作、池化操作和**函数映射等一系列操作的层层堆叠，将高层语义信息逐层由原始数据输入层中抽取出来，逐层抽象，这一过程便是“前馈运算”。
反馈运算：“训练和学习”，卷积神经网络的最后一层将其目标任务形式化为目标函数。通过计算预测值与真实值之间的误差或损失（之前的文章讲过的最小二乘法），凭借反向传播算法(BP)将误差或损失由最后一层逐层向前反馈，更新每层参数。
池化：其实也就是把特征图像区域的一部分求个均值或者最大值，用来代表这部分区域。如果是求均值就是mean pooling，求最大值就是max pooling。
**函数：是增加整个网络的表达能力(即非线性)。否则，若干线性操作层的堆叠仍然只能起到线性映射的作用，无法形成复杂的函数。最常用的是sigmoid**函数和ReLU**函数 (目前主流是ReLU，因为ReLU避免了梯度饱和效应的发生)

卷积神经网络工作流程：

这次的准备知识点比较多，因为作者，也就是在下，熟悉的领域就是计算机视觉，图像处理，之前做ios的时候，滤镜，红眼，磨皮等等图片处理的功能都是自己写的，研究过GPUIImage的源码，还做过名片识别的app。虽然迫于生计，工作中遇到图像处理的场景少，但是从2011年到现在从来没有停止对图像处理技术的研究，从去年开始做机器学习的时候就选定计算机视觉为主要方向，让自己的长板更长。

好，收，废话一说就停不下来了，下面来介绍一下卷机神经网络的工作流程：

首先介绍一下卷积神经网络的基本部件:

卷积操作
池化操作
**函数
全连接层
目标函数

整个卷积神经网络通过这些基本部件的 “有机组合”即可实现将原始数据映射到高层语义、进而得到样本预测标记的功能。用一张图片来展示一下通用的深度模型：

对深度模型而言，其输入数据是未经任何人为加工的原始样本形式，后续则是堆叠在输入层上的众多操作层。这些操作层整体可看作一个复杂的函数 fcnn，最终损失函数由数据损失和模型参数的正则化损失共同组成，深度模型的训练过程可以简单抽象为从原始数据向最终目标的直接‘拟合’，而中间的这些部件正起到了将原始数据映射为特征随后在映射为样本标记的作用。

卷积操作：

卷积是一种局部操作，通过一定大小的卷积核作用于局部图像区域获得图像的局部信息。卷积操作中有两个重要的超参数:卷积核大小和卷积步长。

假设输入图像为如图中右侧的 5 × 5 矩阵，其对应的卷积核为一个 3 × 3 的矩阵。同时，假定卷积操作时每做一次卷积，卷积核移动一个像素位置，即卷积步长为1。第一次卷积操作从图像 (0, 0) 像素开始，由卷积核中参数与对应位置图像像素逐位相乘后累加作为一次卷积操作结果，即 1×1+2×0+3×1+6×0+ 7 × 1 + 8 × 0 + 9 × 1 + 8 × 0 + 7 × 1 = 1 + 3 + 7 + 9 + 7 = 27，如图所示：

类似地，在步长为1时，如上图所示，卷积核按照步长大小在输入图像上从左至右自上而下依次将卷积操作进行下去，最终输出 3 × 3 大小的卷积特征，同时该结果将作为下一层操作的输入。之后再进行上文讲的‘有机组合’中去，进行反复的前后反馈计算，直到出最后结果。

总结：

本篇介绍了深度学习的关键思想‘端到端’的关键思想，了解了深度学习的工作流程以及卷积操作，基本知识：卷积核，卷积步长，前馈运算，反馈运算，池化，**函数。下篇文章会讲：池化操作和**函数。

鸣谢：本文中的图片来源于南京大学计算机系机器学习在读博士魏秀参的开源贡献：http://lamda.nju.edu.cn/weixs 。

推荐阅读

int
【论文】ICLR 2020 九篇满分论文！！！

点击上方，选择星标或置顶，每天给你送干货！阅读大概需要11分钟跟随小博主，每天进步一丢丢来自：深度学习技术前沿 ... [详细]

蜡笔小新 2023-10-17 18:45:53
int
【机器学习】生成式对抗网络模型综述

生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型，可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]

蜡笔小新 2023-12-14 17:51:18
int
人工智能推理能力与假设检验

最近Google的Deepmind开始研究如何让AI做数学题。这个问题的提出非常有启发，逻辑推理，发现新知识的能力应该是强人工智能出现自我意识之前最需要发展的能力。深度学习目前可以 ... [详细]

蜡笔小新 2023-10-17 10:01:37
int
微软头条实习生分享深度学习自学指南

本文介绍了一位微软头条实习生自学深度学习的经验分享，包括学习资源推荐、重要基础知识的学习要点等。作者强调了学好Python和数学基础的重要性，并提供了一些建议。 ... [详细]

蜡笔小新 2023-12-14 20:58:32
int
浏览器中的异常检测算法及其在深度学习中的应用

本文介绍了在浏览器中进行异常检测的算法，包括统计学方法和机器学习方法，并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测，可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率，而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]

蜡笔小新 2023-12-12 16:22:39
int
揭秘阿里云WAF背后神秘的AI智能防御体系

背景应用安全领域，各类攻击长久以来都危害着互联网上的应用，在web应用安全风险中，各类注入、跨站等攻击仍然占据着较前的位置。WAF(Web应用防火墙)正是为防御和阻断这类攻击而存在 ... [详细]

蜡笔小新 2023-12-11 01:30:52
int
建立分类感知器二元模型对样本数据进行分类

本文介绍了建立分类感知器二元模型对样本数据进行分类的方法。通过建立线性模型，使用最小二乘、Logistic回归等方法进行建模，考虑到可能性的大小等因素。通过极大似然估计求得分类器的参数，使用牛顿-拉菲森迭代方法求解方程组。同时介绍了梯度上升算法和牛顿迭代的收敛速度比较。最后给出了公式法和logistic regression的实现示例。 ... [详细]

蜡笔小新 2023-12-09 10:22:15
int
cs231n Lecture 3 线性分类笔记（一）

内容列表线性分类器简介线性评分函数阐明线性分类器损失函数多类SVMSoftmax分类器SVM和Softmax的比较基于Web的可交互线性分类器原型小结注：中文翻译 ... [详细]

蜡笔小新 2023-10-17 19:40:56
int
深度学习黑话

OCR：用字符识别方法将形状翻译成计算机文字的过程Matlab：商业数学软件；CUDA：CUDA™是一种由NVIDIA推 ... [详细]

蜡笔小新 2023-10-17 17:55:01
int
2017亚马逊人工智能奖公布：他们的AI有什么不同？

事实上，在我们周围，“人工智能”让一切都变得更“智能”极具讽刺意味。随着人类与机器智能之间的界限变得模糊，我们的世界正在变成一个机器 ... [详细]

蜡笔小新 2023-10-16 19:50:15
int
sklearn数据集库中的常用数据集类型介绍

本文介绍了sklearn数据集库中常用的数据集类型，包括玩具数据集和样本生成器。其中详细介绍了波士顿房价数据集，包含了波士顿506处房屋的13种不同特征以及房屋价格，适用于回归任务。 ... [详细]

蜡笔小新 2023-12-13 17:45:15
js
腾讯BERT推理模型TurboTransformers的快速推理能力

本文介绍了腾讯最近开源的BERT推理模型TurboTransformers，该模型在推理速度上比PyTorch快1~4倍。TurboTransformers采用了分层设计的思想，通过简化问题和加速开发，实现了快速推理能力。同时，文章还探讨了PyTorch在中间层延迟和深度神经网络中存在的问题，并提出了合并计算的解决方案。 ... [详细]

蜡笔小新 2023-12-12 13:48:41
cmd
Python实验报告文档中的文件和数据格式化操作

本文介绍了Python语言程序设计中文件和数据格式化的操作，包括使用np.savetext保存文本文件，对文本文件和二进制文件进行统一的操作步骤，以及使用Numpy模块进行数据可视化编程的指南。同时还提供了一些关于Python的测试题。 ... [详细]

蜡笔小新 2023-12-10 17:02:16
split
机器学习算法代码实现——线性回归

前言：拿到一个案例，去分析：它该是做分类还是做回归，哪部分该做分类，哪部分该做回归，哪部分该做优化，它们的目标值分别是什么。再挑影响因素，哪些和分类有关的影响因素，哪些和回归有关的 ... [详细]

蜡笔小新 2023-10-17 19:58:52
chat
3年半巨亏242亿！商汤高估了深度学习，下错了棋？

转自：新智元三年半研发开支近70亿，累计亏损242亿。AI这门生意好像越来越不好做了。近日，商汤科技已向港交所递交IPO申请。招股书显示& ... [详细]

蜡笔小新 2023-10-17 16:41:52

潘PanPanPq

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章