DenselyCNN

作者：贝贝2602932923 | 来源：互联网 | 2023-09-13 03:17

《DenselyConnectedConvolutionalNetworks》阅读笔记代码地址：https:github.comliuzhuang13DenseNe

《Densely Connected Convolutional Networks》阅读笔记

代码地址&＃xff1a;https://github.com/liuzhuang13/DenseNet
首先看一张图&＃xff1a;

稠密连接&＃xff1a;每层以之前层的输出为输入&＃xff0c;对于有L层的传统网络&＃xff0c;一共有L个连接&＃xff0c;对于DenseNet&＃xff0c;则有L(L&＃43;1)2。

这篇论文主要参考了Highway Networks&＃xff0c;Residual Networks (ResNets)以及GoogLeNet&＃xff0c;通过加深网络结构&＃xff0c;提升分类结果。加深网络结构首先需要解决的是梯度消失问题&＃xff0c;解决方案是&＃xff1a;尽量缩短前层和后层之间的连接。比如上图中&＃xff0c;H4层可以直接用到原始输入信息X0&＃xff0c;同时还用到了之前层对X0处理后的信息&＃xff0c;这样能够最大化信息的流动。反向传播过程中&＃xff0c;X0的梯度信息包含了损失函数直接对X0的导数&＃xff0c;有利于梯度传播。
DenseNet有如下优点&＃xff1a;
1.有效解决梯度消失问题
2.强化特征传播
3.支持特征重用
4.大幅度减少参数数量

接着说下论文中一直提到的Identity function&＃xff1a;
很简单就是输出等于输入f(x)&＃61;x

传统的前馈网络结构可以看成处理网络状态&＃xff08;特征图&＃xff1f;&＃xff09;的算法&＃xff0c;状态从层之间传递&＃xff0c;每个层从之前层读入状态&＃xff0c;然后写入之后层&＃xff0c;可能会改变状态&＃xff0c;也会保持传递不变的信息。ResNet是通过Identity transformations来明确传递这种不变信息。

网络结构&＃xff1a;

每层实现了一组非线性变换Hl(.)&＃xff0c;可以是Batch Normalization (BN) ,rectified linear units (ReLU) , Pooling , or Convolution (Conv). 第l层的输出为xl。
对于ResNet&＃xff1a;

xl&＃61;Hl(xl−1)&＃43;xl−1

这样做的好处是the gradient flows directly through the identity function from later layers to the earlier layers.
同时呢&＃xff0c;由于identity function 和 H的输出通过相加的方式结合&＃xff0c;会妨碍信息在整个网络的传播。
受GooLeNet的启发&＃xff0c;DenseNet通过串联的方式结合&＃xff1a;

xl&＃61;Hl([x0,x1,...,xl−1])
这里Hl(.)是一个Composite function&＃xff0c;是三个操作的组合&＃xff1a;BN−>ReLU−>Conv(3×3)
由于串联操作要求特征图x0,x1,...,xl−1大小一致&＃xff0c;而Pooling操作会改变特征图的大小&＃xff0c;又不可或缺&＃xff0c;于是就有了上图中的分块想法&＃xff0c;其实这个想法类似于VGG模型中的“卷积栈”的做法。论文中称每个块为DenseBlock。每个DenseBlock的之间层称为transition layers&＃xff0c;由BN−>Conv(1×1)−>averagePooling(2×2)组成。

Growth rate&＃xff1a;由于每个层的输入是所有之前层输出的连接&＃xff0c;因此每个层的输出不需要像传统网络一样多。这里Hl(.)的输出的特征图的数量都为k&＃xff0c;k即为Growth Rate&＃xff0c;用来控制网络的“宽度”&＃xff08;特征图的通道数&＃xff09;.比如说第l层有k(l−1)&＃43;k0的输入特征图&＃xff0c;k0是输入图片的通道数。

虽然说每个层只产生k个输出&＃xff0c;但是后面层的输入依然会很多&＃xff0c;因此引入了Bottleneck layers 。本质上是引入1x1的卷积层来减少输入的数量&＃xff0c;Hl的具体表示如下

BN−>ReLU−>Conv(1×1)−>BN−>ReLU−>Conv(3×3)

文中将带有Bottleneck layers的网络结构称为DenseNet-B。
除了在DenseBlock内部减少特征图的数量&＃xff0c;还可以在transition layers中来进一步Compression。如果一个DenseNet有m个特征图的输出&＃xff0c;则transition layer产生 ⌊θm⌋个输出&＃xff0c;其中0<θ≤1。对于含有该操作的网络结构称为DenseNet-C。

同时包含Bottleneck layer和Compression的网络结构为DenseNet-BC。
具体的网络结构&＃xff1a;

实验以及一些结论
在CIFAR和SVHN上的分类结果&＃xff08;错误率&＃xff09;&＃xff1a;

L表示网络深度&＃xff0c;k为增长率。蓝色字体表示最优结果&＃xff0c;&＃43;表示对原数据库进行data augmentation。可以发现DenseNet相比ResNet可以取得更低的错误率&＃xff0c;并且使用了更少的参数。
接着看一组对比图&＃xff1a;

前两组描述分类错误率与参数量的对比&＃xff0c;从第二幅可以看出&＃xff0c;在取得相同分类精度的情况下&＃xff0c;DenseNet-BC比ResNet少了23的参数。第三幅图描述含有10M参数的1001层的ResNet与只有0.8M的100层的DenseNet的训练曲线图。可以发现ResNet可以收敛到更小的loss值&＃xff0c;但是最终的test error与DenseNet相差无几。再次说明了DenseNet参数效率&＃xff08;Parameter Efficiency&＃xff09;很高&＃xff01;

同样的在ImageNet上的分类结果&＃xff1a;

右图使用FLOPS来说明计算量。通过比较ResNet-50&＃xff0c;DenseNet-201&＃xff0c;ResNet-101&＃xff0c;说明计算量方面&＃xff0c;DenseNet结果更好。

推荐阅读

图片
[译]技术公司十年经验的职场生涯回顾

本文是一位在技术公司工作十年的职场人士对自己职业生涯的总结回顾。她的职业规划与众不同，令人深思又有趣。其中涉及到的内容有机器学习、创新创业以及引用了女性主义者在TED演讲中的部分讲义。文章表达了对职业生涯的愿望和希望，认为人类有能力不断改善自己。 ... [详细]

蜡笔小新 2023-12-14 11:31:05
process
【机器学习】生成式对抗网络模型综述

生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型，可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]

蜡笔小新 2023-12-14 17:51:18
list
CSS3选择器的使用方法详解，提高Web开发效率和精准度

本文详细介绍了CSS3新增的选择器方法，包括属性选择器的使用。通过CSS3选择器，可以提高Web开发的效率和精准度，使得查找元素更加方便和快捷。同时，本文还对属性选择器的各种用法进行了详细解释，并给出了相应的代码示例。通过学习本文，读者可以更好地掌握CSS3选择器的使用方法，提升自己的Web开发能力。 ... [详细]

蜡笔小新 2023-12-14 14:37:52
list
读手语图像识别论文笔记2

文章目录一、前言二、笔记1.名词解释2.流程分析上一篇快速门:读手语图像识别论文笔记1（手语识别背景和方法）一、前言一句：“做完了&#x ... [详细]

蜡笔小新 2023-10-17 20:45:15
list
aw多模态融合,多模态话语分析

本博文基于《Amalgamationofproteinsequence,structureandtextualinformationforimprovingprote ... [详细]

蜡笔小新 2023-10-17 19:16:14
list
交通预见未来(4)：从NLP自然语言处理到工程领域中的时间序列：我们能学到什么？...

NLP自然语言处理中的单词，句子，经过各种处理编码，电脑识别到的还是一串数字，即一个有前后关系的时间序列。放到交通工程、土木 ... [详细]

蜡笔小新 2023-09-25 20:34:32
list
每天收获一点点Hadoop概述

一、Hadoop来历Hadoop的思想来源于Google在做搜索引擎的时候出现一个很大的问题就是这么多网页我如何才能以最快的速度来搜索到，由于这个问题Google发明 ... [详细]

蜡笔小新 2023-12-14 18:58:01
list
SEEBURGER SAP GTS解决方案：数字化助力企业实现海关流程数字化

SEEBURGER作为SAP的合作伙伴，在2019 SAP GTS信息交流会上分享了SEEBURGER SAP GTS解决方案的应用案例，介绍了如何利用数字化助力企业实现海关流程数字化。SEEBURGER的集成技术和解决方案支持SAP GTS产品和服务的推广及应用，通过数据通讯和报文格式转换满足与海关当局的电子数据交换需求。该解决方案能够帮助企业管理全球贸易，保证贸易规范，优化跨境供应链，提升企业合规性。 ... [详细]

蜡笔小新 2023-12-10 13:28:02
cmd
面试经验分享：华为面试四轮电话面试、一轮笔试、一轮主管视频面试、一轮hr视频面试

最近有朋友去华为面试，面试经历包括四轮电话面试、一轮笔试、一轮主管视频面试、一轮hr视频面试。80%的人都在第一轮电话面试中失败，因为缺乏基础知识。面试问题涉及 ... [详细]

蜡笔小新 2023-12-09 10:22:03
bit
【论文】ICLR 2020 九篇满分论文！！！

点击上方，选择星标或置顶，每天给你送干货！阅读大概需要11分钟跟随小博主，每天进步一丢丢来自：深度学习技术前沿 ... [详细]

蜡笔小新 2023-10-17 18:45:53
bit
AstridDAO 专访：波卡稳定币黑马 BAI

加入Pol ... [详细]

蜡笔小新 2023-10-17 18:14:14
input
我所了解的bert模型整理！！

文章目录BERT是什么语言模型Mask机制BERTBertvsTransformerBertModelInputBertModelOutputBertMaskedLanguageM ... [详细]

蜡笔小新 2023-10-11 15:19:20
list
面向对象设计的六大原则是什么

这篇文章主要讲解了“面向对象设计的六大原则是什么”，文中的讲解内容简单清晰，易于学习与理解，下面请大家跟着小编的思路慢慢深入，一起来研究 ... [详细]

蜡笔小新 2023-10-10 19:06:39
list
BERT原理解析转载

原文地址： https:terrifyzhao.github.io20190218BERT原理.htmlBert其实并没有过多的结构方面的创新点，其和GPT一样均是采用的trans ... [详细]

蜡笔小新 2023-10-10 04:33:39
audio
webrtc学习笔记三：webrtc架构

文章目录 ... [详细]

蜡笔小新 2023-09-25 23:21:19

贝贝2602932923

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章