当前位置: 开发笔记 > 编程语言 > 正文

pytorch深度学习基础（十一）——常用结构化CNN模型构建

作者：梁言一聚 | 来源：互联网 | 2023-06-03 13:33

结构化CNN模型构建与测试前言GoogLeNet结构Inception块模型构建resNet18模型结构残差块模型构建denseNet模型结构DenseBlocktransitio

结构化CNN模型构建与测试

前言
GoogLeNet
- 结构
- Inception块
- 模型构建
resNet18
- 模型结构
- 残差块
- 模型构建
denseNet
- 模型结构
- DenseBlock
- transition_block
- 模型构建
结尾

前言

在本专栏的上一篇博客中我们介绍了常用的线性模型&＃xff0c;在本文中我们将介绍GoogleNet、resNet、denseNet这类结构化的模型的构建方式。

GoogLeNet

结构

整体的结构似乎有些吓人&＃xff0c;但其实他也是用了块的思维&＃xff0c;仔细观察可以发现&＃xff0c;他中间一段很多层的结构都是相似的
在这里插入图片描述

Inception块

这个块就是其中重复的块&＃xff0c;这个块分成了四个分支&＃xff1a;1x1卷积、1x1卷积&＃43;3x3卷积、1x1卷积&＃43;5x5卷积、3x3卷积&＃43;1x1卷积&＃xff0c;最后将这四个分支通道合并

class Inception(nn.Module): def __init__(self, in_channels, c1, c2, c3, c4, **kwargs): super(Inception, self).__init__(**kwargs) self.p1_1 &＃61; nn.Conv2d(in_channels, c1, kernel_size&＃61;1) self.p2_1 &＃61; nn.Conv2d(in_channels, c2[0], kernel_size&＃61;1) self.p2_2 &＃61; nn.Conv2d(c2[0], c2[1], kernel_size&＃61;3, padding&＃61;1) self.p3_1 &＃61; nn.Conv2d(in_channels, c3[0], kernel_size&＃61;1) self.p3_2 &＃61; nn.Conv2d(c3[0], c3[1], kernel_size&＃61;5, padding&＃61;2) self.p4_1 &＃61; nn.MaxPool2d(kernel_size&＃61;3, stride&＃61;1, padding&＃61;1) self.p4_2 &＃61; nn.Conv2d(in_channels, c4, kernel_size&＃61;1) def forward(self, x): p1 &＃61; F.relu(self.p1_1(x)) p2 &＃61; F.relu(self.p2_2(F.relu(self.p2_1(x)))) p3 &＃61; F.relu(self.p3_2(F.relu(self.p3_1(x)))) p4 &＃61; F.relu(self.p4_2(self.p4_1(x))) return torch.cat((p1, p2, p3, p4), dim&＃61;1)

模型构建

b1 &＃61; nn.Sequential(nn.Conv2d(1, 64, kernel_size&＃61;7, stride&＃61;2, padding&＃61;3), nn.ReLU(), nn.MaxPool2d(kernel_size&＃61;3, stride&＃61;2, padding&＃61;1) ) b2 &＃61; nn.Sequential(nn.Conv2d(64, 64, kernel_size&＃61;1), nn.ReLU(), nn.Conv2d(64, 192, kernel_size&＃61;3, padding&＃61;1), nn.ReLU(), nn.MaxPool2d(kernel_size&＃61;3, stride&＃61;2, padding&＃61;1) ) b3 &＃61; nn.Sequential(Inception(192, 64, (96, 128), (16, 32), 32), Inception(256, 128, (128, 192), (32, 96), 64), nn.MaxPool2d(kernel_size&＃61;3, stride&＃61;2, padding&＃61;1) ) b4 &＃61; nn.Sequential(Inception(480, 192, (96, 208), (16, 48), 64), Inception(512, 160, (112, 224), (24, 64), 64), Inception(512, 128, (128, 256), (24, 64), 64), Inception(512, 112, (144, 288), (32, 64), 64), Inception(528, 256, (160, 320), (32, 128), 128), nn.MaxPool2d(kernel_size&＃61;3, stride&＃61;2, padding&＃61;1) ) b5 &＃61; nn.Sequential(Inception(832, 256, (160, 320), (32, 128), 128), Inception(832, 384, (192, 384), (48, 128), 128), nn.AdaptiveAvgPool2d((1, 1)), nn.Flatten() ) net &＃61; nn.Sequential(b1, b2, b3, b4, b5, nn.Linear(1024, 10))
resNet18

模型结构

这个模型似乎要更加简洁一些&＃xff0c;因为这里只有两个分支&＃xff0c;但是他有两种分支方式&＃xff0c;一种是卷积&＃43;残差&＃xff0c;另外一种是卷积&＃43;经过1x1卷积处理过的残差
在这里插入图片描述

残差块

class Residual(nn.Module): def __init__(self, input_channels, num_channels, use_1x1conv&＃61;False, strides&＃61;1): super().__init__() self.conv1 &＃61; nn.Conv2d(input_channels, num_channels, kernel_size&＃61;3, padding&＃61;1, stride&＃61;strides) self.conv2 &＃61; nn.Conv2d(num_channels, num_channels, kernel_size&＃61;3, padding&＃61;1) if use_1x1conv: self.conv3 &＃61; nn.Conv2d(input_channels, num_channels, kernel_size&＃61;1, stride&＃61;strides) else: self.conv3 &＃61; None self.bn1 &＃61; nn.BatchNorm2d(num_channels) self.bn2 &＃61; nn.BatchNorm2d(num_channels) def forward(self, X): Y &＃61; F.relu(self.bn1(self.conv1(X))) Y &＃61; self.bn2(self.conv2(Y)) if self.conv3: X &＃61; self.conv3(X) Y &＃43;&＃61; X return F.relu(Y)

构建时依次使用两种分支方式

def resnet_block(input_channels, num_channels, num_residuals, first_block&＃61;False): blk &＃61; [] for i in range(num_residuals): if i &＃61;&＃61; 0 and not first_block: blk.append(Residual(input_channels, num_channels, use_1x1conv&＃61;True, strides&＃61;2)) else: blk.append(Residual(num_channels, num_channels)) return blk

模型构建

b1 &＃61; nn.Sequential(nn.Conv2d(1, 64, kernel_size&＃61;7, stride&＃61;2, padding&＃61;3), nn.BatchNorm2d(64), nn.ReLU(), nn.MaxPool2d(kernel_size&＃61;3, stride&＃61;2, padding&＃61;1) ) b2 &＃61; nn.Sequential(*resnet_block(64, 64, 2, first_block&＃61;True)) b3 &＃61; nn.Sequential(*resnet_block(64, 128, 2)) b4 &＃61; nn.Sequential(*resnet_block(128, 256, 2)) b5 &＃61; nn.Sequential(*resnet_block(256, 512, 2)) net &＃61; nn.Sequential(b1, b2, b3, b4, b5, nn.AdaptiveAvgPool2d((1, 1)), nn.Flatten(), nn.Linear(512, 10) )
denseNet

模型结构

这个模型的主要思路就是把每一次的输出和输入合并起来&＃xff0c;同时作为下一层的输入&＃xff0c;具体的细节还要结合代码解释
在这里插入图片描述

DenseBlock

我们看下面的代码&＃xff0c;注意init中的循环以及forward时对于X的处理。我们可以发现&＃xff0c;每经过一个conv_block都会将conv_block的输出并入到输入&＃xff0c;以此作为下一层的输入

def conv_block(input_channels, num_channels): return nn.Sequential(nn.BatchNorm2d(input_channels), nn.ReLU(), nn.Conv2d(input_channels, num_channels, kernel_size&＃61;3, padding&＃61;1) ) class DenseBlock(nn.Module): def __init__(self, num_convs, input_channels, num_channels): super(DenseBlock, self).__init__() layer &＃61; [] for i in range(num_convs): layer.append(conv_block( num_channels * i &＃43; input_channels, num_channels )) self.net &＃61; nn.Sequential(*layer) def forward(self, X): for blk in self.net: Y &＃61; blk(X) X &＃61; torch.cat((X, Y), dim&＃61;1) return X

transition_block

这个块的主要作用是减少通道&＃xff0c;因为在前面的块中&＃xff0c;通道数会持续的增长&＃xff0c;考虑到计算量&＃xff0c;需要在中间加入减少通道的块

def transition_block(input_channels, num_channels): return nn.Sequential(nn.BatchNorm2d(input_channels), nn.ReLU(), nn.Conv2d(input_channels, num_channels, kernel_size&＃61;1), nn.AvgPool2d(kernel_size&＃61;2, stride&＃61;2) )

模型构建

b1 &＃61; nn.Sequential(nn.Conv2d(1, 64, kernel_size&＃61;7, stride&＃61;2, padding&＃61;3), nn.BatchNorm2d(64), nn.ReLU(), nn.MaxPool2d(kernel_size&＃61;3, stride&＃61;2, padding&＃61;1) ) num_channels, growth_rate &＃61; 64, 32 num_convs_in_dense_blocks &＃61; [4, 4, 4, 4] blks &＃61; [] for i, num_convs in enumerate(num_convs_in_dense_blocks): blks.append(DenseBlock(num_convs, num_channels, growth_rate)) num_channels &＃43;&＃61; num_convs * growth_rate if i !&＃61; len(num_convs_in_dense_blocks) - 1: blks.append(transition_block(num_channels, num_channels // 2)) num_channels &＃61; num_channels // 2 net &＃61; nn.Sequential(b1, *blks, nn.BatchNorm2d(num_channels), nn.ReLU(), nn.AdaptiveAvgPool2d((1, 1)), nn.Flatten(), nn.Linear(num_channels, 10) )
结尾

我们到现在模型就已经构建好了&＃xff0c;测试的过程可以参照本专栏的上一篇博客
pytorch深度学习基础&＃xff08;十&＃xff09;——常用线性CNN模型的结构与训练

推荐阅读

range
推荐系统遇上深度学习(十七）详解推荐系统中的常用评测指标

原创：石晓文小小挖掘机2018-06-18笔者是一个痴迷于挖掘数据中的价值的学习人，希望在平日的工作学习中，挖掘数据的价值， ... [详细]

蜡笔小新 2023-12-13 19:35:25
int
CF：3D City Model（小思维）问题解析和代码实现

本文通过解析CF：3D City Model问题，介绍了问题的背景和要求，并给出了相应的代码实现。该问题涉及到在一个矩形的网格上建造城市的情景，每个网格单元可以作为建筑的基础，建筑由多个立方体叠加而成。文章详细讲解了问题的解决思路，并给出了相应的代码实现供读者参考。 ... [详细]

蜡笔小新 2023-12-13 14:17:11
int
深度学习中的Vision Transformer (ViT)详解

本文详细介绍了深度学习中的Vision Transformer (ViT)方法。首先介绍了相关工作和ViT的基本原理，包括图像块嵌入、可学习的嵌入、位置嵌入和Transformer编码器等。接着讨论了ViT的张量维度变化、归纳偏置与混合架构、微调及更高分辨率等方面。最后给出了实验结果和相关代码的链接。本文的研究表明，对于CV任务，直接应用纯Transformer架构于图像块序列是可行的，无需依赖于卷积网络。 ... [详细]

蜡笔小新 2023-12-12 15:26:38
int
MooTools和JQuery并排 - MooTools and JQuery Side by Side

IjustinheritedsomewebpageswhichusesMooTools.IneverusedMooTools.NowIneedtoaddsomef ... [详细]

蜡笔小新 2023-12-12 13:43:58
int
欢乐的票圈重构之旅——RecyclerView的头尾布局增加

项目重构的Git地址：https:github.comrazerdpFriendCircletreemain-dev项目同步更新的文集：http:www.jianshu.comno ... [详细]

蜡笔小新 2023-12-11 19:09:56
int
十大经典排序算法动图演示+Python实现

本文介绍了十大经典排序算法的原理、演示和Python实现。排序算法分为内部排序和外部排序，常见的内部排序算法有插入排序、希尔排序、选择排序、冒泡排序、归并排序、快速排序、堆排序、基数排序等。文章还解释了时间复杂度和稳定性的概念，并提供了相关的名词解释。 ... [详细]

蜡笔小新 2023-12-10 19:28:59
int
python打卡记录去重_Python零基础学习笔记与记录之一（了解Python这个小伙伴）

本人学习笔记，知识点均摘自于网络，用于学习和交流(如未注明出处，请提醒，将及时更正，谢谢)OS:我学习是为了上 ... [详细]

蜡笔小新 2023-10-17 16:05:58
get
人工智能推理能力与假设检验

最近Google的Deepmind开始研究如何让AI做数学题。这个问题的提出非常有启发，逻辑推理，发现新知识的能力应该是强人工智能出现自我意识之前最需要发展的能力。深度学习目前可以 ... [详细]

蜡笔小新 2023-10-17 10:01:37
int
在类中定义数组时出错 - Error on defining arrays in class

Iamtryingtomakeaclassthatwillreadatextfileofnamesintoanarray,thenreturnthatarra ... [详细]

蜡笔小新 2023-12-14 17:38:12
int
brain是什么意思_brain怎么读_brain翻译_用法_发音_词组_同反义词_脑新东方在线英语词典

本文介绍了brain的意思、读音、翻译、用法、发音、词组、同反义词等内容，以及脑新东方在线英语词典的相关信息。还包括了brain的词汇搭配、形容词和名词的用法，以及与brain相关的短语和词组。此外，还介绍了与brain相关的医学术语和智囊团等相关内容。 ... [详细]

蜡笔小新 2023-12-14 16:52:33
int
[CF949D]Curfew 二分答案是个不错的开头，困难部分在于如何检查

本文介绍了一个题目的解法，通过二分答案来解决问题，但困难在于如何进行检查。文章提供了一种逃逸方式，通过移动最慢的宿管来锁门时跑到更居中的位置，从而使所有合格的寝室都居中。文章还提到可以分开判断两边的情况，并使用前缀和的方式来求出在任意时刻能够到达宿管即将锁门的寝室的人数。最后，文章提到可以改成O(n)的直接枚举来解决问题。 ... [详细]

蜡笔小新 2023-12-13 09:08:55
int
3.223.28周学习总结中的贪心作业收获及困惑

本文是对3.223.28周学习总结中的贪心作业进行总结，作者在解题过程中参考了他人的代码，但前提是要先理解题目并有解题思路。作者分享了自己在贪心作业中的收获，同时提到了一道让他困惑的题目，即input details部分引发的疑惑。 ... [详细]

蜡笔小新 2023-12-13 03:42:02
get
单击时动态创建
元素 - Dynamically create
element on click

Ihavethefollowingonhtml我在html上有以下内容<html><head><scriptsrc..3003_Tes ... [详细]

蜡笔小新 2023-12-12 15:59:36
int
通过Go SDK（Amazon S3）从Bucket生成Torrent - Generate Torrent from Bucket via Go SDK (Amazon S3)

Imtryingtofigureoutawaytogeneratetorrentfilesfromabucket,usingtheAWSSDKforGo.我正 ... [详细]

蜡笔小新 2023-12-12 14:13:01
int
知识图谱表示吱吱了了

知识图谱表示概念：知识图谱是由一些相互连接的实体和他们的属性构成的。换句话说，知识图谱是由一条条知识组成，每条知识表示为一个SPO三元组(Subject-Predicate-Obj ... [详细]

蜡笔小新 2023-10-17 17:32:42

梁言一聚

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章