CNN中各层图像大小的计算

作者：小景森的童年 | 来源：互联网 | 2023-05-17 20:28

CNN刚刚入门，一直不是很明白通过卷积或者pooling之后图像的大小是多少，看了几天之后终于搞清楚了，在这里就结合keras来说说各层图像大小是怎么计算的，给刚入门的一点启发吧！keras中

CNN刚刚入门，一直不是很明白通过卷积或者pooling之后图像的大小是多少，看了几天之后终于搞清楚了，在这里就结合keras来说说各层图像大小是怎么计算的，给刚入门的一点启发吧！

keras中的convolution和pooling

keras我们以0.2的版本来介绍，0.1对的版本有不一样的地方。0.1的版本的border_mode可以有三种：valid，same，full，0.2版本中的只有两种少了full。

0.2版本的卷积需要指明input_shape但是不需要指明feature map的数量，0.1不需要指明input_shape但是需要指明feature map的数量。
下面具体说说几个重要参数的具体意思：

CONVOLUTION

keras.layers.convolutional.Convolution2D(nb_filter, nb_row, nb_col, init='glorot_uniform', activation='linear', weights=None, border_mode='valid', subsample=(1, 1), dim_ordering='th', W_regularizer=None, b_regularizer=None, activity_regularizer=None, W_cOnstraint=None, b_cOnstraint=None)

nb_filter：filter的个数
nb_row,nb_col：filter的大小(行和列)
init：初始化方法
activation：激活函数
border_mode：valid 或者same，这个对下一层的运算产生影响
W_regulizer： WeightRegularizer，调整主权值矩阵的，通常使用L2 regulizer

POOLING
最常用的就是maxpooling，比如pool_size=(2, 2)就是说2*2=4个像素取值大的那个作为pooling之后的值，看下图：

keras.layers.convolutional.MaxPooling2D(pool_size=(2, 2), strides=None, border_mode='valid', dim_ordering='th')

pool_size：pooling的大小
stride：pooling的stride大小
border_mode: ‘valid’ or ‘same’
Note: ‘same’ will only work with TensorFlow for the time being
dim_ordering: ‘th’ or ‘tf’. In ‘th’ mode, the channels dimension (the depth) is at index 1, in ‘tf’ mode is it at index 3

代码实例

weight_decay = 0.0001

# 使用sequentia模型
chars_model = Sequential()

# 第一层卷积，filter大小4*4，数量32个，原始图像大小36*20
chars_model.add(Convolution2D(32, 4, 4, input_shape=(1, 36, 20), border_mode='valid', activation='relu', W_regularizer=l2(weight_decay)))

# 第二层卷积，filter大小4*4，数量32个，图像大小（36-4+1）*（20-4-1）
chars_model.add(Convolution2D(32, 4, 4, input_shape=(1, 33, 17), border_mode='valid', activation='relu', W_regularizer=l2(weight_decay)))

# maxpooling，大小(2,2),输入大小是30*14,stride默认是None，输出大小是15*7
chars_model.add(MaxPooling2D(pool_size=(2, 2)))

# dropout防止过拟合
chars_model.add(Dropout(0.3))


# 第三层卷积，filter大小4*4，数量64个，图像大小15*7
chars_model.add(Convolution2D(64, 4, 4, input_shape=(1, 15, 7), border_mode='valid', activation='relu', W_regularizer=l2(weight_decay)))

# 第四层卷积，filter大小4*4，数量64个，图像大小12*4，输出是10*2
chars_model.add(Convolution2D(64, 3, 3, input_shape=(1, 12, 4), border_mode='valid', activation='relu', W_regularizer=l2(weight_decay)))

# maxpooling，大小(2,2),输入大小是12*4,stride默认是None，输出大小是5*1
chars_model.add(MaxPooling2D(pool_size=(2, 2)))

# dropout防止过拟合
chars_model.add(Dropout(0.3))


# flatten
chars_model.add(Flatten())

# 全连接，输入是上层的64个feature map，大小是5*1，输出有512个
chars_model.add(Dense(input_dim=64 * 5 * 1, output_dim=512, activation='relu'))
chars_model.add(Dropout(0.6))


# 全连接，输入是上层的输出512，softmax回归分类，总共26个类别
chars_model.add(Dense(input_dim=512, output_dim=26, activation='softmax'))

# 随机梯度下降的参数，使用momentum+decay
sgd = SGD(l2=0.0, lr=0.0001, decay=1e-6, momentum=0.9, nesterov=True)

# 损失函数定义为对数损失(categorical_crossentropy)
chars_model.compile(loss='categorical_crossentropy', optimizer=sgd, class_mode="categorical")

# monitor定义为val_loss，输出相应的信息，只保存最好的val_loss（val_loss最小的那个），save_best_only
check_pointer = ModelCheckpoint(save_chars_model_path, mOnitor='val_loss', verbose=1, save_best_Only=True)

# batch为128，epoch为4000个，validation_split=0.1
chars_model.fit(data_train, label_train, batch_size=128, nb_epoch=4000, verbose=1, show_accuracy=True, validation_split=0.1, callbacks=[check_pointer])

# 使用训练好的模型来评价test集合
score = chars_model.evaluate(data_test, label_test, show_accuracy=True, verbose=0)

注释已经写的很清楚了，想必结合keras应该可以很容易看懂，就不多说了，如果有问题欢迎提出！

mnist网络的图解

结合下经典的mnist网络，说下各层算完之后的大小
mnist

我们可以看到：
输入：32*32
conv1：6个5*5的filter，输出6*28*28
pool1：2*2，输出6*14*14
conv2：16个5*5的filter，输出16*6*10*10
pool2：2*2，输出16*6*5*5
fc1：输入16×5*5，输出120
fc2：输入120，输出84
output：输入84，输出10类

推荐阅读

io
也就是|小窗_卷积的特征提取与参数计算

篇首语：本文由编程笔记#小编为大家整理，主要介绍了卷积的特征提取与参数计算相关的知识，希望对你有一定的参考价值。Dense和Conv2D根本区别在于，Den ... [详细]

蜡笔小新 2023-12-13 12:59:48
io
Perl的测试框架Test::Base简介及使用方法

本文介绍了Perl的测试框架Test::Base，它是一个数据驱动的测试框架，可以自动进行单元测试，省去手工编写测试程序的麻烦。与Test::More完全兼容，使用方法简单。以plural函数为例，展示了Test::Base的使用方法。 ... [详细]

蜡笔小新 2023-12-13 20:05:31
io
推荐系统遇上深度学习(十七）详解推荐系统中的常用评测指标

原创：石晓文小小挖掘机2018-06-18笔者是一个痴迷于挖掘数据中的价值的学习人，希望在平日的工作学习中，挖掘数据的价值， ... [详细]

蜡笔小新 2023-12-13 19:35:25
io
关于Linq to sql 实现模糊查询 string数组

前景：当UI一个查询条件为多项选择，或录入多个条件的时候，比如查询所有名称里面包含以下动态条件，需要模糊查询里面每一项时比如是这样一个数组条件：newstring[]{兴业银行, ... [详细]

蜡笔小新 2023-12-13 09:34:59
utf-8
Python基础知识：注释、输出和input交互

本文介绍了Python基础知识，包括注释的使用、输出函数print的用法以及input函数的交互功能。其中涉及到字符串和整数的类型转换等内容。 ... [详细]

蜡笔小新 2023-12-09 18:11:26
version
【游戏】音乐时钟Matlab设计

1简介本文结合数字信号处理课程和Matlab程序设计课程的相关知识,给出了基于Matlab的音乐播放器的总体设计方案,介绍了播放器主要模块的功能,设计与实现方法.我们将该设 ... [详细]

蜡笔小新 2023-10-17 20:28:05
io
单击后为什么远程通知操作无效？ - Why remote notification action is doing nothing after clicking?

IhaveconfiguredanactionforaremotenotificationwhenitarrivestomyiOsapp.Iwanttwodiff ... [详细]

蜡笔小新 2023-12-14 15:57:44
io
UVALive6575 Odd and Even Zeroes 数位dp+找规律

本文介绍了UVALive6575题目Odd and Even Zeroes的解法，使用了数位dp和找规律的方法。阶乘的定义和性质被介绍，并给出了一些例子。其中，部分阶乘的尾零个数为奇数，部分为偶数。 ... [详细]

蜡笔小新 2023-12-13 14:19:28
less
CF：3D City Model（小思维）问题解析和代码实现

本文通过解析CF：3D City Model问题，介绍了问题的背景和要求，并给出了相应的代码实现。该问题涉及到在一个矩形的网格上建造城市的情景，每个网格单元可以作为建筑的基础，建筑由多个立方体叠加而成。文章详细讲解了问题的解决思路，并给出了相应的代码实现供读者参考。 ... [详细]

蜡笔小新 2023-12-13 14:17:11
default
Swing组件及其用法，图标接口的定义和创建方法

本文介绍了Swing组件的用法，重点讲解了图标接口的定义和创建方法。图标接口用来将图标与各种组件相关联，可以是简单的绘画或使用磁盘上的GIF格式图像。文章详细介绍了图标接口的属性和绘制方法，并给出了一个菱形图标的实现示例。该示例可以配置图标的尺寸、颜色和填充状态。 ... [详细]

蜡笔小新 2023-12-11 21:03:59
io
【Vue】表单 input 绑定

网址：https:vue.docschina.orgv2guideforms.html表单input绑定基础用法可以通过使用v-model指令，在 ... [详细]

蜡笔小新 2023-12-11 18:07:28
uri
SpringBoot整合SpringSecurity+JWT实现单点登录

SpringBoot整合SpringSecurity+JWT实现单点登录,Go语言社区,Golang程序员人脉社 ... [详细]

蜡笔小新 2023-12-11 08:21:41
io
大数据Hadoop生态(20)MapReduce框架原理OutputFormat的开发笔记

本文介绍了大数据Hadoop生态(20)MapReduce框架原理OutputFormat的开发笔记，包括outputFormat接口实现类、自定义outputFormat步骤和案例。案例中将包含nty的日志输出到nty.log文件，其他日志输出到other.log文件。同时提供了一些相关网址供参考。 ... [详细]

蜡笔小新 2023-12-10 11:44:06
io
wpf+mvvm代码组织结构及实现方式

本文介绍了wpf+mvvm代码组织结构的由来和实现方式。作者回顾了自己大学时期接触wpf开发和mvvm模式的经历，认为mvvm模式使得开发更加专注于业务且高效。与此同时，作者指出mvvm模式相较于mvc模式的优势。文章还提到了当没有mvvm时处理数据和UI交互的例子，以及前后端分离和组件化的概念。作者希望能够只关注原始数据结构，将数据交给UI自行改变，从而解放劳动力，避免加班。 ... [详细]

蜡笔小新 2023-12-10 10:07:44
blob
详解 Python 的二元算术运算，为什么说减法只是语法糖？[Python常见问题]

原题|UnravellingbinaryarithmeticoperationsinPython作者|BrettCannon译者|豌豆花下猫（“Python猫 ... [详细]

蜡笔小新 2023-10-17 15:28:24

小景森的童年

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章