当前位置: 开发笔记 > 编程语言 > 正文

pythonbatchnorm2d_BatchNorm2d原理、作用及其pytorch中BatchNorm2d函数的参数讲解

作者：手机用户2502869883 | 来源：互联网 | 2023-10-17 13:13

BN原理、作用：函数参数讲解：BatchNorm2d(256,eps1e-05,momentum0.1,affineTrue,track_running

BN原理、作用&＃xff1a;

函数参数讲解&＃xff1a;

BatchNorm2d(256, eps&＃61;1e-05, momentum&＃61;0.1, affine&＃61;True, track_running_stats&＃61;True)

1.num_features&＃xff1a;一般输入参数为batch_sizenum_featuresheight*width&＃xff0c;即为其中特征的数量&＃xff0c;即为输入BN层的通道数&＃xff1b;

2.eps&＃xff1a;分母中添加的一个值&＃xff0c;目的是为了计算的稳定性&＃xff0c;默认为&＃xff1a;1e-5,避免分母为0&＃xff1b;

3.momentum&＃xff1a;一个用于运行过程中均值和方差的一个估计参数(我的理解是一个稳定系数&＃xff0c;类似于SGD中的momentum的系数)&＃xff1b;

4.affine&＃xff1a;当设为true时&＃xff0c;会给定可以学习的系数矩阵gamma和beta

一般来说pytorch中的模型都是继承nn.Module类的&＃xff0c;都有一个属性trainning指定是否是训练状态&＃xff0c;训练状态与否将会影响到某些层的参数是否是固定的&＃xff0c;比如BN层或者Dropout层。通常用model.train()指定当前模型model为训练状态,model.eval()指定当前模型为测试状态。

同时&＃xff0c;BN的API中有几个参数需要比较关心的&＃xff0c;一个是affine指定是否需要仿射&＃xff0c;还有个是track_running_stats指定是否跟踪当前batch的统计特性。容易出现问题也正好是这三个参数&＃xff1a;trainning&＃xff0c;affine&＃xff0c;track_running_stats。

其中的affine指定是否需要仿射&＃xff0c;也就是是否需要上面算式的第四个&＃xff0c;如果affine&＃61;False则γ&＃61;1,β&＃61;0&＃xff0c;并且不能学习被更新。一般都会设置成affine&＃61;True。

trainning和track_running_stats&＃xff0c;track_running_stats&＃61;True表示跟踪整个训练过程中的batch的统计特性&＃xff0c;得到方差和均值&＃xff0c;而不只是仅仅依赖与当前输入的batch的统计特性。相反的&＃xff0c;如果track_running_stats&＃61;False那么就只是计算当前输入的batch的统计特性中的均值和方差了。当在推理阶段的时候&＃xff0c;如果track_running_stats&＃61;False&＃xff0c;此时如果batch_size比较小&＃xff0c;那么其统计特性就会和全局统计特性有着较大偏差&＃xff0c;可能导致糟糕的效果。

如果BatchNorm2d的参数track_running_stats设置False,那么加载预训练后每次模型测试测试集的结果时都不一样&＃xff1b;track_running_stats设置为True时&＃xff0c;每次得到的结果都一样。

running_mean和running_var参数是根据输入的batch的统计特性计算的&＃xff0c;严格来说不算是“学习”到的参数&＃xff0c;不过对于整个计算是很重要的。BN层中的running_mean和running_var的更新是在forward操作中进行的&＃xff0c;而不是在optimizer.step()中进行的&＃xff0c;因此如果处于训练中泰&＃xff0c;就算不进行手动step()&＃xff0c;BN的统计特性也会变化。

model.train() #处于训练状态

for data , label in self.dataloader:

pred &＃61;model(data) #在这里会更新model中的BN统计特性参数&＃xff0c;running_mean,running_var

loss&＃61;self.loss(pred,label)

#就算不进行下列三行&＃xff0c;BN的统计特性参数也会变化

opt.zero_grad()

loss.backward()

opt.step()

这个时候&＃xff0c;要用model.eval()转到测试阶段&＃xff0c;才能固定住running_mean和running_var&＃xff0c;有时候如果是先预训练模型然后加载模型&＃xff0c;重新跑测试数据的时候&＃xff0c;结果不同&＃xff0c;有一点性能上的损失&＃xff0c;这个时候基本上是training和track_running_stats设置的不对。

如果使用两个模型进行联合训练&＃xff0c;为了收敛更容易控制&＃xff0c;先预训练好模型model_A&＃xff0c;并且model_A内还有若干BN层&＃xff0c;后续需要将model_A作为一个inference推理模型和model_B联合训练&＃xff0c;此时希望model_A中的BN的统计特性量running_mean和running_var不会乱变化&＃xff0c;因此就需要将model_A.eval()设置到测试模型&＃xff0c;否则在trainning模式下&＃xff0c;就算是不去更新模型的参数&＃xff0c;其BN都会变化&＃xff0c;这将导致和预期不同的结果。

推荐阅读

int
利用ARMA模型对平稳非白噪声序列进行建模的步骤及代码实现

本文介绍了利用ARMA模型对平稳非白噪声序列进行建模的步骤及代码实现。首先对观察值序列进行样本自相关系数和样本偏自相关系数的计算，然后根据这些系数的性质选择适当的ARMA模型进行拟合，并估计模型中的位置参数。接着进行模型的有效性检验，如果不通过则重新选择模型再拟合，如果通过则进行模型优化。最后利用拟合模型预测序列的未来走势。文章还介绍了绘制时序图、平稳性检验、白噪声检验、确定ARMA阶数和预测未来走势的代码实现。 ... [详细]

蜡笔小新 2023-12-09 08:30:08
function
python创建一个窗口_等一个大佬啊要求用python创建一个窗口，窗口按钮功能是创建一个球体或立方体。明天上课之前交给我...

展开全部下面的代码是创建一个立方体Thisexamplescreatesanddisplaysasimplebox.#Thefirstlineloadstheinit_disp ... [详细]

蜡笔小新 2023-12-13 16:26:09
random
pytorch Dropout过拟合的操作

这篇文章主要介绍了pytorchDropout过拟合的操作，具有很好的参考价值，希望对大家有所帮助。如有错误或未考虑完 ... [详细]

蜡笔小新 2023-10-16 19:35:56
random
YOLOv7基于自己的数据集从零构建模型完整训练、推理计算超详细教程

本文介绍了关于人工智能、神经网络和深度学习的知识点，并提供了YOLOv7基于自己的数据集从零构建模型完整训练、推理计算的详细教程。文章还提到了郑州最低生活保障的话题。对于从事目标检测任务的人来说，YOLO是一个熟悉的模型。文章还提到了yolov4和yolov6的相关内容，以及选择模型的优化思路。 ... [详细]

蜡笔小新 2023-12-14 18:28:01
select
计算机存储系统的层次结构及其优势

本文介绍了计算机存储系统的层次结构，包括高速缓存、主存储器和辅助存储器三个层次。通过分层存储数据可以提高程序的执行效率。计算机存储系统的层次结构将各种不同存储容量、存取速度和价格的存储器有机组合成整体，形成可寻址存储空间比主存储器空间大得多的存储整体。由于辅助存储器容量大、价格低，使得整体存储系统的平均价格降低。同时，高速缓存的存取速度可以和CPU的工作速度相匹配，进一步提高程序执行效率。 ... [详细]

蜡笔小新 2023-12-13 17:32:41
function
不同优化算法的比较分析及实验验证

本文介绍了神经网络优化中常用的优化方法，包括学习率调整和梯度估计修正，并通过实验验证了不同优化算法的效果。实验结果表明，Adam算法在综合考虑学习率调整和梯度估计修正方面表现较好。该研究对于优化神经网络的训练过程具有指导意义。 ... [详细]

蜡笔小新 2023-12-13 16:05:14
int
也就是|小窗_卷积的特征提取与参数计算

篇首语：本文由编程笔记#小编为大家整理，主要介绍了卷积的特征提取与参数计算相关的知识，希望对你有一定的参考价值。Dense和Conv2D根本区别在于，Den ... [详细]

蜡笔小新 2023-12-13 12:59:48
web
Python连接服务器失败：使用aiohttp模拟服务器出现错误问题及解决方法

本文介绍了在使用Python中的aiohttp模块模拟服务器时出现的连接失败问题，并提供了相应的解决方法。文章中详细说明了出错的代码以及相关的软件版本和环境信息，同时也提到了相关的警告信息和函数的替代方案。通过阅读本文，读者可以了解到如何解决Python连接服务器失败的问题，并对aiohttp模块有更深入的了解。 ... [详细]

蜡笔小新 2023-12-13 12:37:59
header
ASP.NET2.0数据教程之十四：使用FormView的模板

本文介绍了在ASP.NET 2.0中使用FormView控件来实现自定义的显示外观，与GridView和DetailsView不同，FormView使用模板来呈现，可以实现不规则的外观呈现。同时还介绍了TemplateField的用法和FormView与DetailsView的区别。 ... [详细]

蜡笔小新 2023-12-13 08:07:00
js
腾讯BERT推理模型TurboTransformers的快速推理能力

本文介绍了腾讯最近开源的BERT推理模型TurboTransformers，该模型在推理速度上比PyTorch快1~4倍。TurboTransformers采用了分层设计的思想，通过简化问题和加速开发，实现了快速推理能力。同时，文章还探讨了PyTorch在中间层延迟和深度神经网络中存在的问题，并提出了合并计算的解决方案。 ... [详细]

蜡笔小新 2023-12-12 13:48:41
int
模板引擎StringTemplate的使用方法和特点

本文介绍了模板引擎StringTemplate的使用方法和特点，包括强制Model和View的分离、Lazy-Evaluation、Recursive enable等。同时，还介绍了StringTemplate语法中的属性和普通字符的使用方法，并提供了向模板填充属性的示例代码。 ... [详细]

蜡笔小新 2023-12-11 21:45:03
function
Python基础知识：注释、输出和input交互

本文介绍了Python基础知识，包括注释的使用、输出函数print的用法以及input函数的交互功能。其中涉及到字符串和整数的类型转换等内容。 ... [详细]

蜡笔小新 2023-12-09 18:11:26
web
python打卡记录去重_Python零基础学习笔记与记录之一（了解Python这个小伙伴）

本人学习笔记，知识点均摘自于网络，用于学习和交流(如未注明出处，请提醒，将及时更正，谢谢)OS:我学习是为了上 ... [详细]

蜡笔小新 2023-10-17 16:05:58
random
语义分割系列3SegNet（pytorch实现）

SegNet手稿最早是在2015年12月投出，和FCN属于同时期作品。稍晚于FCN，既然属于后来者，又是与FCN同属于语义分割网络 ... [详细]

蜡笔小新 2023-10-17 10:14:20
int
mmcls多标签分类实战（二）：resnet多标签分类

上一章讲了如何制作数据集，接下来我们使用mmcls来实现多标签分类。 ... [详细]

蜡笔小新 2023-10-17 07:43:01

手机用户2502869883

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章