关于对pretrained模型的使用和理解

作者：Liko2502860873 | 来源：互联网 | 2023-06-06 12:57

现在有很多在Imagenet等数据集上训练的很好的模型，当我们使用相同的网络结构时可以直接拿来调用，而不必花很多时间你去从头造轮子，毕竟这

现在有很多在Imagenet等数据集上训练的很好的模型&＃xff0c;当我们使用相同的网络结构时可以直接拿来调用&＃xff0c;而不必花很多时间你去从头造轮子&＃xff0c;毕竟这些训练好的模型已经是各个数据集的老死机了。

下面我将我自己对与训练模型的使用场景做一个简单的理解&＃xff1a;

1. 当数据集小的时候&＃xff1a;

A、相似度高&＃xff1a;如果训练数据和pretrained model所用的数据相似度较高的时候&＃xff0c;我们不需要从头造轮子&＃xff0c;只需要修改最后的输出的softmax即可&＃xff0c;采用已经训练好的结构来提取特征。

B、相似度低&＃xff1a;如果训练数据和pretrained model所用的数据相似度较低&＃xff0c;假设网络一共有n层&＃xff0c;我们可以冻结预训练模型中的前k个层中的权重&＃xff0c;然后重新训练后面的n-k个层&＃xff0c;并修改最后一层的分类器的输出类即可。因为数据的相似度不高&＃xff0c;重新训练的过程就变得非常关键。而新数据集大小的不足&＃xff0c;则是通过冻结预训练模型的前k层进行弥补。&＃xff08;相似度不高的时候重新训练是很有必要的&＃xff0c;而冻结前K层的原因是为了弥补训练数据量不充足&＃xff0c;当然了数据量不足可以采取数据增强方法&＃xff0c;比如&＃xff1a;对称&＃xff0c;旋转&＃xff0c;随机切&＃xff0c;扭曲等等&＃xff09;

2.当数据集大的时候&＃xff1a;

A、相似度高&＃xff1a;这个是非常好也非常难得的情况&＃xff0c;此时只要采用pretrained模型不需要改变任何参数即可&＃xff0c;即保持模型原有的结构和初始权重不变&＃xff0c;随后在新数据集的基础上重新训练。

B、相似度低&＃xff1a;因为我们有一个很大的数据集&＃xff0c;所以神经网络的训练过程将会比较有效率。然而&＃xff0c;因为实际数据与预训练模型的训练数据之间存在很大差异&＃xff0c;采用预训练模型将不会是一种高效的方式。因此最好的方法还是将预处理模型中的权重全都初始化后在新数据集的基础上重头开始训练。

神经网络

推荐阅读

算法
浏览器中的异常检测算法及其在深度学习中的应用

本文介绍了在浏览器中进行异常检测的算法，包括统计学方法和机器学习方法，并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测，可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率，而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]

蜡笔小新 2023-12-12 16:22:39
深度
腾讯BERT推理模型TurboTransformers的快速推理能力

本文介绍了腾讯最近开源的BERT推理模型TurboTransformers，该模型在推理速度上比PyTorch快1~4倍。TurboTransformers采用了分层设计的思想，通过简化问题和加速开发，实现了快速推理能力。同时，文章还探讨了PyTorch在中间层延迟和深度神经网络中存在的问题，并提出了合并计算的解决方案。 ... [详细]

蜡笔小新 2023-12-12 13:48:41
深度
aw多模态融合,多模态话语分析

本博文基于《Amalgamationofproteinsequence,structureandtextualinformationforimprovingprote ... [详细]

蜡笔小新 2023-10-17 19:16:14
算法
【论文】ICLR 2020 九篇满分论文！！！

点击上方，选择星标或置顶，每天给你送干货！阅读大概需要11分钟跟随小博主，每天进步一丢丢来自：深度学习技术前沿 ... [详细]

蜡笔小新 2023-10-17 18:45:53
算法
概论组合最优化问题、计算复杂性和启发式算法概念（现代优化计算方法）

1.组合最优化问题定义：是通过数学方法的研究去寻找离散事件的最优编排、分组、次序或筛选等。描述：最优化问题的数学模型的一般描述是，x为决策 ... [详细]

蜡笔小新 2023-10-17 18:23:43
算法
深度学习黑话

OCR：用字符识别方法将形状翻译成计算机文字的过程Matlab：商业数学软件；CUDA：CUDA™是一种由NVIDIA推 ... [详细]

蜡笔小新 2023-10-17 17:55:01
算法
Opencv Python版学习笔记（八）字符识别-分类器（SVM，KNearest，RTrees，Boost，MLP）

Opencv提供了几种分类器，例程里通过字符识别来进行说明的1、支持向量机（SVM）：给定训练样本，支持向量机建立一个超平面作为决策平面，使得正例和反例之间的隔离边缘被最大化。函数原型：训练原型cv ... [详细]

蜡笔小新 2023-10-17 17:02:44
算法
3年半巨亏242亿！商汤高估了深度学习，下错了棋？

转自：新智元三年半研发开支近70亿，累计亏损242亿。AI这门生意好像越来越不好做了。近日，商汤科技已向港交所递交IPO申请。招股书显示& ... [详细]

蜡笔小新 2023-10-17 16:41:52
算法
ICRA2019最佳论文 Making Sense of Vision and Touch: SelfSupervised Learning of Multimodal Representatio

文章目录摘要模型架构模态编码器自监督预测控制器设计策略学习控制器设计实验结论和展望会议：ICRA2019标题：《MakingSenseofVision ... [详细]

蜡笔小新 2023-10-17 12:49:25
算法
人工智能推理能力与假设检验

最近Google的Deepmind开始研究如何让AI做数学题。这个问题的提出非常有启发，逻辑推理，发现新知识的能力应该是强人工智能出现自我意识之前最需要发展的能力。深度学习目前可以 ... [详细]

蜡笔小新 2023-10-17 10:01:37
神经网络
如何知道一个网络中每个权重的重要性

如图所示B可以看做是网络的权重,A是输入,C是输出,要想知道网络的权重,只需将,B中的其中一个权重设置为0,如果权重的改变没有对结果造成很大的影响,说明该权重没有影响,神经网络是 ... [详细]

蜡笔小新 2023-10-17 09:30:30
神经网络
Windows7 安装TensorflowGPU文档

安装Tensorflow-GPU文档第一步：通过Anaconda安装python从这个链接https:www.anaconda.comdownload#window ... [详细]

蜡笔小新 2023-10-17 07:23:13
算法
2017亚马逊人工智能奖公布：他们的AI有什么不同？

事实上，在我们周围，“人工智能”让一切都变得更“智能”极具讽刺意味。随着人类与机器智能之间的界限变得模糊，我们的世界正在变成一个机器 ... [详细]

蜡笔小新 2023-10-16 19:50:15
神经网络
keras归一化激活函数dropout

激活函数:1.softmax函数在多分类中常用的激活函数，是基于逻辑回归的，常用在输出一层，将输出压缩在0~1之间，且保证所有元素和为1，表示输入值属于每个输出值的概率大小2、Si ... [详细]

蜡笔小新 2023-10-16 18:35:17
神经网络
都会|可能会_###haohaohao###图神经网络之神器——PyTorch Geometric 上手 & 实战

篇首语：本文由编程笔记#小编为大家整理，主要介绍了###haohaohao###图神经网络之神器——PyTorchGeometric上手&实战相关的知识，希望对你有一定的参考价值。 ... [详细]

蜡笔小新 2023-10-16 18:30:35

Liko2502860873

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章