当前位置: 开发笔记 > 编程语言 > 正文

炼丹技巧（一）——MNIST数据上的炼丹（TensorFlow）之Shuffle_batch的探索

作者：王意之 | 来源：互联网 | 2023-10-12 06:44

0.写作目的好记性不如烂笔头。记录在学习过程中遇到的问题，以及对问题的思考和解决方法，为后来人提供一些经验。1.网络的重要性虽然MNIST数据集相对比较简单，已经不能作为网络的评价

0. 写作目的

好记性不如烂笔头。记录在学习过程中遇到的问题，以及对问题的思考和解决方法，为后来人提供一些经验。

1. 网络的重要性

虽然MNIST数据集相对比较简单，已经不能作为网络的评价标准，因为许多网络在MNIST数据上的精度都超过了99%，但是网络也不是随意选择的。刚开始随即设计了一个网络，用于测试MNIST数据集，收敛较慢，因此修改了网络的结构。

原始网络：

炼丹技巧（一）——MNIST数据上的炼丹（TensorFlow）之Shuffle_batch的探索

原始网络部分训练过程（由于训练时间有些长，就只训练了部分）

炼丹技巧（一）——MNIST数据上的炼丹（TensorFlow）之Shuffle_batch的探索

修改后的网络：

炼丹技巧（一）——MNIST数据上的炼丹（TensorFlow）之Shuffle_batch的探索

修改后的网络的训练过程显示：

炼丹技巧（一）——MNIST数据上的炼丹（TensorFlow）之Shuffle_batch的探索

2. Shuffle Batch 的探索

2.1 问题的来源

目前深度学习的框架，对于训练都有自己的一套完整流程。此处在验证如何读取较大数据时产生的一个问题，具体的读入数据方式可以参考我的博客——基于tensorflow的MNIST探索（基于图像版本的实现与探索）——如何读取较大数据集进行训练（一）。

2.2 问题的描述

在自己写的LoadDatas类中，存在一个public函数next_batch(self, batch_size=16)。在训练时，对于next_batch需要进行打乱，那么问题来了，如何进行打乱。博主认为有三种打乱的方式：

i) 对于每次的next_batch，将所有数据集打乱，然后取前batch_size个数据，然后抽取的样本放入总样本中，对应概率中的放回抽样

ii) 对于每次的next_batch，将所有数据集打乱，然后取前batch_size个数据，然后将抽取的样本不放入总样本中，对应概率中的不放回抽样

iii) 对于每次的next_batch,在每一个epoch时将顺序打乱，然后开始从头向后去batch_size个数据，即只打乱一次

2.3 针对问题进行的实验

网络架构选择修改后的网络（tf.train.MomentumOptimizer(learning_rate=0.001, momentum=0.9), batch_size=32）。

i)情况下的训练结果

炼丹技巧（一）——MNIST数据上的炼丹（TensorFlow）之Shuffle_batch的探索

ii) 情况下的训练结果

炼丹技巧（一）——MNIST数据上的炼丹（TensorFlow）之Shuffle_batch的探索

iii) 情况下的训练结果（由于时间关系，只训练了3个epoch）

炼丹技巧（一）——MNIST数据上的炼丹（TensorFlow）之Shuffle_batch的探索

2.4 实验的结果以及结论

从2.3中的训练结果图来看，采用i)情况，即有放回的batch_size结果比较好，而且iii)情况效果最差，原因可能是由于shuffle次数过少，导致数据的分布可能呈现一定的规律。当然也有可能实验不够充分，存在一定的随机性。

There may be some mistakes in this blog. So, any suggestions and comments are welcome!

推荐阅读

io
【机器学习】生成式对抗网络模型综述

生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型，可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]

蜡笔小新 2023-12-14 17:51:18
io
深度学习中的Vision Transformer (ViT)详解

本文详细介绍了深度学习中的Vision Transformer (ViT)方法。首先介绍了相关工作和ViT的基本原理，包括图像块嵌入、可学习的嵌入、位置嵌入和Transformer编码器等。接着讨论了ViT的张量维度变化、归纳偏置与混合架构、微调及更高分辨率等方面。最后给出了实验结果和相关代码的链接。本文的研究表明，对于CV任务，直接应用纯Transformer架构于图像块序列是可行的，无需依赖于卷积网络。 ... [详细]

蜡笔小新 2023-12-12 15:26:38
io
Python张量流中的device spec make_merged_spec()方法使用说明

本文介绍了在Python张量流中使用make_merged_spec()方法合并设备规格对象的方法和语法，以及参数和返回值的说明，并提供了一个示例代码。 ... [详细]

蜡笔小新 2023-12-11 12:15:19
web
揭秘阿里云WAF背后神秘的AI智能防御体系

背景应用安全领域，各类攻击长久以来都危害着互联网上的应用，在web应用安全风险中，各类注入、跨站等攻击仍然占据着较前的位置。WAF(Web应用防火墙)正是为防御和阻断这类攻击而存在 ... [详细]

蜡笔小新 2023-12-11 01:30:52
web
aw多模态融合,多模态话语分析

本博文基于《Amalgamationofproteinsequence,structureandtextualinformationforimprovingprote ... [详细]

蜡笔小新 2023-10-17 19:16:14
web
【论文】ICLR 2020 九篇满分论文！！！

点击上方，选择星标或置顶，每天给你送干货！阅读大概需要11分钟跟随小博主，每天进步一丢丢来自：深度学习技术前沿 ... [详细]

蜡笔小新 2023-10-17 18:45:53
web
深度学习黑话

OCR：用字符识别方法将形状翻译成计算机文字的过程Matlab：商业数学软件；CUDA：CUDA™是一种由NVIDIA推 ... [详细]

蜡笔小新 2023-10-17 17:55:01
web
python打卡记录去重_Python零基础学习笔记与记录之一（了解Python这个小伙伴）

本人学习笔记，知识点均摘自于网络，用于学习和交流(如未注明出处，请提醒，将及时更正，谢谢)OS:我学习是为了上 ... [详细]

蜡笔小新 2023-10-17 16:05:58
string
Tensorflow 训练自己的cnn模型行人识别

代码如下：#coding:utf-8importstring,os,sysimportnumpyasnpimportmatplotlib.py ... [详细]

蜡笔小新 2023-10-16 16:57:06
string
干货 | 携程AI推理性能的自动化优化实践

作者简介携程度假AI研发团队致力于为携程旅游事业部提供丰富的AI技术产品，其中性能优化组为AI模型提供全方位的优化方案，提升推理性能降低成本࿰ ... [详细]

蜡笔小新 2023-10-16 14:03:03
string
「爆干7天7夜」入门AI人工智能学习路线一条龙，真的不能再透彻了

前言应广大粉丝要求，今天迪迦来和大家讲解一下如何去入门人工智能，也算是迪迦对自己学习人工智能这么多年的一个总结吧，本条学习路线并不会那么 ... [详细]

蜡笔小新 2023-10-16 12:17:31
string
基于PgpoolII的PostgreSQL集群安装与配置教程

本文介绍了基于PgpoolII的PostgreSQL集群的安装与配置教程。Pgpool-II是一个位于PostgreSQL服务器和PostgreSQL数据库客户端之间的中间件，提供了连接池、复制、负载均衡、缓存、看门狗、限制链接等功能，可以用于搭建高可用的PostgreSQL集群。文章详细介绍了通过yum安装Pgpool-II的步骤，并提供了相关的官方参考地址。 ... [详细]

蜡笔小新 2023-12-14 19:10:25
web
【译】发送表单数据

这是原文链接：sendingformdata许多情况下，我们使用表单发送数据到服务器。服务器处理数据并返回响应给用户。这看起来很简单，但是 ... [详细]

蜡笔小新 2023-12-14 16:19:10
web
mapreduce数据去重的实现方法

本文介绍了利用mapreduce实现数据去重的方法，同时还介绍了人工智能AI领域中常用的框架和工具，包括Keras、PyTorch、MXNet、TensorFlow和PaddlePaddle，并提供了深度学习实战的代码下载链接。 ... [详细]

蜡笔小新 2023-12-10 15:56:37
tree
PyTorch源码解读之torchvision.models

PyTorch框架中有一个非常重要且好用的包：torchvision，该包主要由3个子包组成，分别是：torchvision.datasets、torchvision.models、torchv ... [详细]

蜡笔小新 2023-10-16 11:14:55

王意之

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章