当前位置: 开发笔记 > 编程语言 > 正文

Windowscaffe跑mnist实例

作者：许先生不会再想过去的事观_307 | 来源：互联网 | 2023-01-24 17:09

一.装完caffe当然要来跑跑自带的demo，在examples文件夹下。先来试试用于手写数字识别的mnist，在examplesmnist下有需要的代码文件，但是没有图像库。

　一. 装完caffe当然要来跑跑自带的demo，在examples文件夹下。

先来试试用于手写数字识别的mnist，在 examples/mnist/ 下有需要的代码文件，但是没有图像库。

mnist库有50000个训练样本，10000个测试样本，都是手写数字图像。

　　caffe支持的数据格式为：LMDB　　LEVELDB

　　IMDB比LEVELDB大，但是速度更快，且允许多种训练模型同时读取同一数据集。

　　默认情况，examples里支持的是IMDB文件，不过你可以修改为LEVELDB，后面详解。

　　mnist数据集建议网上搜索下载，网盘有很多，注意将文件夹放到\examples\mnist目录下，且最好命名为图中格式，

否则可能无法读取文件需手动配置。 Windows caffe 跑mnist实例

　　笔者之前下的数据集命名的下划线是连接线就会报错无法读取文件，所以注意文件夹名字！

Windows下最好选择LEVELDB文件，Linux则随意了。下好了LEVELDB文件就不用再使用convert_imageset函数了，省去了转换图片格式和计算均值的步骤。

　　二. 训练mnist模型

　　mnist的网络训练模型文件为： lenet_train_test.prototxt

name: "LeNet"
layer {
  name: "mnist"
  type: "Data"
  top: "data"
  top: "label"
  include {
    phase: TRAIN
  }
  transform_param {
    scale: 0.00390625
  }
  data_param {
    source: "examples/mnist/mnist_train_leveldb"
    batch_size: 64
    backend: LEVELDB
  }
}
layer {
  name: "mnist"
  type: "Data"
  top: "data"
  top: "label"
  include {
    phase: TEST
  }
  transform_param {
    scale: 0.00390625
  }
  data_param {
    source: "examples/mnist/mnist_test_leveldb"
    batch_size: 100
    backend: LEVELDB
  }
}
layer {
  name: "conv1"
  type: "Convolution"
  bottom: "data"
  top: "conv1"
  param {
    lr_mult: 1
  }
  param {
    lr_mult: 2
  }
  convolution_param {
    num_output: 20
    kernel_size: 5
    stride: 1
    weight_filler {
      type: "xavier"
    }
    bias_filler {
      type: "constant"
    }
  }
}
layer {
  name: "pool1"
  type: "Pooling"
  bottom: "conv1"
  top: "pool1"
  pooling_param {
    pool: MAX
    kernel_size: 2
    stride: 2
  }
}
layer {
  name: "conv2"
  type: "Convolution"
  bottom: "pool1"
  top: "conv2"
  param {
    lr_mult: 1
  }
  param {
    lr_mult: 2
  }
  convolution_param {
    num_output: 50
    kernel_size: 5
    stride: 1
    weight_filler {
      type: "xavier"
    }
    bias_filler {
      type: "constant"
    }
  }
}
layer {
  name: "pool2"
  type: "Pooling"
  bottom: "conv2"
  top: "pool2"
  pooling_param {
    pool: MAX
    kernel_size: 2
    stride: 2
  }
}
layer {
  name: "ip1"
  type: "InnerProduct"
  bottom: "pool2"
  top: "ip1"
  param {
    lr_mult: 1
  }
  param {
    lr_mult: 2
  }
  inner_product_param {
    num_output: 500
    weight_filler {
      type: "xavier"
    }
    bias_filler {
      type: "constant"
    }
  }
}
layer {
  name: "relu1"
  type: "ReLU"
  bottom: "ip1"
  top: "ip1"
}
layer {
  name: "ip2"
  type: "InnerProduct"
  bottom: "ip1"
  top: "ip2"
  param {
    lr_mult: 1
  }
  param {
    lr_mult: 2
  }
  inner_product_param {
    num_output: 10
    weight_filler {
      type: "xavier"
    }
    bias_filler {
      type: "constant"
    }
  }
}
layer {
  name: "accuracy"
  type: "Accuracy"
  bottom: "ip2"
  bottom: "label"
  top: "accuracy"
  include {
    phase: TEST
  }
}
layer {
  name: "loss"
  type: "SoftmaxWithLoss"
  bottom: "ip2"
  bottom: "label"
  top: "loss"
}

一般修改两个DATA层的 “source”文件路径就行，上面的例子中，我已经改了，改为mnist的训练集和测试集文件夹路径。再就是注意“backend: LEVELDB”,默认的backend应该是IMDB要修改！

　　网络模型 lenet_train_test.prototxt修改后再修改 lenet_solver.prototxt

该文件主要是一些学习参数和策略：

 1 # The train/test net protocol buffer definition
 2 net: "examples/mnist/lenet_train_test.prototxt"
 3 # test_iter specifies how many forward passes the test should carry out.
 4 # In the case of MNIST, we have test batch size 100 and 100 test iterations,
 5 # covering the full 10,000 testing images.
 6 test_iter: 100
 7 # Carry out testing every 500 training iterations.
 8 test_interval: 500
 9 # The base learning rate, momentum and the weight decay of the network.
10 base_lr: 0.01
11 momentum: 0.9
12 weight_decay: 0.0005
13 # The learning rate policy
14 lr_policy: "inv"
15 gamma: 0.0001
16 power: 0.75
17 # Display every 100 iterations
18 display: 100
19 # The maximum number of iterations
20 max_iter: 10000
21 # snapshot intermediate results
22 snapshot: 5000
23 snapshot_prefix: "examples/mnist/lenet"
24 # solver mode: CPU or GPU
25 solver_mode: CPU

带#的注释可以不管，能理解最好：

　　第二行的 net:　　路径需改为自己的网络模型xx_train_test.prototxt路径。其他的学习率 base_lr，lr_policy等不建议修改；max_iter最大迭代次数可以稍微改小，display显示间隔也可以随意修改~最后一行，我是只有CPU模式所以设为CPU，如果可以用GPU加速可设为GPU！

　　到这基本设置就结束了，然后就是写命令执行测试程序了：

我选择写了批处理.bat文件执行，也可以直接在CMD环境输命令执行。

　　新建mnist_train.bat，内容如下：

cd ../../
"Build/x64/Debug/caffe.exe" train --solver=examples/mnist/lenet_solver.prototxt 
pause

根据自己的情况修改第二行的路径位置，Windows应该都是在Build/x64目录下，有的博客写的/bin/目录其实是Linux的并不适用于Windows环境。还要注意使用斜线“/”，不要使用“\”无法识别，Python代码多为后者要修改！

我的环境只有Debug目录，如果你有Realease目录，使用Realease目录。

运行.bat成功后，会开始训练，训练结束界面如下：

Windows caffe 跑mnist实例

　　最后几行可以看到accuracy的准确率可以达到99%，也是相当准确了！

提示，caffe文件夹内会生成.caffemodel文件

Windows caffe 跑mnist实例

使用caffemodel文件开始测试：

　　三.测试数据

　　由于测试数据集也是直接下载好了的LEVELDB文件，所以省了不少步骤

　　直接新建mnist_test.bat文件，类似训练mnist模型一样，对该模型进行数据测试。　　

cd ../../
"Build/x64/Debug/caffe.exe" test --model=examples/mnist/lenet_train_test.prototxt -weights=examples/mnist/lenet_iter_10000.caffemodel
pause

　　类似mnits_train.bat，修改文件路径名，test表示用于测试，model指向自己的网络模型文件，最后添加权值文件.caffemodel进行测试。

　　运行mnist_test.bat后，成功界面如下：

　　 Windows caffe 跑mnist实例

　　最后一行还是有98%的准确率还是很不错的，说明模型生成的还不错。

总结：其实还遇到了不少零零碎碎的问题，大多都可以百度解决，主要是记得修改对自己的文件路径目录，Windows下一定要使用LEVELDB数据文件，.prototxt也记得修改，然后就是等待模型跑完看结果了，看到高准确率还是很开心的~

　　四. 使用该模型

　　模型训练好了，数据也只是测试了，那么我们要使用该模型判断一张图片是数字几该如何做呢？

这个时候需要生成 classification.exe，然后执行相应的.bat命令来预测图片的分类结果。

　　mnist分类使用可以参考http://www.cnblogs.com/yixuan-xu/p/5862657.html

　　发现OpenCV可以加载caffe 框架模型，准备再写一篇博客进行实践介绍~

http://docs.opencv.org/3.1.0/d5/de7/tutorial_dnn_googlenet.html

推荐阅读

list
向QTextEdit拖放文件的方法及实现步骤

本文介绍了在使用QTextEdit时如何实现拖放文件的功能，包括相关的方法和实现步骤。通过重写dragEnterEvent和dropEvent函数，并结合QMimeData和QUrl等类，可以轻松实现向QTextEdit拖放文件的功能。详细的代码实现和说明可以参考本文提供的示例代码。 ... [详细]

蜡笔小新 2023-12-14 16:06:38
io
的错误消息：

ZSI.generate.Wsdl2PythonError: unsupported local simpleType restriction ... [详细]

蜡笔小新 2023-12-13 20:28:08
list
Python正则表达式学习记录及常用方法

本文记录了学习Python正则表达式的过程，介绍了re模块的常用方法re.search，并解释了rawstring的作用。正则表达式是一种方便检查字符串匹配模式的工具，通过本文的学习可以掌握Python中使用正则表达式的基本方法。 ... [详细]

蜡笔小新 2023-12-13 16:37:19
list
自动化测试项目失败的原因及调查结果

本文介绍了自动化测试专家Elfriede Dustin在2008年的文章中讨论了自动化测试项目失败的原因。同时，引用了IDT在2007年进行的一次软件自动化测试的研究调查结果，调查显示很多公司认为自动化测试很有用，但很少有公司成功实施。调查结果表明，缺乏资源是导致自动化测试失败的主要原因，其中37%的人认为缺乏时间。 ... [详细]

蜡笔小新 2023-12-11 19:03:08
list
Java面经整理及相关概念解析

本文整理了Java面试中常见的问题及相关概念的解析，包括HashMap中为什么重写equals还要重写hashcode、map的分类和常见情况、final关键字的用法、Synchronized和lock的区别、volatile的介绍、Syncronized锁的作用、构造函数和构造函数重载的概念、方法覆盖和方法重载的区别、反射获取和设置对象私有字段的值的方法、通过反射创建对象的方式以及内部类的详解。 ... [详细]

蜡笔小新 2023-12-10 22:17:08
select
十大经典排序算法动图演示+Python实现

本文介绍了十大经典排序算法的原理、演示和Python实现。排序算法分为内部排序和外部排序，常见的内部排序算法有插入排序、希尔排序、选择排序、冒泡排序、归并排序、快速排序、堆排序、基数排序等。文章还解释了时间复杂度和稳定性的概念，并提供了相关的名词解释。 ... [详细]

蜡笔小新 2023-12-10 19:28:59
io
通过Anaconda安装tensorflow，并安装运行spyder编译器的完整教程

本文提供了一个完整的教程，介绍了如何通过Anaconda安装tensorflow，并安装运行spyder编译器。文章详细介绍了安装Anaconda、创建tensorflow环境、安装GPU版本tensorflow、安装和运行Spyder编译器以及安装OpenCV等步骤。该教程适用于Windows 8操作系统，并提供了相关的网址供参考。通过本教程，读者可以轻松地安装和配置tensorflow环境，以及运行spyder编译器进行开发。 ... [详细]

蜡笔小新 2023-12-09 09:46:32
io
红米3S3X|RROS-V7.0|安卓9.0|最强大的自定义|美观流畅|全新起航|魔幻动画|冰箱冻结|高级设置

该ROM为红米3S3X手机提供了最强大的自定义功能，包括美观流畅的界面、全新的起航动画、魔幻的动画效果以及冰箱冻结功能。同时，还提供了高级设置，包括悬浮窗口显示自定义、WIFI密码查看器、S8炫酷跑马灯显示自定义等多项实用功能。此外，该ROM还优化了手机的待机时间、wifi连接速度，并支持状态栏实时网速显示和电池电量百分比显示。 ... [详细]

蜡笔小新 2023-12-09 08:34:17
import
Window10+anaconda+python3.5.4+ tensorflow1.5+ keras(GPU版本）安装教程

Window10+anaconda+python3.5.4+ tensorflow1.5+ keras(GPU版本）安装教程 ... [详细]

蜡笔小新 2023-10-17 21:10:23
io
用c语言实现线画、填充图元生成算法多边形_【游戏场景剔除】剔除算法综述...

之前在做场景优化的过程中，看了不少论文和博客阐述不同剔除算法的原理和过程，自己参照着算法去实现了Hiz和软件剔除。一直想写一篇关于剔除算法的综述 ... [详细]

蜡笔小新 2023-10-16 13:24:11
input
如何在codeigniter中识别angularjs请求

本文讨论了如何在codeigniter中识别来自angularjs的请求，并提供了两种方法的代码示例。作者尝试了$this->input->is_ajax_request()和自定义函数is_ajax()，但都没有成功。最后，作者展示了一个ajax请求的示例代码。 ... [详细]

蜡笔小新 2023-12-12 12:37:07
io
IOS开发之短信发送与拨打电话的方法详解

本文详细介绍了在IOS开发中实现短信发送和拨打电话的两种方式，一种是使用系统底层发送，虽然无法自定义短信内容和返回原应用，但是简单方便；另一种是使用第三方框架发送，需要导入MessageUI头文件，并遵守MFMessageComposeViewControllerDelegate协议，可以实现自定义短信内容和返回原应用的功能。 ... [详细]

蜡笔小新 2023-12-11 20:15:47
select
Oracle存储过程写法小例子及已命名的异常

本文介绍了Oracle存储过程的基本语法和写法示例，同时还介绍了已命名的系统异常的产生原因。 ... [详细]

蜡笔小新 2023-12-11 15:10:15
select
程序分析与优化9附录XLA的缓冲区指派

本章是系列文章的案例学习，不属于正篇，主要介绍了TensorFlow引入的XLA的优化算法。XLA也有很多局限性，XLA更多的是进行合并，但有时候如果参数特别多的场景下，也需要进行 ... [详细]

蜡笔小新 2023-10-16 16:17:29
select
干货 | 携程AI推理性能的自动化优化实践

作者简介携程度假AI研发团队致力于为携程旅游事业部提供丰富的AI技术产品，其中性能优化组为AI模型提供全方位的优化方案，提升推理性能降低成本࿰ ... [详细]

蜡笔小新 2023-10-16 14:03:03

许先生不会再想过去的事观_307

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章