Tensorflow中使用tf.conv2d_transpose()函数进行卷积转置操作

作者：supe丶r女人帮 | 来源：互联网 | 2023-10-14 15:48

我先解释一下必要信息：tf.conv2d_transpose(value,filter,output_shape,strides,paddingSAME,dat

我先解释一下必要信息&＃xff1a;

tf.conv2d_transpose(value, filter, output_shape, strides, padding&＃61;"SAME", data_format&＃61;"NHWC", name&＃61;None)

除去name参数用以指定该操作的name&＃xff0c;与方法有关的一共六个参数&＃xff1a;

第一个参数value&＃xff1a;指需要做反卷积的输入图像&＃xff0c;它要求是一个Tensor
第二个参数filter&＃xff1a;卷积核&＃xff0c;它要求是一个Tensor&＃xff0c;具有[filter_height, filter_width, out_channels, in_channels]这样的shape&＃xff0c;具体含义是[卷积核的高度&＃xff0c;卷积核的宽度&＃xff0c;卷积核个数&＃xff0c;图像通道数]
第三个参数output_shape&＃xff1a;反卷积操作输出的shape&＃xff0c;细心的同学会发现卷积操作是没有这个参数的.
第四个参数strides&＃xff1a;反卷积时在图像每一维的步长&＃xff0c;这是一个一维的向量&＃xff0c;长度4
第五个参数padding&＃xff1a;string类型的量&＃xff0c;只能是"SAME","VALID"其中之一&＃xff0c;这个值决定了不同的卷积方式
第六个参数data_format&＃xff1a;string类型的量&＃xff0c;&＃39;NHWC&＃39;和&＃39;NCHW&＃39;其中之一&＃xff0c;这是tensorflow新版本中新加的参数&＃xff0c;它说明了value参数的数据格式。&＃39;NHWC&＃39;指tensorflow标准的数据格式[batch, height, width, in_channels]&＃xff0c;&＃39;NCHW&＃39;指Theano的数据格式,[batch, in_channels&＃xff0c;height, width]&＃xff0c;当然默认值是&＃39;NHWC&＃39;

通俗的讲这个解卷积&＃xff0c;也就做反卷积&＃xff0c;也叫做转置卷积&＃xff08;最贴切&＃xff09;&＃xff0c;我们就叫做反卷积吧&＃xff0c;它的目的就是卷积的反向操作&＃xff0c;

所以在做这些之前&＃xff0c;你心里要有一个正向卷积的流程在心里&＃xff0c;什么&＃xff1f;你没有&＃xff1f;好吧&＃xff0c;那我就引导你一下&＃xff1a;

input_shape &＃61; [1,5,5,3]
kernel_shape&＃61;[2,2,3,1]
strides&＃61;[1,2,2,1]
padding &＃61; "SAME"

out_shape 结果应该是什么&＃xff0c;应该是[1,3,3,1] 只有一个通道的3*3的图片&＃xff0c;

然后我们就对它进行反向操作&＃xff0c;注意哪方面不同&＃xff1a;

设x&＃61;out_shape,#[1,3,3,1]

import tensorflow as tf tf.set_random_seed(1)x &＃61; tf.random_normal(shape&＃61;[1,3,3,1])#正向卷积的结果&＃xff0c;要作为反向卷积的输出 kernel &＃61; tf.random_normal(shape&＃61;[2,2,3,1])#正向卷积的kernel的模样# strides 和padding也是假想中正向卷积的模样。 y &＃61; tf.nn.conv2d_transpose(x,kernel,output_shape&＃61;[1,5,5,3],strides&＃61;[1,2,2,1],padding&＃61;"SAME") # 在这里&＃xff0c;output_shape&＃61;[1,6,6,3]也可以&＃xff0c;考虑正向过程&＃xff0c;[1,6,6,3]时&＃xff0c;然后通过 # kernel_shape:[2,2,3,1],strides:[1,2,2,1]也可以 # 获得x_shape:[1,3,3,1]。 # output_shape 也可以是一个 tensor sess &＃61; tf.Session() tf.global_variables_initializer().run(session&＃61;sess)print(y.eval(session&＃61;sess))

然后输出的y就是最上面的input_shape&＃xff0c;

我想到了一个很合理的方法就是这样定制你的反卷积网络&＃xff0c;也即是你在进行反卷积之前&＃xff0c;你要推算一下正向卷积所需要的路径&＃xff0c;然后把正向卷积所需要的kernel,和strides写入tf.conv2d_transpose()函数就行了&＃xff0c;当然输入和输出要互相对换一下就行了&＃xff0c;

下面是我自己实现的3维反卷积操作&＃xff0c;原理是一样的&＃xff1a;

import tensorflow as tfkernel1 &＃61; tf.constant(1.0, shape&＃61;[3,3,3,512,512]) #正向卷积核 kernel2 &＃61; tf.constant(1.0, shape&＃61;[3,3,3,512,512]) #反向卷积核 x3 &＃61; tf.constant(1.0, shape&＃61;[10,2,7,7,512])#正向卷积输入 y2 &＃61; tf.nn.conv3d(x3, kernel1, strides&＃61;[1,1,1,1,1], padding&＃61;"SAME") #正向卷积 pool&＃61;tf.nn.max_pool3d(y2,ksize&＃61;[1,2,2,2,1],strides&＃61;[1,2,2,2,1],padding&＃61;&＃39;SAME&＃39;)#池化sess&＃61;tf.Session() sess.run(tf.global_variables_initializer()) sess.run(pool) print(pool.shape)#(10,1,4,4,512)#反向卷积 y3 &＃61; tf.nn.conv3d_transpose(pool,kernel2,output_shape&＃61;[10,2,7,7,512], strides&＃61;[1,2,2,2,1],padding&＃61;"SAME") sess.run(y3) print(y3.shape)#(10,2,7,7,512)

上面的例子是由[10,2,7,7,512]----卷积池化到----[10,1,4,4,512]----反卷积到----[10,2,7,7,512]

至于内部原理是怎么实现的&＃xff0c;请看&＃xff1a;https://blog.csdn.net/u012938704/article/details/52838902

https://blog.csdn.net/kekong0713/article/details/68941498

http://deeplearning.net/software/theano_versions/dev/tutorial/conv_arithmetic.html#transposed-convolution-arithmetic

推荐阅读

version
如何去除Win7快捷方式的箭头

本文介绍了如何去除Win7快捷方式的箭头的方法，通过生成一个透明的ico图标并将其命名为Empty.ico，将图标复制到windows目录下，并导入注册表，即可去除箭头。这样做可以改善默认快捷方式的外观，提升桌面整洁度。 ... [详细]

蜡笔小新 2023-12-14 16:17:05
string
向QTextEdit拖放文件的方法及实现步骤

本文介绍了在使用QTextEdit时如何实现拖放文件的功能，包括相关的方法和实现步骤。通过重写dragEnterEvent和dropEvent函数，并结合QMimeData和QUrl等类，可以轻松实现向QTextEdit拖放文件的功能。详细的代码实现和说明可以参考本文提供的示例代码。 ... [详细]

蜡笔小新 2023-12-14 16:06:38
string
C#学习教程：在Console中工作但在Windows窗体中不工作的异步代码分享

本文分享了一个关于在C#中使用异步代码的问题，作者在控制台中运行时代码正常工作，但在Windows窗体中却无法正常工作。作者尝试搜索局域网上的主机，但在窗体中计数器没有减少。文章提供了相关的代码和解决思路。 ... [详细]

蜡笔小新 2023-12-14 15:56:00
string
Java工具类库Hutool介绍及功能概述

本文介绍了Java工具类库Hutool，该工具包封装了对文件、流、加密解密、转码、正则、线程、XML等JDK方法的封装，并提供了各种Util工具类。同时，还介绍了Hutool的组件，包括动态代理、布隆过滤、缓存、定时任务等功能。该工具包可以简化Java代码，提高开发效率。 ... [详细]

蜡笔小新 2023-12-14 14:29:36
input
Perl的测试框架Test::Base简介及使用方法

本文介绍了Perl的测试框架Test::Base，它是一个数据驱动的测试框架，可以自动进行单元测试，省去手工编写测试程序的麻烦。与Test::More完全兼容，使用方法简单。以plural函数为例，展示了Test::Base的使用方法。 ... [详细]

蜡笔小新 2023-12-13 20:05:31
input
也就是|小窗_卷积的特征提取与参数计算

篇首语：本文由编程笔记#小编为大家整理，主要介绍了卷积的特征提取与参数计算相关的知识，希望对你有一定的参考价值。Dense和Conv2D根本区别在于，Den ... [详细]

蜡笔小新 2023-12-13 12:59:48
string
[大整数乘法] java代码实现

本文介绍了使用java代码实现大整数乘法的过程，同时也涉及到大整数加法和大整数减法的计算方法。通过分治算法来提高计算效率，并对算法的时间复杂度进行了研究。详细代码实现请参考文章链接。 ... [详细]

蜡笔小新 2023-12-13 11:21:32
string
关于Linq to sql 实现模糊查询 string数组

前景：当UI一个查询条件为多项选择，或录入多个条件的时候，比如查询所有名称里面包含以下动态条件，需要模糊查询里面每一项时比如是这样一个数组条件：newstring[]{兴业银行, ... [详细]

蜡笔小新 2023-12-13 09:34:59
string
Java学习笔记之面向对象编程（OOP）

本文介绍了Java学习笔记中的面向对象编程（OOP）内容，包括OOP的三大特性（封装、继承、多态）和五大原则（单一职责原则、开放封闭原则、里式替换原则、依赖倒置原则）。通过学习OOP，可以提高代码复用性、拓展性和安全性。 ... [详细]

蜡笔小新 2023-12-13 08:44:30
string
手机移动端HTML5和JavaScript如何实现视频上传和压缩视频质量？

本文讨论了在手机移动端如何使用HTML5和JavaScript实现视频上传并压缩视频质量，或者降低手机摄像头拍摄质量的问题。作者指出HTML5和JavaScript无法直接压缩视频，只能通过将视频传送到服务器端由后端进行压缩。对于控制相机拍摄质量，只有使用JAVA编写Android客户端才能实现压缩。此外，作者还解释了在交作业时使用zip格式压缩包导致CSS文件和图片音乐丢失的原因，并提供了解决方法。最后，作者还介绍了一个用于处理图片的类，可以实现图片剪裁处理和生成缩略图的功能。 ... [详细]

蜡笔小新 2023-12-12 15:58:44
string
Java自带的观察者模式及实现方法详解

本文介绍了Java自带的观察者模式，包括Observer和Observable对象的定义和使用方法。通过添加观察者和设置内部标志位，当被观察者中的事件发生变化时，通知观察者对象并执行相应的操作。实现观察者模式非常简单，只需继承Observable类和实现Observer接口即可。详情请参考Java官方api文档。 ... [详细]

蜡笔小新 2023-12-12 13:52:38
string
HTML学习02 图像标签的使用和属性

本文介绍了HTML中图像标签的使用和属性，包括定义图像、定义图像地图、使用源属性和替换文本属性。同时提供了相关实例和注意事项，帮助读者更好地理解和应用图像标签。 ... [详细]

蜡笔小新 2023-12-13 11:31:26
string
前端性能优化无损压缩webp格式的图片

一、什么是webpWebP格式，谷歌开发的一种旨在加快图片加载速度的图片格式。图片压缩体积大约只有JPEG的23，并能节省大量的服务器宽带资源和数据空 ... [详细]

蜡笔小新 2023-12-12 19:53:06
version
在Xamarin XAML语言中如何在页面级别构建ControlTemplate控件模板

本文介绍了在Xamarin XAML语言中如何在页面级别构建ControlTemplate控件模板的方法和步骤，包括将ResourceDictionary添加到页面中以及在ResourceDictionary中实现模板的构建。通过本文的阅读，读者可以了解到在Xamarin XAML语言中构建控件模板的具体操作步骤和语法形式。 ... [详细]

蜡笔小新 2023-12-12 17:52:50
version
MyBatis多表查询与动态SQL使用

本文介绍了MyBatis多表查询与动态SQL的使用方法，包括一对一查询和一对多查询。同时还介绍了动态SQL的使用，包括if标签、trim标签、where标签、set标签和foreach标签的用法。文章还提供了相关的配置信息和示例代码。 ... [详细]

蜡笔小新 2023-12-12 17:12:51

supe丶r女人帮

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章