文章目录TensorFlow基础1.数据类型1.1数值类型1.2字符串类型1.3布尔类型2.数值精度2.1读取精度2.2类型转换3.待优化张量4.创建张量4.1从数组、列表对象创建
文章目录
- TensorFlow基础
- 1.数据类型
- 1.1 数值类型
- 1.2 字符串类型
- 1.3 布尔类型
- 2.数值精度
- 3.待优化张量
- 4.创建张量
- 4.1 从数组、列表对象创建
- 4.2 创建全0或全1张量
- 4.3 创建自定义数值张量
- 4.4 创建已知分布的张量
- 4.4 创建序列
TensorFlow基础
import numpy as np
import tensorflow as tf
import tensorflow.keras as keras
import tensorflow.keras.layers as layers
physical_devices = tf.config.experimental.list_physical_devices('GPU')
assert len(physical_devices) > 0, "Not enough GPU hardware devices available"
tf.config.experimental.set_memory_growth(physical_devices[0], True)
1.数据类型
Tensorflow主要有3种数据类型:数值型,字符串型,布尔型
1.1 数值类型
标量(Scalar) 单个的实数,如 1.2, 3.4 等
向量(Vector) n 个实数的有序集合,通过中括号包裹,如[1.2],[1.2,3.4]等
矩阵(Matrix) n 行 m 列实数的有序集合,如[[1,2],[3,4]]
标量在 TensorFlow 是如何创建的
a = 1.2
aa = tf.constant(1.2)
type(a), type(aa), tf.is_tensor(aa)
(float, tensorflow.python.framework.ops.EagerTensor, True)
如果要使用 TensorFlow 提供的功能函数, 须通过 TensorFlow 规定的方式去创建张量,而不能使用 Python 语言的标准变量创建方式。
x = tf.constant([1,2.,3.3])
x
x.numpy()
array([1. , 2. , 3.3], dtype=float32)
与标量不同,向量的定义须通过 List 容器传给 tf.constant()函数。
创建一个元素的向量:
a = tf.constant([1.2])
a, a.shape
(,TensorShape([1]))
创建 3 个元素的向量:
a = tf.constant([1,2, 3.])
a, a.shape
(,TensorShape([3]))
定义矩阵
a = tf.constant([[1,2],[3,4]])
a, a.shape
(, TensorShape([2, 2]))
三维张量可以定义为:
tf.constant([[[1,2],[3,4]],[[5,6],[7,8]]])
array([[[1, 2],[3, 4]],[[5, 6],[7, 8]]])>
通过传入字符串对象即可创建字符串类型的张量
a = tf.constant('Hello, Deep Learning.')
a
1.2 字符串类型
通过传入字符串对象即可创建字符串类型的张量
a = tf.constant('Hello, Deep Learning.')
a
在 tf.strings 模块中,提供了常见的字符串类型的工具函数,如小写化 lower()、 拼接
join()、 长度 length()、 切分 split()等。
tf.strings.lower(a)
1.3 布尔类型
布尔类型的张量只需要传入 Python 语言的布尔类型数据,转换成 TensorFlow 内部布尔型即可。
tf.constant(True)
创建布尔类型的向量
tf.constant([True, False])
需要注意的是, TensorFlow 的布尔类型和 Python 语言的布尔类型并不等价,不能通用
a = tf.constant(True)
print(a is True)
print(a == True)
False
tf.Tensor(True, shape=(), dtype=bool)
2.数值精度
对于数值类型的张量,可以保持为不同字节长度的精度,如浮点数 3.14 既可以保存为
16-bit
长度,也可以保存为 32-bit
甚至 64-bit
的精度。Bit 位越长,精度越高,同时占用的内存空间也就越大。常用的精度类型有 tf.int16, tf.int32, tf.int64, tf.float16, tf.float32, tf.float64
,其中 tf.float64
即为 tf.double
。
在创建张量时,可以指定张量的保存精度
tf.constant(123456789, dtype=tf.int16)
对于浮点数, 高精度的张量可以表示更精准的数据,例如采用 tf.float32 精度保存π时,实际保存的数据为 3.1415927
import numpy as np
np.pi
tf.constant(np.pi, dtype=tf.float32)
如果采用 tf.float64 精度保存π,则能获得更高的精度
tf.constant(np.pi, dtype=tf.float64)
2.1 读取精度
通过访问张量的 dtype 成员属性可以判断张量的保存精度
a = tf.constant(np.pi, dtype=tf.float16)
print('before:',a.dtype)
if a.dtype != tf.float32: a = tf.cast(a,tf.float32)
print('after :',a.dtype)
before:
after :
2.2 类型转换
系统的每个模块使用的数据类型、 数值精度可能各不相同, 对于不符合要求的张量的类型及精度, 需要通过 tf.cast
函数进行转换
a = tf.constant(np.pi, dtype=tf.float16)
tf.cast(a, tf.double)
进行类型转换时,需要保证转换操作的合法性, 例如将高精度的张量转换为低精度的张量时,可能发生数据溢出隐患:
a = tf.constant(123456789, dtype=tf.int32)
tf.cast(a, tf.int16)
布尔类型与整型之间相互转换也是合法的, 是比较常见的操作
a = tf.constant([True, False])
tf.cast(a, tf.int32)
一般默认 0 表示 False, 1 表示 True,在 TensorFlow 中,将非 0 数字都视为 True,
a = tf.constant([-1, 0, 1, 2])
tf.cast(a, tf.bool)
3.待优化张量
为了区分需要计算梯度信息的张量与不需要计算梯度信息的张量,TensorFlow 增加了一种专门的数据类型来支持梯度信息的记录:tf.Variable
。tf.Variable
类型在普通的张量类型基础上添加了 name
,trainable
等属性来支持计算图的构建。由于梯度运算会消耗大量的计算资源,而且会自动更新相关参数,对于不需要的优化的张量,如神经网络的输入 X,不需要通过 tf.Variable
封装;相反,对于需要计算梯度并优化的张量,如神经网络层的W 和𝒃,需要通过 tf.Variable
包裹以便 TensorFlow 跟踪相关梯度信息。
通过 tf.Variable()
函数可以将普通张量转换为待优化张量:
a = tf.constant([-1, 0, 1, 2])
aa = tf.Variable(a)
aa.name, aa.trainable
('Variable:0', True)
name 属性用于命名计算图中的变量,这套命名体系是 TensorFlow 内部维护的, 一般不需要用户关注 name 属性;
trainable属性表征当前张量是否需要被优化,创建 Variable 对象时是默认启用优化标志,可以设置trainable=False 来设置张量不需要优化。
tf.Variable([[1,2],[3,4]])
array([[1, 2],[3, 4]])>
4.创建张量
4.1 从数组、列表对象创建
通过 tf.convert_to_tensor
函数可以创建新 Tensor,并将保存在 Python List 对象或者Numpy Array 对象中的数据导入到新 Tensor 中。
tf.convert_to_tensor([1,2.])
tf.convert_to_tensor(np.array([[1,2.],[3,4]]))
array([[1., 2.],[3., 4.]])>
4.2 创建全0或全1张量
创建全 0 的矩阵
tf.zeros([2,2])
array([[0., 0.],[0., 0.]], dtype=float32)>
创建全 1 的矩阵
tf.ones([3,2])
array([[1., 1.],[1., 1.],[1., 1.]], dtype=float32)>
通过 tf.zeros_like, tf.ones_like
可以方便地新建与某个张量 shape 一致, 且内容为全 0 或全 1 的张量。
a = tf.ones([2,3])
tf.zeros_like(a)
array([[0., 0., 0.],[0., 0., 0.]], dtype=float32)>
创建与张量A形状一样的全 1 张量
a = tf.zeros([3,2])
tf.ones_like(a)
array([[1., 1.],[1., 1.],[1., 1.]], dtype=float32)>
4.3 创建自定义数值张量
通过 tf.fill(shape, value)
可以创建全为自定义数值 value 的张量,形状由 shape 参数指定。
tf.fill([2,2], 99)
array([[99, 99],[99, 99]])>
4.4 创建已知分布的张量
通过 tf.random.normal(shape, mean=0.0, stddev=1.0)
可以创建形状为 shape,均值为mean,标准差为 stddev 的正态分布 N(mean,stddev2)\mathcal{N}(mean, stddev^2)N(mean,stddev2)。
tf.random.normal([2,2])
array([[0.4479265 , 1.2336508 ],[0.96864706, 2.076528 ]], dtype=float32)>
通过 tf.random.uniform(shape, minval=0, maxval=None, dtype=tf.float32)
可以创建采样自[minval, maxval)区间的均匀分布的张量
tf.random.uniform([3,2])
array([[0.5197921 , 0.80691314],[0.38051474, 0.05250001],[0.18329549, 0.8741617 ]], dtype=float32)>
tf.random.uniform([2,2],maxval=10)
array([[0.4374528 , 7.3671246 ],[2.1262336 , 0.12584329]], dtype=float32)>
如果需要均匀采样整形类型的数据,必须指定采样区间的最大值 maxval 参数,同时指定数据类型为 tf.int*型
tf.random.uniform([2,2],maxval=100,dtype=tf.int32)
array([[15, 50],[38, 84]])>
4.4 创建序列
tf.range(limit, delta=1)
可以创建[0, limit)之间,步长为 delta 的整型序列,不包含 limit 本身。
tf.range(10)
tf.range(10,delta=2)
tf.range(1,10,delta=2)