热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

Numpy对数组的操作:创建、变形(升降维等)、计算、取值、复制、分割、合并

1.简介NumPy(NumericalPython)是Python语言的一个扩展程序库,支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。最主要的数据结构是ndarray数组。NumPy通常与SciPy(Scientific

1. 简介

NumPy(Numerical Python) 是 Python 语言的一个扩展程序库,支持大量的维度数组与矩阵运算,此外也针对数组运算提供大量的数学函数库。最主要的数据结构是ndarray数组。

NumPy 通常与 SciPy(Scientific Python)和 Matplotlib(绘图库)一起使用, 这种组合广泛用于替代 MatLab。
SciPy 是一个开源的 Python 算法库和数学工具包。SciPy 包含的模块有最优化、线性代数、积分、插值、特殊函数、快速傅里叶变换、信号处理和图像处理、常微分方程求解和其他科学与工程中常用的计算。
Matplotlib 是 Python 编程语言及其数值数学扩展包 NumPy 的可视化操作界面。

2. 创建

创建一维数组
(1)直接创建:np.array([1, 2, 3, 4, 5, 6])
(2)从python的list中建立:np.array(list([1, 2, 3, 4, 5, 6]))

创建常量值的一维数据
(1)创建以0为常量值:np.zeros(n,dytpe=float/int)
(2)创建以1为常量值:np.ones(n)
(3)创建一个空数组:np.empty(4)

创建一个元素递增的数组
(1)从0开始增长的递增数组:np.arange(8)
(2)给定区间,自定义步长:np.arange(0,1,0.2)
(3)给定区间,自定义个数:np.linspace(-1,1,50)

创建多维数组:创建单维数组,再添加进多维数组

# 数组的结构一定是np.array([]) 无论数组中间存放的是多少“层”数据
# 二维数组相当于存放的是“两层”数组而已
arr1=np.array(list([1, 2, 3, 4, 5]))
arr2=np.array([arr1,[1,0,0,1,0]])  # 2*5的两维数组
arr3=np.array(list([[0,0,1,1,1],[1,1,1,0,0],[2,3,4,5,6]])) # 3*5的两维数组

arrx=np.array([arr1,list([1, 2, 3, 4, 5],[1,1,1,0,0])]) # 报错
arry=np.array([list([[ 1,2,3, 7, 11],[2,3,4,5,6]]),[1, 2, 3, 4, 5]]) # 报错

创建常量值的(n*m)维数据
(1)创建以0为常量值:np.zeros((n*m),dytpe=float/int)
(2)创建以1为常量值:np.ones((n*m))
(3)创建一个空数组:np.empty((n*m))

创建随机数字的数组

生成随机数种子:

(1)np.random.seed()
(2)np.random.RandomState()

生成随机数:

函数 取值 说明
1 np.random.rand(d0,d1,…,dn) [0,1) 根据给定维度生成数组,服从均匀分布
2 np.random.randint(low, high=None, size=None, dtype='l') [0,low)或者[low,high) 根据size生成离散均匀分布的整数值
3 np.random.randn(d0,d1,…,dn) 根据给定维度生成数组,服从标准正态分布
4 np.random.random_sample(size=None) [0,1) 根据给定维度生成随机浮点数
5 np.random.random(size=None) [0,1) 根据给定维度生成随机浮点数
6 np.random.ranf(size=None) [0,1) 根据给定维度生成随机浮点数
7 np.random.sample(size=None) [0,1) 根据给定维度生成随机浮点数

生成有分布规律的随机数组
(1)二项分布:np.random.binomial(n, p, size)
(2)正态分布:np.random.normal(loc, scale, size)

将csv文件转化成数组或阵列

使用 np.genfromtxt( ‘csv文件名',delimiter = ‘文件中的分割符' )函数将文件转化成数组

 csv_array = np.genfromtxt('sample.csv', delimiter=',')
 print(csv_array)

3. 数组的变形

生成数组/矩阵转置的函数,即行列数字交换,使用.T

a = np.array([[32, 15, 6, 9, 14], 
    [12, 10, 5, 23, 1],
    [2, 16, 13, 40, 37]])
print(a.T)

-------------------
# 结果如下
[[32 12 2]
 [15 10 16]
 [ 6 5 13]
 [ 9 23 40]
 [14 1 37]]

改变数组的形状:

(1)arr.resize(n,m) :arr.resize(n,m)函数是原地修改数组,要求:元素的个数必须一致

a=np.arange(8)
a.resize(2,4)
print(a)

---------------------------
[[0 1 2 3]
 [4 5 6 7]]

(2)arr.reshape(n,m):如果某一个维度的参数为-1,则表示元素总个数会迁就另一个维度来计算

a=np.arange(8).reshape(-1,1)
print(a)

-----------------
[[0]
 [1]
 [2]
 [3]
 [4]
 [5]
 [6]
 [7]]

将一维升至二维:np.newaxis

np.newaxis实际上是直接增加维度的意思,我们一般不会给数组增加太多维度,这里以一维增加到二维为例:

(1)增加行维度:arr[np.newaxis, :]
(2)增加列维度:arr[: , np.newaxis]

a=np.arange(8)

a  # array([0, 1, 2, 3, 4, 5, 6, 7])
a.shape  # (8,)
a[np.newaxis, :] # array([[0, 1, 2, 3, 4, 5, 6, 7]])
a.shape  # (8,)
a[: , np.newaxis] # array([[0],[1],[2],[3],[4],[5],[6],[7]])
a.shape  # (8,)

降维:arr.ravel()

arr.ravel()函数在降维时:默认是行序优先生成新数组(就是一行行读);如果传入参数“F”则是列序降维生成新数组

a=np.array([[1,2],[3,4]])
a.ravel() 
a.ravel('F') 

----------------------------
# 结果 array([1, 2, 3, 4])
# 结果 array([1, 3, 2, 4])

4. 计算

对数组进行计算操作

(1)对元素进行加减计算

a=np.arange(8).reshape(2,4) # array([[0, 1, 2, 3], [4, 5, 6, 7]])
b=np.random.randint(8,size=(2,4)) # array([[1, 2, 5, 3], [4, 1, 0, 6]])
a+b
a-b

----------------------------
# a+b和a-b结果分别是:
array([[ 1, 3, 7, 6],
  [ 8, 6, 6, 13]])
array([[-1, -1, -3, 0],
  [ 0, 4, 6, 1]])

(2)乘法:平方/矩阵中元素相乘

a=np.arange(8).reshape(2,4) # array([[0, 1, 2, 3], [4, 5, 6, 7]])
b=np.random.randint(8,size=(2,4)) # array([[1, 2, 5, 3], [4, 1, 0, 6]])
a**2
a*b

-----------------------
# a矩阵平方/a*b矩阵中元素相乘结果分别:
array([[ 0, 1, 4, 9],
  [16, 25, 36, 49]])
array([[ 0, 2, 10, 9],
  [16, 5, 0, 42]]) 

(3)矩阵*矩阵:

# 要求a矩阵的行要等于b矩阵的列数;且a矩阵的列等于b矩阵的行数
a=np.arange(8).reshape(2,4) # array([[0, 1, 2, 3], [4, 5, 6, 7]])
b=np.random.randint(8,size=(4,2)) # array([[3, 0],[3, 3],[5, 6],[6, 7]])
c1 = np.dot(a,b)
c2 = a.dot(b)

----------------------
# ab矩阵相乘的结果:c1=c2 
array([[ 31, 36],
  [ 99, 100]])

(4)逻辑计算

【注】列表是无法作为一个整体对其中的各个元素进行逻辑判断的!

# 结果返回:一个数组,其中每个元素根据逻辑判断的布尔类型的结果
a > 3 
-----------------------------
# 结果如下:
array([[False, False, False, False],
  [ True, True, True, True]])

5. 取值

获取一维数组中的某个元素:操作和list列表的index一样

a = np.array([5, 2, 7, 0, 11])

a[0] # 结果为 5
a[:4] # 结果为 从头开始到索引为4结束
a[2:] # 结果为 从索引为2的开始到结尾
a[::2] # 结果为 从头开始到结尾,每2个取一个值

获取多维数组的某个元素,某行或列值

a = np.array([[32, 15, 6, 9, 14], 
    [12, 10, 5, 23, 1],
    [2, 16, 13, 40, 37]])

a[2,1]  # 结果是一个元素 16
a[2][1]  # 结果是一个元素 16
a[1]  # 第2行 array([12, 10, 5, 23, 1])
a[:,2]  # 取出全部行,第2列 [15,10,16]
a[1:3, :] # 取出[1,3)行,全部列
a[1,1:]  # array([10, 5, 23, 1])

获取满足逻辑运算的

# 需要注意的是,我们数据进行逻辑计算操作得到的仍然是一个数组
# 如果我们想要的是一个过滤后的数组,就需要将"逻辑判断"传入数组中
a = np.array([[32, 15, 6, 9, 14], 
    [12, 10, 5, 23, 1],
    [2, 16, 13, 40, 37]])

a[a > 3]
a[(a > 3) | (a <2)] 

------------------------------
# 结果分别是:
array([32, 15, 6, 9, 14, 12, 10, 5, 23, 16, 13, 40, 37])
array([32, 15, 6, 9, 14, 12, 10, 5, 23, 1, 16, 13, 40, 37])

遍历:结果是按行输出

a = np.array([[32, 15, 6, 9, 14], 
    [12, 10, 5, 23, 1],
    [2, 16, 13, 40, 37]])
for x in a:
 print(x)

--------------------
[32 15 6 9 14]
[12 10 5 23 1]
[ 2 16 13 40 37]

6. 复制/分割/合并

复制:arr.cope()

分割:

(1)等分:np.split(arr, n, axis=0/1)(即行数或列数可以整除n时才可以)
(2)不等分:np.array_split(arr, n) 默认按行分n份

a = np.array([[32, 15, 6, 9, 14, 21], 
    [12, 10, 5, 23, 1, 10],
    [2, 16, 13, 40, 37, 8]])
    
# 可以看到a矩阵是(3*6),所以使用np.split()只能尝试行分成3份;或者列分成2/3/6份 
np.split(a,3,axis=0) 
np.split(a,3,axis=1)

np.array_split(a,2)
np.array_split(a,4,axis=1)

-------------------------------------------
[array([[32, 15, 6, 9, 14, 21]]),
 array([[12, 10, 5, 23, 1, 10]]),
 array([[ 2, 16, 13, 40, 37, 8]])]
 
[array([[32, 15],
  [12, 10],
  [ 2, 16]]), array([[ 6, 9],
  [ 5, 23],
  [13, 40]]), array([[14, 21],
  [ 1, 10],
  [37, 8]])]
  
[array([[32, 15, 6, 9, 14, 21],
  [12, 10, 5, 23, 1, 10]]), array([[ 2, 16, 13, 40, 37, 8]])]
  
[array([[32, 15],
  [12, 10],
  [ 2, 16]]), array([[ 6, 9],
  [ 5, 23],
  [13, 40]]), array([[14],
  [ 1],
  [37]]), array([[21],
  [10],
  [ 8]])] 

合并:np.concatenate((arr1,arr2,arr3), axis=0/1) 默认接在数据下面

a=np.random.rand(2,3)
b=np.random.randint(1,size=(2,3))

np.concatenate((a,b,a))  # 接在下面
np.concatenate((a,b,a),axis=1) # 接在后面

------------------------
array([[0.95912866, 0.81396527, 0.809493 ],
  [0.4539276 , 0.24173315, 0.63931439],
  [0.  , 0.  , 0.  ],
  [0.  , 0.  , 0.  ],
  [0.95912866, 0.81396527, 0.809493 ],
  [0.4539276 , 0.24173315, 0.63931439]])

&#8203;array([[0.95912866, 0.81396527, 0.809493 , 0.  , 0.  ,
  0.  , 0.95912866, 0.81396527, 0.809493 ],
  [0.4539276 , 0.24173315, 0.63931439, 0.  , 0.  ,
  0.  , 0.4539276 , 0.24173315, 0.63931439]])

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持。


推荐阅读
  • 假设我有两个数组A和B,其中A和B都是mxn.我现在的目标是,对于A和B的每一行,找到我应该在B的相应行中插入A的第i行元素的位置.也就是说,我希望将np.digitize或np. ... [详细]
  • 计算机存储系统的层次结构及其优势
    本文介绍了计算机存储系统的层次结构,包括高速缓存、主存储器和辅助存储器三个层次。通过分层存储数据可以提高程序的执行效率。计算机存储系统的层次结构将各种不同存储容量、存取速度和价格的存储器有机组合成整体,形成可寻址存储空间比主存储器空间大得多的存储整体。由于辅助存储器容量大、价格低,使得整体存储系统的平均价格降低。同时,高速缓存的存取速度可以和CPU的工作速度相匹配,进一步提高程序执行效率。 ... [详细]
  • Python使用Pillow包生成验证码图片的方法
    本文介绍了使用Python中的Pillow包生成验证码图片的方法。通过随机生成数字和符号,并添加干扰象素,生成一幅验证码图片。需要配置好Python环境,并安装Pillow库。代码实现包括导入Pillow包和随机模块,定义随机生成字母、数字和字体颜色的函数。 ... [详细]
  • 超级简单加解密工具的方案和功能
    本文介绍了一个超级简单的加解密工具的方案和功能。该工具可以读取文件头,并根据特定长度进行加密,加密后将加密部分写入源文件。同时,该工具也支持解密操作。加密和解密过程是可逆的。本文还提到了一些相关的功能和使用方法,并给出了Python代码示例。 ... [详细]
  • 本文介绍了一个Python函数same_set,用于判断两个相等长度的数组是否包含相同的元素。函数会忽略元素的顺序和重复次数,如果两个数组包含相同的元素,则返回1,否则返回0。文章还提供了函数的具体实现代码和样例输入输出。 ... [详细]
  • 颜色迁移(reinhard VS welsh)
    不要谈什么天分,运气,你需要的是一个截稿日,以及一个不交稿就能打爆你狗头的人,然后你就会被自己的才华吓到。------ ... [详细]
  • 一、死锁现象与递归锁进程也是有死锁的所谓死锁:是指两个或两个以上的进程或线程在执行过程中,因争夺资源而造成的一种互相等待的现象,若无外力作 ... [详细]
  • 标准正态分布的概率密度公式正态分布概率密度公式多元正态分布的概率密度公式上式为x服从k元正态分布,x为k维向量;|Σ|代表协方差矩阵的行列式。二维正态分布概率密度函数为钟形曲面,等 ... [详细]
  • 深刻理解 python中函数的参数 引用的传递方式
    函数的参数作为引用Python唯一支持的参数传递模式是共享传参(callbysharing)。共享传参指函数的各个形参获得实参中各个引用的副本。也就是 ... [详细]
  • pandas的自带数据集_Pandas到底是个怎样的包?
    sh说明:本pandas非卧龙的pandas,而是Python众多科学计算包中的pandas。本次Pandas的简洁介绍,针对的是此包的新手࿰ ... [详细]
  • 本文介绍了C#中生成随机数的三种方法,并分析了其中存在的问题。首先介绍了使用Random类生成随机数的默认方法,但在高并发情况下可能会出现重复的情况。接着通过循环生成了一系列随机数,进一步突显了这个问题。文章指出,随机数生成在任何编程语言中都是必备的功能,但Random类生成的随机数并不可靠。最后,提出了需要寻找其他可靠的随机数生成方法的建议。 ... [详细]
  • 十大经典排序算法动图演示+Python实现
    本文介绍了十大经典排序算法的原理、演示和Python实现。排序算法分为内部排序和外部排序,常见的内部排序算法有插入排序、希尔排序、选择排序、冒泡排序、归并排序、快速排序、堆排序、基数排序等。文章还解释了时间复杂度和稳定性的概念,并提供了相关的名词解释。 ... [详细]
  • STL迭代器的种类及其功能介绍
    本文介绍了标准模板库(STL)定义的五种迭代器的种类和功能。通过图表展示了这几种迭代器之间的关系,并详细描述了各个迭代器的功能和使用方法。其中,输入迭代器用于从容器中读取元素,输出迭代器用于向容器中写入元素,正向迭代器是输入迭代器和输出迭代器的组合。本文的目的是帮助读者更好地理解STL迭代器的使用方法和特点。 ... [详细]
  • Python教学练习二Python1-12练习二一、判断季节用户输入月份,判断这个月是哪个季节?3,4,5月----春 ... [详细]
  • 申明下哈本篇文章不是自己写的根据网上的文章再加上自己的加加点点反正大部分都是网站的智慧哈!!!1、线程基本概念1.1线程是什么࿱ ... [详细]
author-avatar
帆侮听我悄悄说星星
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有