pandas获取excel行数,python统计excel数据总行数

作者：别说没用的妇 | 来源：互联网 | 2023-06-06 20:01

pandas获取excel行数,python统计excel数据总行数事件今天，我们需

　　事件

　　今天，我们需要合并天猫的订单数据。因为之前的6.18活动有很多数据要处理，所以我们把几个月合并在一起，结果报错了。

　　问题分析

　　Excel文件的格式已经更改过一次。在Excel 2007之前，扩展名为。使用xls格式。这种文件格式是一种特定的二进制格式，最多可支持65，536行和256列。从2007版Excel开始，新的文件格式。默认采用基于XML的xlsx，支持的表数达到1048576，列数达到16384。应该注意的是，当文件在。xlsx格式转换为中的文件。xls格式，65536行和256列之后的数据将被丢弃。

　　熊猫读取Excel文件的引擎是xlrd。虽然xlrd两者都支持。xlsx和。xls文件格式，在源文件xlrd/sheet.py中限制读取的Excel文件的行数和列数必须分别小于65536和256。

　　如果self.biff_version=80:

　　self.utter_max_rows=65536

　　否则：

　　self.utter_max_rows=16384

　　self.utter_max_cols=256

　　因此，即使它是。xlsx格式，xlrd仍然不支持读取超过65536行的Excel文件(源代码中也有16384行的限制，这是因为在Excel 95时代，xls文件支持的最大行数是16384行)。

　　解决办法

　　Openpyxl是一个Python库，专门用于在。xlsx格式。与xlrd相比，它对最大行数和列数的支持与。xlsx文件。

　　首先安装openpyxl:

　　pip安装openpyxl

　　熊猫的read_Excel方法中，有一个引擎字段，可以指定用来处理Excel文件的引擎，填写openpyxl，然后读取文件。

　　导入操作系统

　　进口熊猫作为pd

　　#读出文件并将其放入列表中

　　Pwd=1 #获取文件目录

　　#创建一个新列表来存储文件名。

　　file_list=[]

　　#创建一个新的列表来存储每个文件的数据(依次读取几个结构相同的Excel文件，创建一个DataFrame)

　　dfs=[]

　　对于os.walk (PWD)中的root、dirs、files:#第一个是起始路径，第二个是起始路径下的文件夹，第三个是起始路径下的文件。

　　对于文件中的文件：

　　file_path=os.path.join(根，文件)

　　File_list.append(file_path) #使用os.path.join(dirpath，name)获取完整路径

　　Df=pd.read_excel(file_path) #导入xlsx文件并将excel转换为DataFrame

　　附加(df)

　　#将多个数据帧合并成一个

　　df=pd.concat(dfs)

　　#数据输出，写入excel文件，无索引数据

　　#要将数据写入Excel，需要先安装一个引擎，负责将数据写入Excel。pandas使用openpyx或xlsxwriter作为编写引擎。

　　Df.to _ Excel (test \ \ 1.xlsx ，index=False，engine= openpyxl) #导出Excel，一般不带index，并将index参数设置为False。

　　补充知识：python使用xlrd读取excel数据作为请求的请求参数，并将返回的数据写入excel。

　　实施功能：

　　excel中第一列的数据作为post请求的数据，数据为json格式；将post返回的结果写入excel中的第二列数据，并将返回的数据与excel中的预期结果进行比较。如果与预期结果一致，则在案例执行结果中写入成功，否则失败。

　　每一行的数据都不一样，可以循环调用。

　　# !/usr/lively酸奶/env python

　　# -*-编码：utf-8 -*-

　　#import xlwt #不使用这个专门写excel的库。

　　导入xlrd

　　从xlutils.copy导入副本

　　导入请求

　　导入json

　　old _ excel=xlrd . open _ workbook( excel . xls )

　　sheet=old_excel.sheets()[0]

　　URL= http://10 . 1 . 1 . 32:1380/service/allocf k2

　　headers={ Content-Type : application/JSON }

　　i=0

　　new_excel=copy(old_excel)

　　对于sheet.get_rows()中的行：

　　数据=行[0]。价值

　　respOnse=requests.post(url=url，headers=headers，data=data)

　　文本=响应.文本

　　#使用json.loads将Unicode类型，即json类型转换为dict类型。

　　text=JSON . loads(text)[ return msg ]#阻塞这行代码，将返回的完整数据写入文件。

　　ws=new_excel.get_sheet(0)

　　ws.write(i，1，text)

　　new_excel.save(excel.xls )

　　old _ excel=xlrd . open _ workbook( excel . xls )

　　new_excel=copy(old_excel)

　　i=i 1

　　执行前的Excel格式：

　　发送消息

　　返回消息

　　校验字符

　　案例执行结果

　　{ projectId :0070 ， projectAllocBatch :1 ， serviceCode :GT012 ， seqNo :180800272201GT51286712 ， tranTimeStamp :20180817102244 ， sign : 2 dbb 89 a6 BD 86 B2 af 1 ff 6a 76 c 35 c 05284 }

　　交易失败

　　{ projectId :0070 ， projectAllocBatch :1 ， serviceCode :GT012 ， seqNo :180800272201GT51286713 ， tranTimeStamp :20180817102244 ， sign : 2 dbb 89 a6 BD 86 B2 af 1 ff 6a 76 c 35 c 05284 }

　　交易失败

　　{ projectId :0070 ， projectAllocBatch :1 ， serviceCode :GT012 ， seqNo :180800272201GT51286713 ， tranTimeStamp :20180817102244 ， sign : 2 dbb 89 a6 BD 86 B2 af 1 ff 6a 76 c 35 c 05284 }

　　交易成功

　　执行后的结果：

　　调试期间遇到的问题：

　　1.在开始的时候，这两行代码并没有加在for循环的末尾。

　　old _ excel=xlrd . open _ workbook( excel . xls )

　　new_excel=copy(old_excel)

　　这样new_excel就永远是最开始获取的那个，只有最后一次循环返回的结果才会写入文件。因为之前的都被当初获取的old_excel覆盖了，所以每次写操作之后你都要再做一次复制操作，这样才能保证new_excel是最新的。

　　2.执行程序前注意关闭excel，否则会报错。

　　以上关于使用熊猫阅读65536行以上Excel文件问题的解决方案，就是边肖分享的全部内容。希望能给大家一个参考，多多支持我们。

　　标题：用熊猫解决65536行以上Excel文件的读取问题

推荐阅读

import
YOLOv7基于自己的数据集从零构建模型完整训练、推理计算超详细教程

本文介绍了关于人工智能、神经网络和深度学习的知识点，并提供了YOLOv7基于自己的数据集从零构建模型完整训练、推理计算的详细教程。文章还提到了郑州最低生活保障的话题。对于从事目标检测任务的人来说，YOLO是一个熟悉的模型。文章还提到了yolov4和yolov6的相关内容，以及选择模型的优化思路。 ... [详细]

蜡笔小新 2023-12-14 18:28:01
import
开源Keras Faster RCNN模型介绍及代码结构解析

本文介绍了开源Keras Faster RCNN模型的环境需求和代码结构，包括FasterRCNN源码解析、RPN与classifier定义、data_generators.py文件的功能以及损失计算。同时提供了该模型的开源地址和安装所需的库。 ... [详细]

蜡笔小新 2023-12-10 17:44:07
python
安装mysqlclient失败解决办法

本文介绍了在MAC系统中，使用django使用mysql数据库报错的解决办法。通过源码安装mysqlclient或将mysql_config添加到系统环境变量中，可以解决安装mysqlclient失败的问题。同时，还介绍了查看mysql安装路径和使配置文件生效的方法。 ... [详细]

蜡笔小新 2023-12-14 18:24:10
import
OC学习笔记之@property和@synthesize

本文介绍了OC学习笔记中的@property和@synthesize，包括属性的定义和合成的使用方法。通过示例代码详细讲解了@property和@synthesize的作用和用法。 ... [详细]

蜡笔小新 2023-12-14 12:05:06
python
的错误消息：

ZSI.generate.Wsdl2PythonError: unsupported local simpleType restriction ... [详细]

蜡笔小新 2023-12-13 20:28:08
import
scrapy存入excel时，excel文件被反复擦除重写。文件大小始终不超过100k，请问这种情况改如何解决

怀疑是每次都在新建文件，具体代码如下 ... [详细]

蜡笔小新 2023-12-13 17:53:49
import
sklearn数据集库中的常用数据集类型介绍

本文介绍了sklearn数据集库中常用的数据集类型，包括玩具数据集和样本生成器。其中详细介绍了波士顿房价数据集，包含了波士顿506处房屋的13种不同特征以及房屋价格，适用于回归任务。 ... [详细]

蜡笔小新 2023-12-13 17:45:15
utf-8
Android系统移植与调试之如何修改Android设备状态条上音量加减键在横竖屏切换的时候的显示于隐藏

本文介绍了如何修改Android设备状态条上音量加减键在横竖屏切换时的显示与隐藏。通过修改系统文件system_bar.xml实现了该功能，并分享了解决思路和经验。 ... [详细]

蜡笔小新 2023-12-13 13:12:05
utf-8
Android 7自学笔记总结、移动架构视频、安卓面试真题、项目实战源码讲义

本文介绍了Android 7的学习笔记总结，包括最新的移动架构视频、大厂安卓面试真题和项目实战源码讲义。同时还分享了开源的完整内容，并提醒读者在使用FileProvider适配时要注意不同模块的AndroidManfiest.xml中配置的xml文件名必须不同，否则会出现问题。 ... [详细]

蜡笔小新 2023-12-13 10:06:58
foreach
MyBatis多表查询与动态SQL使用

本文介绍了MyBatis多表查询与动态SQL的使用方法，包括一对一查询和一对多查询。同时还介绍了动态SQL的使用，包括if标签、trim标签、where标签、set标签和foreach标签的用法。文章还提供了相关的配置信息和示例代码。 ... [详细]

蜡笔小新 2023-12-12 17:12:51
import
r2dbc配置多数据源

R2dbc配置多数据源问题根据官网配置r2dbc连接mysql多数据源所遇到的问题pom配置可以参考官网,不过我这样配置会报错我并没有这样配置将以下内容添加到pom.xml文件d ... [详细]

蜡笔小新 2023-12-12 16:38:53
python
CentOS安装Python2.7.2的步骤和注意事项

本文介绍了在CentOS上安装Python2.7.2的详细步骤，包括下载、解压、编译和安装等操作。同时提供了一些注意事项，以及测试安装是否成功的方法。 ... [详细]

蜡笔小新 2023-12-12 13:54:31
import
网络请求模块选择——axios框架的基本使用和封装

本文介绍了选择网络请求模块axios的原因，以及axios框架的基本使用和封装方法。包括发送并发请求的演示，全局配置的设置，创建axios实例的方法，拦截器的使用，以及如何封装和请求响应劫持等内容。 ... [详细]

蜡笔小新 2023-12-12 10:16:43
string
EPPlus绘制刻度线的方法及示例代码

本文介绍了使用EPPlus绘制刻度线的方法，并提供了示例代码。通过ExcelPackage类和List对象，可以实现在Excel中绘制刻度线的功能。具体的方法和示例代码在文章中进行了详细的介绍和演示。 ... [详细]

蜡笔小新 2023-12-10 19:32:38
import
java drools5_Java Drools5.1 规则流基础【示例】（中）

五、规则文件及规则流EduInfoRule.drl:packagemyrules;importsample.Employ;ruleBachelorruleflow-group ... [详细]

蜡笔小新 2023-12-10 15:01:31

别说没用的妇

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章