热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

python爬虫——文件压缩

python爬虫——文件压缩importosimportreimportzipfile#压缩文件压缩文件夹内的各个文件操作,传参需要压缩的文件夹位置pat

python爬虫——文件压缩

import os
import re
import zipfile
#压缩文件'''
压缩文件夹内的各个文件操作,
传参需要压缩的文件夹位置path01
压缩文件的保存位置path02
文件压缩的实质时创建一个zip文件然后把选压缩的内容写入zip文件
'''

def zip(path01,path02):path1 = path01 + '\\'# 读取文件夹内的所有文件files = os.listdir(path1)for file in files:print(file+'开始压缩')# 提取文件名称。按照需求,如果不是.mp4需要更改,或者干脆直接用文件名name = re.findall(r'(.*?).mp4',file)[0]# 创建压缩文件,并设置保存名称zipf = zipfile.ZipFile(path02+file+'.zip', 'w')# 找到需要压缩的文件,第一个参数时文件位置,第二个参数时只压缩的内容zipf.write(path1+file,file)print(file + '压缩结束')
'''压缩文件夹'''
def zip_file(path01,path02):path1 = path01 + '\\'# 读取文件夹内的所有文件夹files = os.listdir(path1)for file in files:print(file + '开始压缩')# 创建压缩文件并设置压缩文件的保存名称zipf = zipfile.ZipFile(path02 + file + '.zip', 'w')# 读取目录中的文件for file1 in os.listdir(path1+file):# os.path.join()路径拼接,此处可以直接自己拼接zipf.write(os.path.join(path1 + file, file1), file1)print(file + '压缩结束')'''
zipfile库不支持压缩文件时加密,
采用7z压缩软件实现压缩和加密(需要先下载7z软件)
path01:需要压缩文件的目录
path02:压缩文件的输出目录
'''

def zip_pwd(path01):# 设置7z应用程序的路径z_file = 'D:\\安装\\7-Zip\\7z.exe'# 设置密码pwd = '125475'path1 = path01 + '\\'# 读取文件夹内的所有文件files = os.listdir(path1)# 对单个文件进行加密for file in files:print(file + '开始压缩')# 提取文件名称。按照需求,如果不是.mp4需要更改,或者干脆直接用文件名name = re.findall(r'(.*?).txt', file)[0]# 拼接cmd命令cmd = z_file+' a '+ name +'.zip -p"125475" -y '+ path1+file# # 执行cmd命令# a=os.system('cd D:\\test1\\')os.popen(cmd)print(file + '压缩完成')'''解压文件'''
def change_zip(path01,path02):path1 = path01 + '\\'# 读取文件夹内的所有文件files = os.listdir(path1)for file in files:# 加载需要解压的压缩文件zfile = zipfile.ZipFile(path1+file) # 要解压缩的压缩包# 解压操作,解压到path02zfile.extractall(path02)# 有密码# zfile.extractall(path02,'Pwd'

推荐阅读
  • 第四章高阶函数(参数传递、高阶函数、lambda表达式)(python进阶)的讲解和应用
    本文主要讲解了第四章高阶函数(参数传递、高阶函数、lambda表达式)的相关知识,包括函数参数传递机制和赋值机制、引用传递的概念和应用、默认参数的定义和使用等内容。同时介绍了高阶函数和lambda表达式的概念,并给出了一些实例代码进行演示。对于想要进一步提升python编程能力的读者来说,本文将是一个不错的学习资料。 ... [详细]
  • 本文介绍了在Python3中如何使用选择文件对话框的格式打开和保存图片的方法。通过使用tkinter库中的filedialog模块的asksaveasfilename和askopenfilename函数,可以方便地选择要打开或保存的图片文件,并进行相关操作。具体的代码示例和操作步骤也被提供。 ... [详细]
  • Redis底层数据结构之压缩列表的介绍及实现原理
    本文介绍了Redis底层数据结构之压缩列表的概念、实现原理以及使用场景。压缩列表是Redis为了节约内存而开发的一种顺序数据结构,由特殊编码的连续内存块组成。文章详细解释了压缩列表的构成和各个属性的含义,以及如何通过指针来计算表尾节点的地址。压缩列表适用于列表键和哈希键中只包含少量小整数值和短字符串的情况。通过使用压缩列表,可以有效减少内存占用,提升Redis的性能。 ... [详细]
  • 本文介绍了在Python中使用zlib模块进行字符串的压缩与解压缩的方法,并探讨了其在内存优化方面的应用。通过压缩存储URL等长字符串,可以大大降低内存消耗,虽然处理时间会增加,但是整体效果显著。同时,给出了参考链接,供进一步学习和应用。 ... [详细]
  • Java容器中的compareto方法排序原理解析
    本文从源码解析Java容器中的compareto方法的排序原理,讲解了在使用数组存储数据时的限制以及存储效率的问题。同时提到了Redis的五大数据结构和list、set等知识点,回忆了作者大学时代的Java学习经历。文章以作者做的思维导图作为目录,展示了整个讲解过程。 ... [详细]
  • 本文讨论了一个关于cuowu类的问题,作者在使用cuowu类时遇到了错误提示和使用AdjustmentListener的问题。文章提供了16个解决方案,并给出了两个可能导致错误的原因。 ... [详细]
  • 无损压缩算法专题——LZSS算法实现
    本文介绍了基于无损压缩算法专题的LZSS算法实现。通过Python和C两种语言的代码实现了对任意文件的压缩和解压功能。详细介绍了LZSS算法的原理和实现过程,以及代码中的注释。 ... [详细]
  • XML介绍与使用的概述及标签规则
    本文介绍了XML的基本概念和用途,包括XML的可扩展性和标签的自定义特性。同时还详细解释了XML标签的规则,包括标签的尖括号和合法标识符的组成,标签必须成对出现的原则以及特殊标签的使用方法。通过本文的阅读,读者可以对XML的基本知识有一个全面的了解。 ... [详细]
  • 本文介绍了计算机网络的定义和通信流程,包括客户端编译文件、二进制转换、三层路由设备等。同时,还介绍了计算机网络中常用的关键词,如MAC地址和IP地址。 ... [详细]
  • importjava.util.ArrayList;publicclassPageIndex{privateintpageSize;每页要显示的行privateintpageNum ... [详细]
  • 关键词:Golang, Cookie, 跟踪位置, net/http/cookiejar, package main, golang.org/x/net/publicsuffix, io/ioutil, log, net/http, net/http/cookiejar ... [详细]
  • 个人学习使用:谨慎参考1Client类importcom.thoughtworks.gauge.Step;importcom.thoughtworks.gauge.T ... [详细]
  • 本文讨论了Kotlin中扩展函数的一些惯用用法以及其合理性。作者认为在某些情况下,定义扩展函数没有意义,但官方的编码约定支持这种方式。文章还介绍了在类之外定义扩展函数的具体用法,并讨论了避免使用扩展函数的边缘情况。作者提出了对于扩展函数的合理性的质疑,并给出了自己的反驳。最后,文章强调了在编写Kotlin代码时可以自由地使用扩展函数的重要性。 ... [详细]
  • 如何查询zone下的表的信息
    本文介绍了如何通过TcaplusDB知识库查询zone下的表的信息。包括请求地址、GET请求参数说明、返回参数说明等内容。通过curl方法发起请求,并提供了请求示例。 ... [详细]
  • Java程序设计第4周学习总结及注释应用的开发笔记
    本文由编程笔记#小编为大家整理,主要介绍了201521123087《Java程序设计》第4周学习总结相关的知识,包括注释的应用和使用类的注释与方法的注释进行注释的方法,并在Eclipse中查看。摘要内容大约为150字,提供了一定的参考价值。 ... [详细]
author-avatar
Jason
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有