一、说明
压缩和解压缩是日常常用的操作,不管是windows上图形界面的操作,还是linux上用命令来进行压缩解压缩,总的而言都还是比较方便的。
但用代码来实现就没做过,近期也得实现代码压缩与解压缩操作,所以就抽时间来研究一下。
二、zip文件压缩和解压缩实现
import os import zipfile # 函数功能是zip_file_list所有文件,和zip_dir_list所有目录下的所有文件,被压缩到一个zip_file_name的压缩文件中 def my_zip_function(zip_file_name, zip_file_list=[], zip_dir_list=[]): # 压缩文件最后需要close,为了方便我们直接用with with zipfile.ZipFile(zip_file_name, \"w\") as zip_obj: # 压缩文件 for tmp_file in zip_file_list: zip_obj.write(tmp_file) # 压缩目录 for tmp_dir in zip_dir_list: # zipfile没有直接压缩目录的功能,要压缩目录只能遍历目录一个一个文件压。 for root, dirs, files in os.walk(tmp_dir): # 如果想要目录为空时仍将该目录压缩进去,该目录也要压缩一遍;反之请将以下行注释掉 zip_obj.write(root) for tmp_file in files: # 拼接文件完整目录,不然只用文件名代码找不到文件 tmp_file_path = os.path.join(root, tmp_file) zip_obj.write(tmp_file_path) # 函数功能是遍历压缩文件中的所有文件 def my_traversal_zip_function(zip_file_name): with zipfile.ZipFile(zip_file_name, \"r\") as zip_obj: # 返回结果是一个ZipInfo列表 # 如果在压缩时显示压缩目录,则目录也作为一个单独的ZipInfo呈现在列表中;反之则没有目录的ZipInfo all_file_list = zip_obj.infolist() for tmp_file in all_file_list: print(tmp_file.filename) # 还可以在不解压的情况下直接读取文件的内容 # 可以通过ZipInfo.is_dir()来区分是文件还是目录 # if not tmp_file.is_dir(): # with zip_obj.open(tmp_file) as zip_fd: # print(zip_fd.read()) # 函数的功能是将压缩文件直接解压 def my_unzip_function(zip_file_name, path=\".\"): with zipfile.ZipFile(zip_file_name, \"r\") as zip_obj: zip_obj.extractall(path=path) if __name__ == \"__main__\": zip_file_name = \"test_zip.zip\" # 自己在测试时要先自行创建好要压缩的文件和目录 zip_file_list = [\"test_tar_file1.txt\", \"test_tar_file2.txt\"] zip_dir_list = [\"test_tar_dir\"] my_zip_function(zip_file_name, zip_file_list, zip_dir_list) my_traversal_zip_function(zip_file_name) # my_unzip_function(zip_file_name, path=\".\")
三、tar文件的压缩与解压缩实现
除了直接的.tar文件,还包括.tar.gz/.tar.bz2/.tar.xz
等格式文件的压缩与解压缩实现。
import os import tarfile # Python学习交流群:778463939 # 函数功能是tar_file_list所有文件,和tar_dir_list所有目录下的所有文件,被压缩到一个tar_file_name的压缩文件中 def my_tar_function(tar_file_name, tar_file_list=[], tar_dir_list=[], model=\"w\"): # 本来也应该是tarfile.TarFile(tar_file_name, model)来创建的,但TarFile不支持\"r:gz\"等扩展形式 # 压缩文件最后需要close,为了方便我们直接用with with tarfile.open(tar_file_name, model) as tar_obj: # 压缩文件 for tmp_file in tar_file_list: tar_obj.add(tmp_file) # 压缩目录。和zipfile相比tarfile允许直接压缩目录,而不需要去遍历目录一个个文件压 for tmp_dir in tar_dir_list: tar_obj.add(tmp_dir) # 函数功能是遍历压缩文件中的所有文件 def my_traversal_tar_function(tar_file_name, model=\"r\"): with tarfile.open(tar_file_name, model) as tar_obj: # 返回结果是一个TarInfo列表 all_file_list = tar_obj.getmembers() for tmp_file in all_file_list: print(tmp_file.name) # 还可以在不解压的情况下直接读取文件的内容 # 可以通过TarInfo.isdir()来区分是文件还是目录 # if not tmp_file.isdir(): # # 相当于zip的open,并不会把文件给解压出来 # tar_fd = tar_obj.extractfile(tmp_file) # print(tar_fd.read()) # 函数的功能是将压缩文件直接解压 def my_untar_function(tar_file_name, path=\".\", model=\"r\"): with tarfile.open(tar_file_name, model) as tar_obj: tar_obj.extractall(path=path) if __name__ == \"__main__\": # 自己在测试时要先自行创建好要压缩的文件和目录 tar_file_list = [\"test_tar_file1.txt\", \"test_tar_file2.txt\"] tar_dir_list = [\"test_tar_dir\"] tar_file_name = \"test_tar.tar\" # 在.tar基础上,tarfile还支持gz/bz2/xz的压缩,只要在原来打开模式的基础上使用:或|接上压缩方法即可,如\"r:gz\" # 特别的,如果是读取文件,可以使用\"r:*\"来指示尝试以任意格式读取 open_model = \"w\" # open_model = \"w:gz\" my_tar_function(tar_file_name, tar_file_list, tar_dir_list, model=open_model) open_model = \"r\" # open_model = \"r:*\" my_traversal_tar_function(tar_file_name, model=open_model) # open_model = \"r:*\" # my_untar_function(tar_file_name, path=\".\", model=open_model)
© 版权声明
THE END
暂无评论内容