自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

讓Python在后臺自動解壓各種壓縮文件!

開發(fā) 后端
編寫一個(gè)Python程序,每次下載壓縮包形式的文件后,自動將內(nèi)部文件解壓到當(dāng)前文件夾后將壓縮包刪除。

一、需求描述

編寫一個(gè)Python程序,每次下載壓縮包形式的文件后,自動將內(nèi)部文件解壓到當(dāng)前文件夾后將壓縮包刪除,通過本案例可以學(xué)到的知識點(diǎn):

  • os 模塊綜合應(yīng)用
  • glob 模塊綜合應(yīng)用
  • 利用 gzip zipfile rarfile tarfile 模塊解壓文件

[[350931]]

二、步驟分析和前置知識

碼代碼之前需要將復(fù)雜問題解釋成多個(gè)明確的要求,即這個(gè)程序?qū)崿F(xiàn)的邏輯為:

  • 定時(shí)檢測某個(gè)文件夾(如 download 文件夾)是否存在壓縮文件
  • 如果有新出現(xiàn)的壓縮文件則將其解壓到當(dāng)前文件夾內(nèi)的新文件夾中 刪除壓縮文件

提到壓縮文件就要分不同壓縮格式進(jìn)行討論,主要有以下4種:

  • gz: 即gzip,通常只能壓縮一個(gè)文件
  • tar: 本質(zhì)上不是壓縮工具而是打包工具,可以跟.gz配合形成.tar.gz的打包壓縮格式
  • zip: 和.tar.gz很類似但可以打包壓縮多個(gè)文件
  • rar: 打包壓縮文件,最初用于DOS

因此,文件是否為壓縮文件的判斷邏輯可以如下:

  • 建立一個(gè)含壓縮包后綴的列表 compressed_lst = ['gz', 'tar', 'zip', 'rar']
  • 目標(biāo)文件夾下的所有文件名運(yùn)行filename.split(.)[-1]獲取后綴名
  • 判斷后綴名是否在compressed_lst中,如果存在則運(yùn)行后續(xù)的解壓代碼
  • 如果是以gz結(jié)尾的文件,解壓后需要再次判斷是否是以.tar結(jié)尾,并進(jìn)行相應(yīng)處理

不同壓縮文件的解壓代碼各不相同,在后續(xù)代碼操作中具體展開。

三、代碼實(shí)現(xiàn)

首先是獲取 download 文件夾下所有文件的文件名

  1. import glob 
  2. import os 
  3.  
  4. path = r'C:\xxxx\download' 
  5. file_lst = glob.glob(path + '/*') 
  6. # 列表推導(dǎo)式 
  7. filename_lst = [os.path.basename(i) for i in file_lst] 
  8.  
  9. print(filename_lst) 

接下來根據(jù)文件的后綴名判斷是否需要壓縮,先看一下代碼框架

  1. for i in filename_lst: 
  2.     if '.' in i: 
  3.         # 獲取后綴名 
  4.         suffix = i.split('.')[-1] 
  5.         # 逐個(gè)將后綴名和各格式的壓縮后綴匹配 
  6.         if suffix == 'gz': 
  7.             pass 
  8.             if ...: # 再次判斷新產(chǎn)生的文件名是否以 .tar 結(jié)尾 
  9.                 pass 
  10.         if suffix == 'tar': 
  11.             pass 
  12.         if suffix == 'zip': 
  13.             pass 
  14.         if suffix == 'rar': 
  15.             pass 

這里有2個(gè)注意點(diǎn):

  • 有些文件沒有后綴名,因此可能不存在 .,這時(shí)用 filename.split('.')[-1]會報(bào)錯(cuò),因此需要先判斷
  • 以.gz 結(jié)尾的文件,解壓后需要再次判斷是否是以 .tar 結(jié)尾,然后我們就可以分別將四種壓縮文件的解壓代碼寫成函數(shù),符合時(shí)候單獨(dú)調(diào)用即可

1. 處理.gz 文件

  1. import gzip 
  2.  
  3. def ungz(filename): 
  4.     filenamefilename = filename[:-3] # gz文件的單文件解壓就是去掉 filename 后面的 .gz 
  5.     gz_file = gzip.GzipFile(filename) 
  6.     with open(filename, "w+") as file: 
  7.         file.write(gz_file.read()) 
  8.         return filename  # 這個(gè)gzip的函數(shù)需要返回值以進(jìn)一步配合untar函數(shù) 

前面反復(fù)提及的gz文件有可能跟tar文件配合,因此解壓gz文件后需要再判斷是否有必要解開tar文件

這里就可以先把tar文件的函數(shù)寫出來👇

2. 處理.tar文件

  1. import tarfile 
  2.  
  3. def untar(filename): 
  4.     tar = tarfile.open(filename) 
  5.     names = tar.getnames() 
  6.     # tar本身是將文件打包,解除打包會產(chǎn)生很多文件,因此需要建立文件夾存放 
  7.     if not os.path.isdir(filename + "_dir"): 
  8.         os.mkdir(filename + "_dir") 
  9.     for name in names: 
  10.         tar.extract(name, filename + "_dir/") 
  11.     tar.close() 

3. 處理.zip文件

  1. import zipfile 
  2.  
  3. def unzip(filename): 
  4.     zip_file = zipfile.ZipFile(filename) 
  5.     # 類似tar解除打包,建立文件夾存放解壓的多個(gè)文件 
  6.     if not os.path.isdir(filename + "_dir"): 
  7.         os.mkdir(filename + "_dir") 
  8.     for names in zip_file.namelist(): 
  9.         zip_file.extract(names, filename + "_dir/") 
  10.     zip_file.close() 

4. 處理.rar文件

  1. import rarfile 
  2.  
  3. def unrar(filename): 
  4.     rar = rarfile.RarFile(filename) 
  5.     if not os.path.isdir(filename + "_dir"): 
  6.         os.mkdir(filename + "_dir") 
  7.     os.chdir(filename + "_dir") 
  8.     rar.extractall() 
  9.     rar.close() 

可以看到,四種解壓代碼略有不同,推薦大家實(shí)際演示中自己體會一下差別,解壓后配合 os.remove() 就可以刪除壓縮包,現(xiàn)在看看邏輯框架補(bǔ)上解壓函數(shù)后的內(nèi)容:

  1. for filename in filename_lst: 
  2.     if '.' in filename: 
  3.         suffix = filename.split('.')[-1] 
  4.         if suffix == 'gz': 
  5.             new_filename = ungz(filename) 
  6.             os.remove(filename) 
  7.             if new_filename.split('.')[-1] == 'tar': 
  8.                 untar(new_filename) 
  9.                 os.remove(new_filename)   
  10.         if suffix == 'tar': 
  11.             untar(filename) 
  12.             os.remove(filename) 
  13.         if suffix == 'zip': 
  14.             unzip(filename) 
  15.             os.remove(filename) 
  16.         if suffix == 'rar': 
  17.             unrar(filename) 
  18.             os.remove(filename) 

5. 實(shí)現(xiàn)實(shí)時(shí)檢測

比較簡單的方法就是建立 while True 死循環(huán)配合 time.sleep()睡眠,框架如下:

  1. import time 
  2.  
  3. while True: 
  4.     func() 
  5.     time.sleep(5) # 睡眠秒數(shù)可以設(shè)置大一點(diǎn)避免過度占用資源 

最后將第二步的實(shí)現(xiàn)代碼改為函數(shù)并放在循環(huán)框架中就可以完成本次需求,完整代碼如下:

  1. import glob 
  2. import os 
  3. import gzip 
  4. import tarfile 
  5. import zipfile 
  6. import rarfile 
  7. import time 
  8.  
  9. path = r'C:\xxxx\download' 
  10. file_lst = glob.glob(path + '/*') 
  11. filename_lst = [os.path.basename(i) for i in file_lst] 
  12.  
  13. def ungz(filename): 
  14.     filenamefilename = filename[:-3] 
  15.     gz_file = gzip.GzipFile(filename) 
  16.     with open(filename, "w+") as file: 
  17.         file.write(gz_file.read()) 
  18.     return filename 
  19.  
  20. def untar(filename): 
  21.     tar = tarfile.open(filename) 
  22.     names = tar.getnames() 
  23.     if not os.path.isdir(filename + "_dir"): 
  24.         os.mkdir(filename + "_dir") 
  25.     for name in names: 
  26.         tar.extract(name, filename + "_dir/") 
  27.     tar.close() 
  28.  
  29. def unzip(filename): 
  30.     zip_file = zipfile.ZipFile(filename) 
  31.     if not os.path.isdir(filename + "_dir"): 
  32.         os.mkdir(filename + "_dir") 
  33.     for names in zip_file.namelist(): 
  34.         zip_file.extract(names, filename + "_dir/") 
  35.     zip_file.close() 
  36.  
  37. def unrar(filename): 
  38.     rar = rarfile.RarFile(filename) 
  39.     if not os.path.isdir(filename + "_dir"): 
  40.         os.mkdir(filename + "_dir") 
  41.     os.chdir(filename + "_dir") 
  42.     rar.extractall() 
  43.     rar.close() 
  44.  
  45. def unzip_files(): 
  46.     for filename in filename_lst: 
  47.         if '.' in filename: 
  48.             suffix = filename.split('.')[-1] 
  49.             if suffix == 'gz': 
  50.                 new_filename = ungz(filename) 
  51.                 os.remove(filename) 
  52.                 if new_filename.split('.')[-1] == 'tar': 
  53.                     untar(new_filename) 
  54.                     os.remove(new_filename) 
  55.             if suffix == 'tar': 
  56.                 untar(filename) 
  57.                 os.remove(filename) 
  58.             if suffix == 'zip': 
  59.                 unzip(filename) 
  60.                 os.remove(filename) 
  61.             if suffix == 'rar': 
  62.                 unrar(filename) 
  63.                 os.remove(filename) 
  64.  
  65. while True: 
  66.     unzip_files() 
  67.     time.sleep(5) 

 

責(zé)任編輯:趙寧寧 來源: 早起Python
相關(guān)推薦

2018-09-14 16:18:26

Linux壓縮文件應(yīng)用程序

2012-05-10 09:43:28

2024-01-04 12:47:00

Linux命令工具

2024-05-23 11:33:42

python代碼開發(fā)

2011-09-15 10:12:11

ubunturar

2020-02-21 13:00:50

Linuxzip命令壓縮文件

2017-03-17 16:10:24

linux進(jìn)程后臺

2013-07-18 14:16:14

ZipArchive壓iOS開發(fā)

2017-03-15 19:54:05

Linux進(jìn)程后臺

2018-09-05 19:00:40

LinuxUnix壓縮文件

2009-12-16 16:11:14

Linux壓縮文件

2009-11-30 09:31:41

Windows 7文件解壓

2009-12-25 17:55:05

Linux tar

2010-03-03 13:32:08

Python壓縮文件

2022-07-04 08:03:08

Go壓縮打包

2023-03-29 08:59:59

Go壓縮包文檔

2009-12-25 18:05:05

Linux壓縮程式

2024-09-29 16:27:46

Python文件管理

2011-04-08 09:42:19

Access數(shù)據(jù)庫壓縮文件

2019-10-24 08:52:23

Linux壓縮文件歸檔
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號