移動(dòng)并重命名2000個(gè)文件,Python,3秒
文章轉(zhuǎn)載自微信公眾號(hào)“早起Python”(zaoqi-python)。
大家好,又到了Python辦公自動(dòng)化(偷懶)專題。
今天介紹的案例是如何利用Python來自動(dòng)化移動(dòng)、修改、重命名文件/夾,這樣的操作在日常辦公中經(jīng)常會(huì)用到,若能掌握用Python實(shí)現(xiàn)將會(huì)大大提高效率!
所以我希望能夠通過這篇文章來讓大家了解:如何基于 os glob 和 shutil 對(duì)文件管理的綜合運(yùn)用!
一、需求描述
為了讓本文介紹的案例更有通用型,我新建了一個(gè)文件夾 files1 存放著 1800+ 個(gè)文件,如下所示:
需要完成的內(nèi)容如下:
將 1835 個(gè)文件移動(dòng)到新文件夾 file2,并且重命名文件,名字開頭加上 序號(hào) 和 “終稿” 兩個(gè)字,如名字更改為 “1-終稿-xxxxx(原文件名)” |
你心里可能想著:這是人做的事??? 但確實(shí)這是真實(shí)的需求,文件批量重命名非常常見,如果沒有一些技巧,那么只能耗費(fèi)大量的時(shí)間和人力去做。這里的技巧,就是 Python。
另外還有一個(gè)問題:要先移動(dòng)再重命名還是先重命名再移動(dòng)呢? 繼續(xù)往下看!
二、前置知識(shí)和數(shù)據(jù)準(zhǔn)備
1. 生成大量隨機(jī)文件
真實(shí)的辦公場(chǎng)景并不會(huì)這樣的需求,畢竟誰想要無端給自己的電腦產(chǎn)生大量無用文件呢(也不要給別人的電腦亂用)。
不得不提,生成隨機(jī)文件能夠幫助我們更好的測(cè)試自己 Python 文件管理的技能。如果你沒有合適的文件夾和文件夾供自己練習(xí),那么為什么不自己寫個(gè)代碼產(chǎn)生呢?
當(dāng)然,在這個(gè)過程中我們也會(huì)學(xué)習(xí)一些知識(shí)點(diǎn),先看代碼:
- import random
- import string
- for i in range(2000):
- random_str = ''.join(random.sample(string.ascii_letters + string.digits, random.randint(1, 11)))
- file = open(r"C:\\xxx\\file1" + random_str + ".txt", 'w+') # 前面路徑是產(chǎn)生文件的目標(biāo)文件夾
- file.write(''.join(random.sample(string.ascii_letters + string.digits, random.randint(1, 11))))
- file.close()
通過 string 就可以獲得所有的字母和數(shù)字,利用 random.sample() 常規(guī)接受兩個(gè)參數(shù),一個(gè)是抽樣的范圍,一個(gè)是抽樣的次數(shù),默認(rèn)是放回抽樣。這樣就可以在給定的字母數(shù)字范圍內(nèi)隨機(jī)抽取 1-10 個(gè),但是返回的結(jié)果注意是列表,需要再用 .join 方法完成字符串拼接。
用隨機(jī)產(chǎn)生的名字生成文件后,再在其內(nèi)部用類似的方法隨機(jī)寫入一些內(nèi)容:
上面的寫法不夠優(yōu)雅,因?yàn)樾枰涮资褂?file.close() 釋放,更好的方法是直接利用上下文管理器 with 結(jié)構(gòu),減少出錯(cuò)的幾率:
- import random
- import string
- for i in range(2000):
- random_str = ''.join(random.sample(string.ascii_letters + string.digits, random.randint(1, 11)))
- with open(r"C:\\xxx\\file1" + random_str + ".txt", 'w+') as file:
- file.write(''.join(random.sample(string.ascii_letters + string.digits, random.randint(1, 11))))
因?yàn)榧词故请S機(jī)產(chǎn)生名字,但抽樣的范圍和次數(shù)不大決定了 2000 次抽樣會(huì)有一些抽簽組合成的名字完全一樣,后面形成的文件會(huì)覆蓋之前產(chǎn)生的文件,最終導(dǎo)致產(chǎn)生的文件沒有 2000 個(gè)。
2. 重命名文件/文件夾
需要用到內(nèi)置庫 os 的 os.rename() 方法:
- import os
- os.rename('practice.txt', 'practice_rename.txt') # 重命名文件
- os.rename('文件夾1', '文件夾2') # 重命名文件夾
雖然需求中有重命名文件的需求,但實(shí)際上并不需要直接借助這個(gè)方法。
3. 移動(dòng)文件/文件夾
需要用到內(nèi)置庫 shutil 的 shutil.move 方法:
- import shutil
- shutil.move(r'.\practice.txt', r'.\文件夾1/')
- shutil.move(r'.\practice.txt', r'.\文件夾1/new.txt')
注意到上面后兩行代碼的區(qū)別嗎?前一行是將目標(biāo)文件移動(dòng)到目標(biāo)文件夾里,而后一行,在將目標(biāo)文件移動(dòng)到目標(biāo)文件夾里的同時(shí),能夠?qū)ζ溥M(jìn)行重命名
也就是說,我們并不需要用 os.rename 先命名文件再用 shutil.move 將其移動(dòng)的指定文件夾,而是可以用 shutil.move 一步到位。
4. 遍歷獲取文件
采用基于 glob 庫的迭代框架:
- import glob
- path = xxx
- for file in glob.glob(f'{path}/**/*.xlsx', recursive=True):
- pass
上面的代碼能夠獲取給定路徑內(nèi)部所有文件夾下的 Excel 文件(.xlsx 格式), recursive參數(shù)默認(rèn)為 False,當(dāng)為 True 時(shí)允許逐級(jí)遍歷
而本例需要獲取給定文件夾下的所有 .txt 文件,則更加簡(jiǎn)單:
- import glob
- path = xxx
- for file in glob.glob(f'{path}/*.txt'):
- pass
三、代碼實(shí)現(xiàn)
在上面一節(jié)我們已經(jīng)把需求拆分為多個(gè)小塊并理清了思路,現(xiàn)在可以開始寫代碼了。首先導(dǎo)入需要的庫:
- import os
- import shutil
- import glob
- path = r"C:\xxx" # 存放大量需更名移動(dòng)文件的文件夾路徑的上一級(jí)路徑
上文提到,不需要利用 os.rename 那為什么要導(dǎo)入 os 庫呢?
一方面因?yàn)橐ㄟ^這個(gè)庫產(chǎn)生新的文件夾。也可以手動(dòng)完成,但交給代碼多了判斷也不容易出錯(cuò):
- if not os.path.exists(path + r'\file2'):
- os.mkdir(path + r'\file2')
另一方面下文還會(huì)用它獲取文件名,然后就可以移動(dòng)更名一步到位,glob 迭代文件框架遍歷獲取文件絕對(duì)路徑:
- count = 1 # 生成序號(hào)
- for file in glob.glob(f'{path}\\測(cè)試\\*.txt'):
- # 這里是文件絕對(duì)路徑,可以用字符串方法直接替換修改,但為了方便理解我還是用路徑拼接
- filename = os.path.basename(file)
- shutil.move(file, path + r'\file2' + f'\{count}-終稿-{filename}')
- count += 1
看到?jīng)],Python、3秒、搞定、干飯!