用 Python 快速找到最大的文件
作者:somenzz
現(xiàn)在的電腦差不多都是固態(tài)硬盤了,速度很快,但容量不會太大,經(jīng)常會出現(xiàn)磁盤空間不足的情況,怎么辦,刪除那些不重要的最大的文件是最有效的辦法。
現(xiàn)在的電腦差不多都是固態(tài)硬盤了,速度很快,但容量不會太大,經(jīng)常會出現(xiàn)磁盤空間不足的情況,怎么辦,刪除那些不重要的最大的文件是最有效的辦法。
那么如何用找到最大的文件呢?比如說找到最大的前 10 個文件?
思路:我們遍歷目錄,將文件路徑和文件大小作為生成器返回,然后插入大小為 10 的大頂堆,最后將大頂堆的內(nèi)容打印即可。
借助 Python,代碼很簡潔:
- import os
- import time
- from os.path import join, getsize
- from heapq import nlargest
- def walk_files_and_sizes(start_at: str):
- for root, _, files in os.walk(start_at):
- for file in files:
- path = join(root, file)
- try:
- size = getsize(path) # bytes
- yield path, size
- except OSError:
- continue
- def largest_files(n: int, start_at: str) -> None:
- MB = 1024 * 1024
- largest = nlargest(n, walk_files_and_sizes(start_at), key=lambda x: x[1])
- for path, size in largest:
- print(f'{size//MB} MB {path}')
- if __name__ == '__main__':
- start = time.perf_counter()
- largest_files(10, "/Users/aaron/")
- elapsed = time.perf_counter() - start
- print(f'{elapsed} seconds elapsed')
我在自己電腦上跑了下,200 GB 左右的目錄,123 秒就跑完了:
接下來刪除不需要的文件就可以了。
如果是 Windows 系統(tǒng)也是可以的:
- largest_files(10, "C:/Users/xxx/")
最后的話
本文的方法非常實用,可以收藏,說不定那天,這個小工具就幫你解決了大問題。
責(zé)任編輯:華軒
來源:
Python七號