自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

Python 下載大文件,哪種方式速度更快!

開發(fā) 后端
通過 Python 下載大文件,本文用兩種方法來帶你看看哪種方式速度更快。

通常,我們都會(huì)用 requests 庫(kù)去下載,這個(gè)庫(kù)用起來太方便了。

方法一

使用以下流式代碼,無論下載文件的大小如何,Python 內(nèi)存占用都不會(huì)增加:

def download_file(url):
local_filename = url.split('/')[-1]
# 注意傳入?yún)?shù) stream=True
with requests.get(url, stream=True) as r:
r.raise_for_status()
with open(local_filename, 'wb') as f:
for chunk in r.iter_content(chunk_size=8192):
f.write(chunk)
return local_filename

如果你有對(duì) chunk 編碼的需求,那就不該傳入 chunk_size 參數(shù),且應(yīng)該有 if 判斷。

def download_file(url):
local_filename = url.split('/')[-1]
# 注意傳入?yún)?shù) stream=True
with requests.get(url, stream=True) as r:
r.raise_for_status()
with open(local_filename, 'w') as f:
for chunk in r.iter_content():
if chunk:
f.write(chunk.decode("utf-8"))
return local_filename

iter_content[1] 函數(shù)本身也可以解碼,只需要傳入?yún)?shù) decode_unicode = True 即可。另外,搜索公眾號(hào)頂級(jí)Python后臺(tái)回復(fù)“進(jìn)階”,獲取一份驚喜禮包。

請(qǐng)注意,使用 iter_content 返回的字節(jié)數(shù)并不完全是 chunk_size,它是一個(gè)通常更大的隨機(jī)數(shù),并且預(yù)計(jì)在每次迭代中都會(huì)有所不同。

方法二

使用 Response.raw[2] 和 shutil.copyfileobj[3]

import requests
import shutil

def download_file(url):
local_filename = url.split('/')[-1]
with requests.get(url, stream=True) as r:
with open(local_filename, 'wb') as f:
shutil.copyfileobj(r.raw, f)

return local_filename

這將文件流式傳輸?shù)酱疟P而不使用過多的內(nèi)存,并且代碼更簡(jiǎn)單。

注意:根據(jù)文檔,Response.raw 不會(huì)解碼,因此如果需要可以手動(dòng)替換 r.raw.read 方法

response.raw.read = functools.partial(response.raw.read, decode_content=True)

速度

方法二更快。方法一如果 2-3 MB/s 的話,方法二可以達(dá)到近 40 MB/s。

參考資料

[1]iter_content: https://requests.readthedocs.io/en/latest/api/#requests.Response.iter_content

[2]Response.raw: https://requests.readthedocs.io/en/latest/api/#requests.Response.raw

[3]shutil.copyfileobj: https://docs.python.org/3/library/shutil.html#shutil.copyfileobj

責(zé)任編輯:龐桂玉 來源: Python人工智能技術(shù)
相關(guān)推薦

2015-08-07 15:35:42

ios短點(diǎn)下載源碼

2022-06-21 15:00:01

Python語言循環(huán)方式

2009-08-31 17:15:37

LinuxWindowsLinux操作系統(tǒng)

2021-01-18 15:04:53

Linux內(nèi)核開發(fā)者刪除

2019-09-02 15:12:46

Python 開發(fā)數(shù)據(jù)分析

2021-04-19 05:41:04

JavaScript大文件下載

2024-07-02 10:18:18

2025-03-28 05:10:00

Spring上傳大文件

2015-08-25 15:53:08

LinuxcURL

2022-07-25 11:33:48

Python大文件

2022-08-18 09:51:50

Python代碼循環(huán)

2018-06-20 09:49:11

數(shù)據(jù)儲(chǔ)存pickle

2024-06-20 12:48:17

Rustfd

2015-03-03 13:15:19

ASP.NET大文件下載實(shí)現(xiàn)思路

2011-08-04 10:25:32

聯(lián)想激光打印機(jī)

2021-07-27 13:08:52

微軟Chrome新提案

2018-02-26 09:00:00

2022-09-28 10:27:15

Python文件操作

2025-04-10 08:03:31

Spring系統(tǒng)

2023-03-17 11:33:18

數(shù)據(jù)中心
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)