Python中異常重試解決方案
在做數(shù)據(jù)抓取的時候,經(jīng)常遇到由于網(wǎng)絡(luò)問題導(dǎo)致的程序保存,先前只是記錄了錯誤內(nèi)容,并對錯誤內(nèi)容進(jìn)行后期處理。
原先的流程:
- def crawl_page(url):
- pass
- def log_error(url):
- pass
- url = ""
- try:
- crawl_page(url)
- except:
- log_error(url)
改進(jìn)后的流程:
- attempts = 0
- success = False
- while attempts < 3 and not success:
- try:
- crawl_page(url)
- success = True
- except:
- attempts = 1
- if attempts == 3:
- break
最近發(fā)現(xiàn)的新的解決方案:retrying
retrying 是一個 Python 的重試包,可以用來自動重試一些可能運行失敗的程序段。retrying 提供一個裝飾器函數(shù) retry,被裝飾的函數(shù)就會在運行失敗的條件下重新執(zhí)行,默認(rèn)只要一直報錯就會不斷重試。
- import random
- from retrying import retry
- @retry
- def do_something_unreliable():
- if random.randint(0, 10) > 1:
- raise IOError("Broken sauce, everything is hosed!!!111one")
- else:
- return "Awesome sauce!"
- print do_something_unreliable()
如果我們運行 haveatry 函數(shù),那么直到 random.randint 返回 5,它才會執(zhí)行結(jié)束,否則會一直重新執(zhí)行。
retry 還可以接受一些參數(shù),這個從源碼中 Retrying 類的初始化函數(shù)可以看到可選的參數(shù):
- stopmaxattempt_number:用來設(shè)定***的嘗試次數(shù),超過該次數(shù)就停止重試
- stopmaxdelay:比如設(shè)置成 10000,那么從被裝飾的函數(shù)開始執(zhí)行的時間點開始,到函數(shù)成功運行結(jié)束或者失敗報錯中止的時間點,只要這段時間超過 10 秒,函數(shù)就不會再執(zhí)行了
- wait_fixed:設(shè)置在兩次 retrying 之間的停留時間
- waitrandommin 和 waitrandommax:用隨機的方式產(chǎn)生兩次 retrying 之間的停留時間
- waitexponentialmultiplier 和 waitexponentialmax:以指數(shù)的形式產(chǎn)生兩次 retrying 之間的停留時間,產(chǎn)生的值為 2^previousattemptnumber * waitexponentialmultiplier,previousattemptnumber 是前面已經(jīng) retry 的次數(shù),如果產(chǎn)生的這個值超過了 waitexponentialmax 的大小,那么之后兩個 retrying 之間的停留值都為 waitexponentialmax。這個設(shè)計迎合了 exponential backoff 算法,可以減輕阻塞的情況。
我們可以指定要在出現(xiàn)哪些異常的時候再去 retry,這個要用 retryonexception 傳入一個函數(shù)對象:
- def retry_if_io_error(exception):
- return isinstance(exception, IOError)
- @retry(retry_on_exception=retry_if_io_error)
- def read_a_file():
- with open("file", "r") as f:
- return f.read()
在執(zhí)行 readafile 函數(shù)的過程中,如果報出異常,那么這個異常會以形參 exception 傳入 retryifio_error 函數(shù)中,如果 exception 是 IOError 那么就進(jìn)行 retry,如果不是就停止運行并拋出異常。
我們還可以指定要在得到哪些結(jié)果的時候去 retry,這個要用 retryonresult 傳入一個函數(shù)對象:
- def retry_if_result_none(result):
- return result is None
- @retry(retry_on_result=retry_if_result_none)
- def get_result():
- return None
在執(zhí)行 getresult 成功后,會將函數(shù)的返回值通過形參 result 的形式傳入 retryifresultnone 函數(shù)中,如果返回值是 None 那么就進(jìn)行 retry,否則就結(jié)束并返回函數(shù)值。
其他相關(guān)資料:
- https://pypi.python.org/pypi/retry/
- https://julien.danjou.info/blog/2015/python-retrying
- https://github.com/rholder/retrying