自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

【進(jìn)階】嫌棄Python慢,試試這幾個(gè)方法?

開發(fā) 后端
優(yōu)化的第一要義就是「不要去做」。但如果你必須要做,我希望這些小技巧可以幫助到你。然而,優(yōu)化代碼時(shí)一定要謹(jǐn)慎,因?yàn)樵摬僮骺赡茏罱K造成代碼可讀性變差、可維護(hù)性變差,這些弊端可能超過代碼優(yōu)化所帶來的好處。

【進(jìn)階】嫌棄Python慢,試試這幾個(gè)方法?

計(jì)時(shí)與性能分析

在開始優(yōu)化之前,我們首先需要找到代碼的哪一部分真正拖慢了整個(gè)程序。有時(shí)程序性能的瓶頸顯而易見,但當(dāng)你不知道瓶頸在何處時(shí),這里有一些幫助找到性能瓶頸的辦法:

注:下列程序用作演示目的,該程序計(jì)算 e 的 X 次方(摘自 Python 文檔):

  1. # slow_program.py 
  2. from decimal import * 
  3.  
  4. def exp(x): 
  5.     getcontext().prec += 2 
  6.     i, lasts, s, fact, num = 0, 0, 1, 1, 1 
  7.     while s != lasts: 
  8.         lasts = s 
  9.         i += 1 
  10.         fact *= i 
  11.         num *= x 
  12.         s += num / fact 
  13.     getcontext().prec -= 2 
  14.     return +s 
  15.  
  16. exp(Decimal(150)) 
  17. exp(Decimal(400)) 
  18. exp(Decimal(3000)) 

最懶惰的「性能分析」

首先,最簡單但說實(shí)話也很懶的方法——使用 Unix 的 time 命令:

  1. ~ $ time python3.8 slow_program.py 
  2.  
  3. real    0m11,058s 
  4. user    0m11,050s 
  5. sys     0m0,008s 

如果你只想給整個(gè)程序計(jì)時(shí),這個(gè)命令即可完成目的,但通常是不夠的……

最細(xì)致的性能分析

另一個(gè)極端是 cProfile,它提供了「太多」的信息:

  1. ~ $ python3.8 -m cProfile -s time slow_program.py 
  2.          1297 function calls (1272 primitive calls) in 11.081 seconds 
  3.  
  4.    Ordered by: internal time 
  5.  
  6.    ncalls  tottime  percall  cumtime  percall filename:lineno(function
  7.         3   11.079    3.693   11.079    3.693 slow_program.py:4(exp) 
  8.         1    0.000    0.000    0.002    0.002 {built-in method _imp.create_dynamic} 
  9.       4/1    0.000    0.000   11.081   11.081 {built-in method builtins.exec
  10.         6    0.000    0.000    0.000    0.000 {built-in method __new__ of type object at 0x9d12c0} 
  11.         6    0.000    0.000    0.000    0.000 abc.py:132(__new__) 
  12.        23    0.000    0.000    0.000    0.000 _weakrefset.py:36(__init__) 
  13.       245    0.000    0.000    0.000    0.000 {built-in method builtins.getattr} 
  14.         2    0.000    0.000    0.000    0.000 {built-in method marshal.loads} 
  15.        10    0.000    0.000    0.000    0.000 <frozen importlib._bootstrap_external>:1233(find_spec) 
  16.       8/4    0.000    0.000    0.000    0.000 abc.py:196(__subclasscheck__) 
  17.        15    0.000    0.000    0.000    0.000 {built-in method posix.stat} 
  18.         6    0.000    0.000    0.000    0.000 {built-in method builtins.__build_class__} 
  19.         1    0.000    0.000    0.000    0.000 __init__.py:357(namedtuple) 
  20.        48    0.000    0.000    0.000    0.000 <frozen importlib._bootstrap_external>:57(_path_join) 
  21.        48    0.000    0.000    0.000    0.000 <frozen importlib._bootstrap_external>:59(<listcomp>) 
  22.         1    0.000    0.000   11.081   11.081 slow_program.py:1(<module>) 
  23. ... 

這里,我們結(jié)合 cProfile 模塊和 time 參數(shù)運(yùn)行測(cè)試腳本,使輸出行按照內(nèi)部時(shí)間(cumtime)排序。這給我們提供了大量信息,上面你看到的行只是實(shí)際輸出的 10%。從輸出結(jié)果我們可以看到 exp 函數(shù)是罪魁禍?zhǔn)?驚不驚喜,意不意外),現(xiàn)在我們可以更加專注于計(jì)時(shí)和性能分析了……

計(jì)時(shí)專用函數(shù)

現(xiàn)在我們知道了需要關(guān)注哪里,那么我們可能只想要給運(yùn)行緩慢的函數(shù)計(jì)時(shí)而不去管代碼的其他部分。我們可以使用一個(gè)簡單的裝飾器來做到這點(diǎn):

  1. def timeit_wrapper(func): 
  2.     @wraps(func) 
  3.     def wrapper(*args, **kwargs): 
  4.         start = time.perf_counter()  # Alternatively, you can use time.process_time() 
  5.         func_return_val = func(*args, **kwargs) 
  6.         end = time.perf_counter() 
  7.         print('{0:<10}.{1:<8} : {2:<8}'.format(func.__module__, func.__name__, end - start)) 
  8.         return func_return_val 
  9.     return wrapper 

接著,將該裝飾器按如下方式應(yīng)用在待測(cè)函數(shù)上:

  1. @timeit_wrapper 
  2. def exp(x): 
  3.     ... 
  4.  
  5. print('{0:<10} {1:<8} {2:^8}'.format('module''function''time')) 
  6. exp(Decimal(150)) 
  7. exp(Decimal(400)) 
  8. exp(Decimal(3000)) 

得到如下輸出:

  1. ~ $ python3.8 slow_program.py 
  2. module     function   time   
  3. __main__  .exp      : 0.003267502994276583 
  4. __main__  .exp      : 0.038535295985639095 
  5. __main__  .exp      : 11.728486061969306 

此時(shí)我們需要考慮想要測(cè)量哪一類時(shí)間。time 庫提供了 time.perf_counter 和 time.process_time 兩種時(shí)間。其區(qū)別在于,perf_counter 返回絕對(duì)值,其中包括了 Python 程序并不在運(yùn)行的時(shí)間,因此它可能受到機(jī)器負(fù)載的影響。而 process_time 只返回用戶時(shí)間(除去了系統(tǒng)時(shí)間),也就是只有進(jìn)程運(yùn)行時(shí)間。

讓程序更快

現(xiàn)在到了真正有趣的部分了,讓 Python 程序跑得更快!我不會(huì)告訴你一些奇技淫巧或代碼段來神奇地解決程序的性能問題,而更多是關(guān)于通用的想法和策略。使用這些策略,可以對(duì)程序性能產(chǎn)生巨大的影響,有時(shí)甚至可以帶來高達(dá) 30% 的提速。

使用內(nèi)置的數(shù)據(jù)類型

這一點(diǎn)非常明顯。內(nèi)置的數(shù)據(jù)類型非??欤绕湎啾扔跇浠蜴湵淼茸远x類型而言。這主要是因?yàn)閮?nèi)置數(shù)據(jù)類型使用 C 語言實(shí)現(xiàn),使用 Python 實(shí)現(xiàn)的代碼在運(yùn)行速度上和它們沒法比。

使用 lru_cache 實(shí)現(xiàn)緩存/記憶

我在之前的博客中介紹過這一技巧,但我認(rèn)為它值得用一個(gè)簡單例子再次進(jìn)行說明:

  1. import functools 
  2. import time 
  3.  
  4. # caching up to 12 different results 
  5. @functools.lru_cache(maxsize=12) 
  6. def slow_func(x): 
  7.     time.sleep(2)  # Simulate long computation 
  8.     return x 
  9.  
  10. slow_func(1)  # ... waiting for 2 sec before getting result 
  11. slow_func(1)  # already cached - result returned instantaneously! 
  12.  
  13. slow_func(3)  # ... waiting for 2 sec before getting result 

上面的函數(shù)使用 time.sleep 模擬了繁重的計(jì)算過程。當(dāng)我們第一次使用參數(shù) 1 調(diào)用函數(shù)時(shí),它等待了 2 秒鐘后返回了結(jié)果。當(dāng)再次調(diào)用時(shí),結(jié)果已經(jīng)被緩存起來,所以它跳過了函數(shù)體,直接返回結(jié)果。

使用局部變量

這和每個(gè)作用域中變量的查找速度有關(guān)。我之所以說「每個(gè)作用域」,是因?yàn)檫@不僅僅關(guān)乎局部變量或全局變量。事實(shí)上,就連函數(shù)中的局部變量、類級(jí)別的屬性和全局導(dǎo)入函數(shù)這三者的查找速度都會(huì)有區(qū)別。函數(shù)中的局部變量最快,類級(jí)別屬性(如 self.name)慢一些,全局導(dǎo)入函數(shù)(如 time.time)最慢。

你可以通過這種看似沒有必要的代碼組織方式來提高效率:

  1. #  Example #1 
  2. class FastClass: 
  3.  
  4.     def do_stuff(self): 
  5.         temp = self.value  # this speeds up lookup in loop 
  6.         for i in range(10000): 
  7.             ...  # Do something with `temp` here 
  8.  
  9. #  Example #2 
  10. import random 
  11.  
  12. def fast_function(): 
  13.     r = random.random 
  14.     for i in range(10000): 
  15.         print(r())  # calling `r()` here, is faster than global random.random() 

使用函數(shù)

這也許有些反直覺,因?yàn)檎{(diào)用函數(shù)會(huì)讓更多的東西入棧,進(jìn)而在函數(shù)返回時(shí)為程序帶來負(fù)擔(dān),但這其實(shí)和之前的策略相關(guān)。如果你只是把所有代碼扔進(jìn)一個(gè)文件而沒有把它們放進(jìn)函數(shù),那么它會(huì)因?yàn)楸姸嗟娜肿兞慷兟R虼?,你可以通過將所有代碼封裝在 main 函數(shù)中并調(diào)用它來實(shí)現(xiàn)加速,如下所示:

  1. def main(): 
  2.     ...  # All your previously global code 
  3.  
  4. main() 

不要訪問屬性

另一個(gè)可能讓程序變慢的東西是用來訪問對(duì)象屬性的點(diǎn)運(yùn)算符(.)。這個(gè)運(yùn)算符會(huì)引起程序使用__getattribute__進(jìn)行字典查找,進(jìn)而為程序帶來不必要的開銷。那么,我們?cè)趺幢苊?或者限制)使用它呢?

  1. #  Slow: 
  2. import re 
  3.  
  4. def slow_func(): 
  5.     for i in range(10000): 
  6.         re.findall(regex, line)  # Slow! 
  7.  
  8. #  Fast: 
  9. from re import findall 
  10.  
  11. def fast_func(): 
  12.     for i in range(10000): 
  13.         findall(regex, line)  # Faster! 

當(dāng)心字符串

當(dāng)在循環(huán)中使用取模運(yùn)算符(%s)或 .format() 時(shí),字符串操作會(huì)變得很慢。有沒有更好的選擇呢?根據(jù) Raymond Hettinger 近期發(fā)布的推文,我們只需要使用 f-string 即可,它可讀性更強(qiáng),代碼更加緊湊,并且速度更快!基于這一觀點(diǎn),如下從快到慢列出了你可以使用的一系列方法:

  1. f'{s} {t}'  # Fast! 
  2. s + '  ' + t  
  3. ' '.join((s, t)) 
  4. '%s %s' % (s, t)  
  5. '{} {}'.format(s, t) 
  6. Template('$s $t').substitute(s=s, t=t)  # Slow! 

生成器本質(zhì)上并不會(huì)更快,因?yàn)樗鼈兊哪康氖嵌栊杂?jì)算,以節(jié)省內(nèi)存而非節(jié)省時(shí)間。然而,節(jié)省的內(nèi)存會(huì)讓程序運(yùn)行更快。為什么呢?如果你有一個(gè)大型數(shù)據(jù)集,并且你沒有使用生成器(迭代器),那么數(shù)據(jù)可能造成 CPU 的 L1 緩存溢出,進(jìn)而導(dǎo)致訪存速度顯著變慢。

當(dāng)涉及到效率時(shí),非常重要的一點(diǎn)是 CPU 會(huì)將它正在處理的數(shù)據(jù)保存得離自己越近越好,也就是保存在緩存中。讀者可以看一看 Raymond Hettingers 的演講(https://www.youtube.com/watch?v=OSGv2VnC0go&t=8m17s),其中提到了這些問題。

總結(jié)

優(yōu)化的第一要義就是「不要去做」。但如果你必須要做,我希望這些小技巧可以幫助到你。然而,優(yōu)化代碼時(shí)一定要謹(jǐn)慎,因?yàn)樵摬僮骺赡茏罱K造成代碼可讀性變差、可維護(hù)性變差,這些弊端可能超過代碼優(yōu)化所帶來的好處。 

責(zé)任編輯:龐桂玉 來源: 機(jī)器學(xué)習(xí)算法與Python學(xué)習(xí)
相關(guān)推薦

2018-04-18 06:56:26

iPhone手機(jī)電量

2022-11-08 08:53:56

插件IDE

2020-12-07 10:59:01

Python數(shù)據(jù)工具

2022-11-11 17:06:43

開發(fā)組件工具

2021-02-23 18:38:11

iPhone地圖蘋果

2022-09-26 12:17:14

clamp() 函數(shù)CSS

2018-12-14 15:51:47

Pandas數(shù)據(jù)數(shù)據(jù)結(jié)構(gòu)

2019-02-28 20:20:43

Python技巧編程語言

2018-03-20 16:03:00

鼠標(biāo)方法硬件

2024-11-08 13:24:43

2022-04-12 08:43:21

Python內(nèi)置模塊

2024-06-03 08:52:40

2022-04-28 23:08:40

Windows 10微軟功能

2023-10-07 08:59:02

2022-08-29 08:41:52

異步ControllerrunAsync

2019-10-10 09:34:19

Python網(wǎng)絡(luò)爬蟲GitHub

2020-07-03 18:14:20

JavaScript開發(fā)技術(shù)

2021-10-27 10:07:59

GitHub代碼開發(fā)者

2020-02-03 09:29:32

JavaScript代碼斷點(diǎn)

2021-06-11 13:59:22

CSS原子類
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)