Python 中,字符串"連接"效率最高的方式是?一定出乎你的意料
網(wǎng)上很多文章人云亦云,字符串連接應(yīng)該使用「join」方法而不要用「+」操作。說前者效率更高,它以更少的代價創(chuàng)建新字符串,如果用「+」連接多個字符串,每連接一次,就要為字符串分配一次內(nèi)存,效率顯得有點低,這樣的解釋聽起來很有道理,但 Cpython 解釋器是不是真的按照我們說的這樣呢?
今天做了一個試驗,結(jié)果可能會出乎你的意料。
- def join(n):
- s = "".join((str(i) for i in range(n)))
- def format(n):
- ("{}" * n).format(*(i for i in range(n)))
- def plus(n):
- s = ""
- for i in range(n):
- s += str(i)
上面 3 個函數(shù)分別表示用「join」和「format」還有「+」操作來連接字符串,從 0 到 n,總共 n 個數(shù)字連接起來構(gòu)成一個新的字符串,形如:1234567891011……n。
下面是測試腳本:
每組取了15個樣本數(shù)據(jù),分別用 1,2,4,8,… 8192 個數(shù)字相連接,得到的統(tǒng)計數(shù)據(jù)可以看出,在數(shù)據(jù)量非常少的時候,三者效率幾乎沒什么差異,當(dāng)少于20個字符串連接時,用「+」效率甚至更高,不過,隨著字符串的個數(shù)增多,「join」方法發(fā)揮出來效果了,而用「+」越來越慢。這點無論是 python2 還是 python3 基本上是一樣的。
python2.7.10
python3.6.0
所以結(jié)論是:如果連接的字符串很少,只有幾個或者十幾個,完全可以通過「+」來連接,畢竟這種方式更直白,而超過一定個數(shù)之后,則應(yīng)該采用「join」方法,只有在操作大數(shù)據(jù)的時候,兩者的對比才明顯。
通過現(xiàn)象看本質(zhì)才能做到知其然并知其所以然。Cpython 編譯器內(nèi)部其實針對字符串做了非常多的優(yōu)化工作。
***,做任何事我們都不能僅憑三言兩語就聽信于人,而應(yīng)該帶著質(zhì)疑的精神去探索這個世界。
【本文是51CTO專欄作者“劉志軍”的原創(chuàng)文章,作者微信公眾號:Python之禪(VTtalk)】