為什么說(shuō) Python 內(nèi)置函數(shù)并不是萬(wàn)能的?
在Python貓的上一篇文章中,我們對(duì)比了兩種創(chuàng)建列表的方法,即字面量用法 [] 與內(nèi)置類(lèi)型用法 list(),進(jìn)而分析出它們?cè)谶\(yùn)行速度上的差異。
在分析為什么 list() 會(huì)更慢的時(shí)候,文中說(shuō)到它需要經(jīng)過(guò)名稱查找與函數(shù)調(diào)用兩個(gè)步驟,那么,這就引出了一個(gè)新的問(wèn)題:list() 不是內(nèi)置類(lèi)型么,為什么它不能直接就調(diào)用創(chuàng)建列表的邏輯呢?也就是說(shuō),為什么解釋器必須經(jīng)過(guò)名稱查找,才能“認(rèn)識(shí)”到該做什么呢?
其實(shí)原因很簡(jiǎn)單:內(nèi)置函數(shù)/內(nèi)置類(lèi)型的名稱并不是關(guān)鍵字,它們只是解釋器內(nèi)置的一種便捷功能,方便開(kāi)發(fā)者開(kāi)箱即用而已。
PS:內(nèi)置函數(shù) built-in function 和內(nèi)置類(lèi)型 built-in type 很相似,但 list() 實(shí)際是一種內(nèi)置類(lèi)型而不是內(nèi)置函數(shù)。我曾對(duì)這兩種易混淆的概念做過(guò)辨析,請(qǐng)查看這篇文章。為了方便理解與表述,以下統(tǒng)稱為內(nèi)置函數(shù)。
1、內(nèi)置函數(shù)的查找優(yōu)先級(jí)最低
內(nèi)置函數(shù)的名稱并不屬于關(guān)鍵字,它們是可以被重新賦值的。
比如下面這個(gè)例子:
- # 正常調(diào)用內(nèi)置函數(shù)
- list(range(3)) # 結(jié)果:[0, 1, 2]
- # 定義任意函數(shù),然后賦值給 list
- def test(n):
- print("Hello World!")
- list = test
- list(range(3)) # 結(jié)果:Hello World!
在這個(gè)例子中,我們將自定義的 test 賦值給了 list,程序并沒(méi)有報(bào)錯(cuò)。這個(gè)例子甚至還可以改成直接定義新的同名函數(shù),即"def list(): …"。
這說(shuō)明了 list 并不是 Python 限定的關(guān)鍵字/保留字。
查看官方文檔,可以發(fā)現(xiàn) Python3.9 有35個(gè)關(guān)鍵字,明細(xì)如下:
如果我們將上例的 test 賦值給任意一個(gè)關(guān)鍵字,例如"pass=test",就會(huì)報(bào)錯(cuò):SyntaxError: invalid syntax。
由此,我們可以從這個(gè)角度看出內(nèi)置函數(shù)并不是萬(wàn)能的:它們的名稱并不像關(guān)鍵字那般穩(wěn)固不變,雖然它們處在系統(tǒng)內(nèi)置作用域里,但是卻可以被用戶局部作用域的對(duì)象所輕松攔截掉!
因?yàn)榻忉屍鞑檎颐Q的順序是“局部作用域->全局作用域->內(nèi)置作用域”,因此內(nèi)置函數(shù)其實(shí)是處在最低優(yōu)先級(jí)。
對(duì)于新手來(lái)說(shuō),這有一定的可能會(huì)發(fā)生意想不到的情況(內(nèi)置函數(shù)有 69 個(gè),要全記住是有難度的)。
那么,為什么 Python 不把所有內(nèi)置函數(shù)的名稱都設(shè)為不可復(fù)寫(xiě)的關(guān)鍵字呢?
一方面原因是它想控制關(guān)鍵字的數(shù)量,另一方面可能是想留給用戶更多的自由。內(nèi)置函數(shù)只是解釋器的推薦實(shí)現(xiàn)而已,開(kāi)發(fā)者可以根據(jù)需要,實(shí)現(xiàn)出與內(nèi)置函數(shù)同名的函數(shù)。
不過(guò),這樣的場(chǎng)景極少,而且開(kāi)發(fā)者一般會(huì)定義成不同名的函數(shù),以 Python 標(biāo)準(zhǔn)庫(kù)為例,ast模塊有 literal_eval() 函數(shù)(對(duì)標(biāo) eval() 內(nèi)置函數(shù))、pprint 模塊有 pprint() 函數(shù)(對(duì)標(biāo) print() 內(nèi)置函數(shù))、以及itertools模塊有 zip_longest() 函數(shù)(對(duì)標(biāo) zip() 內(nèi)置函數(shù))……
2、內(nèi)置函數(shù)可能不是最快的
由于內(nèi)置函數(shù)的名稱并非保留的關(guān)鍵字,以及它處于名稱查找的末位順序,所以內(nèi)置函數(shù)有可能不是最快的。
上篇文章展示了 [] 比 list() 快 2~3 倍的事實(shí),其實(shí)這還可以推廣到 str()、tuple()、set()、dict() 等等內(nèi)置類(lèi)型中,都是字面量用法稍稍快于內(nèi)置類(lèi)型用法。
對(duì)于這些內(nèi)置類(lèi)型,當(dāng)我們調(diào)用 xxx() 時(shí),可以簡(jiǎn)單理解成正在做類(lèi)的實(shí)例化。在面向?qū)ο笳Z(yǔ)言中,類(lèi)先實(shí)例化再使用,這是再正常不過(guò)的。
但是,這樣的做法有時(shí)也顯得繁瑣。為了方便使用,Python 給一些常用的內(nèi)置類(lèi)型提供了字面量表示法,也就是""、[]、()、{} 等等,表示字符串、列表、元組和字典等數(shù)據(jù)類(lèi)型。
文檔出處:https://docs.python.org/3/reference/lexical_analysis.html#delimiters
一般而言,所有編程語(yǔ)言都必須有一些字面量表示,但基本都局限在數(shù)字類(lèi)型、字符串、布爾類(lèi)型以及 null 之類(lèi)的基礎(chǔ)類(lèi)型。
Python 中還增加了幾種數(shù)據(jù)結(jié)構(gòu)類(lèi)型的字面量,所以是更為方便的,同時(shí)這也解釋了為什么內(nèi)置函數(shù)可能不是最快的。
一般而言,同樣的完備功能,內(nèi)置函數(shù)總是比我們自定義的函數(shù)要快,因?yàn)榻忉屍骺梢宰鲆恍┑讓拥膬?yōu)化,例如 len() 內(nèi)置函數(shù)肯定比用戶定義的 x.len() 函數(shù)快。
有些人據(jù)此形成了“內(nèi)置函數(shù)總是更快”的認(rèn)識(shí)誤區(qū)。
解釋器內(nèi)置函數(shù)相對(duì)于用戶定義函數(shù),前者接近于走后門(mén);而字面量表示法相對(duì)于內(nèi)置函數(shù),前者是在走更快的后門(mén)。
也就是說(shuō),在有字面量表示法的情況下,某些內(nèi)置函數(shù)/內(nèi)置類(lèi)型并不是最快的!
小結(jié)
誠(chéng)然,Python 本身并不是萬(wàn)能的,那它的任何語(yǔ)法構(gòu)成部分(內(nèi)置函數(shù)/類(lèi)型),就更不是萬(wàn)能的了。但是,一般我們會(huì)認(rèn)為內(nèi)置函數(shù)/類(lèi)型總歸是“高人一等”的,是受到諸多特殊優(yōu)待的,顯得像是“萬(wàn)能的”。
本文從“list() 竟然會(huì)敗給 []”破題,從兩個(gè)角度揭示了內(nèi)置函數(shù)其實(shí)存在著某種不足:內(nèi)置函數(shù)的名稱并不是關(guān)鍵字,而內(nèi)置作用域位于名稱查找的最低優(yōu)先級(jí),因此在調(diào)用時(shí),某些內(nèi)置函數(shù)/類(lèi)型的執(zhí)行速度就明顯慢于它們對(duì)應(yīng)的字面量表示法。
本文對(duì)上一個(gè)“Python為什么”話題做了延展討論,一方面充實(shí)了前面的內(nèi)容,另一方面,也有助于大家理解 Python 的幾個(gè)基礎(chǔ)概念及其實(shí)現(xiàn)。