Python 為什么能支持任意的真值判斷?
Python 在涉及真值判斷(Truth Value Testing)時,語法很簡便。
比如,在判斷某個對象是否不為 None 時,或者判斷容器對象是否不為空時,并不需要顯示地寫出判斷條件,只需要在 if 或 while 關(guān)鍵字后面直接寫上該對象即可。
下圖以列表為例,if my_list 這個簡短的寫法可以表達(dá)出兩層意思:
如果需要作出相反的判斷,即“如果為 None 或為空”,只需要寫成if not my_list 即可。
與眾不同的真值判斷方式
通常而言,當(dāng)一個值本身是布爾類型時,寫成"if xxx"(如果真),在語義上就很好理解。如果 xxx 本身不是布爾類型時,寫成“if xxx”(如果某東西),則在語義上并不好理解。
在 C/C++/Java 之類的靜態(tài)語言中,通常要先基于 xxx 作一個比較操作,比如“if (xxx == null)”,以此得到一個布爾類型的值的結(jié)果,然后再進(jìn)行真值判斷。否則的話,若“if xxx”中有非布爾類型的值,則會報類型錯誤。
Python 這門動態(tài)語言在這種場景中表現(xiàn)出了一種靈活性,那么,我們的問題來了:為什么 Python 不需要先做一次比較操作,直接就能對任意對象作真值判斷呢?
先來看看文檔 中對真值判斷的描述:

簡單而言,Python 的任何對象都可以用在 if 或 while 或布爾操作(and、or、not)中,默認(rèn)情況下認(rèn)為它是 true,除非它有__bool__() 方法返回False 或者有__len__() 方法返回0 。
對于前面的例子,my_list 沒有__bool__() 方法,但是它有__len__() 方法,所以它是否為 true,取決于這個方法的返回值。
真值判斷的字節(jié)碼
接著,我們繼續(xù)刨根問底:Python 為什么可以支持如此寬泛的真值判斷呢?在執(zhí)行if xxx 這樣的語句時,它到底在做些什么?
對于第一個問題,Python 有個內(nèi)置的 bool() 類型,可以將任意對象轉(zhuǎn)化成布爾值。那么,這是否意味著 Python 在進(jìn)行真值判斷時,會隱式地 調(diào)用 bool() 呢(即轉(zhuǎn)化成if bool(xxx))?(答案為否,下文有分析)
對于第二個問題,可以先用dis 模塊來查看下:
POP_JUMP_IF_FALSE指令對應(yīng)的是 if 語句那行,它的含義是:
If TOS is false, sets the bytecode counter to target. TOS is popped.
如果棧頂元素為 false,則跳轉(zhuǎn)到目標(biāo)位置。
這里只有跳轉(zhuǎn)動作的描述,仍看不到一個普通對象是如何變成布爾對象的。
Python 在解釋器中到底是如何實現(xiàn)真值判斷的呢?
真值判斷的源碼實現(xiàn)
在微信群友 Jo 的幫助下,我找到了 CPython 的源碼(文件:ceval.c、object.c):
可以看出,對于布爾類型的對象(即 Py_True 和 Py_False),代碼會進(jìn)入到快速處理的分支;而對于其它對象,則會用 PyObject_IsTrue() 計算出一個 int 類型的值。
PyObject_IsTrue() 函數(shù)在計算過程中,依次會獲取 nb_bool、mp_length 和 sq_length 的值,對應(yīng)的應(yīng)該就是 __bool__() 和 __len__() 這兩個魔術(shù)方法的返回值。
這個過程就是前文中所引用的官方文檔的描述,正是我們想要找的答案!
另外,對于內(nèi)置的 bool(),它的核心實現(xiàn)邏輯正是上面的 PyObject_IsTrue() 函數(shù),源碼如下(boolobject.c):
所以,Python 在對普通對象作真值判斷時,并沒有隱式地調(diào)用 bool(),相反它調(diào)用了一個獨(dú)立的函數(shù)(PyObject_IsTrue()),而這個函數(shù)又被 bool() 所使用。
也就是說,bool() 與 if/while 語句對普通對象的真值判斷,事實上是基本相同的處理邏輯。 知道了原理,就會明白if bool(xxx) 這種寫法是多此一舉的了(我曾見到過)。
至此,我們已經(jīng)回答了前文中提出的問題。
驗證真值判斷的過程
接下來,有 3 個測試?yán)?,可以作進(jìn)一步的驗證:
你可以暫停而思考下:bool(Test1) 與 bool(Test1()) 各是什么結(jié)果?然后依次判斷剩下的兩個類,結(jié)果又會是什么?
揭曉答案:
- bool(Test1) # True
- bool(Test2) # True
- bool(Test3) # True
- bool(Test1()) # True
- bool(Test2()) # False
- bool(Test3()) # True
原因如下:
- 類對象沒被實例化時,bool() 不會調(diào)用它的 __bool__() 或 __len__() 這兩個魔術(shù)方法
- 類對象被實例化后,若同時存在 __bool__() 或 __len__() 魔術(shù)方法,則 bool() 會先調(diào)用 __bool__() 方法(PS:這個方法要求返回值必須為 bool 類型,因此只要有它,就必然不需要再用__len__() 方法來判斷真假)
數(shù)字類型如何作真值判斷?
除了這 3 個例子,還有一種情況值得驗證,那就是對于數(shù)字類型,它們是怎么做真值判斷的呢?
我們可以驗證一下數(shù)字類型是否擁有那兩個魔術(shù)方法:
- hasattr(2020, "__bool__")
- hasattr(2020, "__len__")
不難驗證出,數(shù)字擁有的是 __bool__() 魔術(shù)方法,并沒有__len__() 魔術(shù)方法,而且所有類型的數(shù)字其實被分成了兩類:
- __bool__() 返回 False:所有表示 0 的數(shù)字,例如0, 0.0, 0j, Decimal(0), Fraction(0, 1)
- __bool__() 返回 True:所有其它非 0 的數(shù)字
文章小結(jié)
Python 中if xxx 這種簡便的寫法,雖然是正規(guī)的真值判斷語法,并它但并不符合常規(guī)的語義。在 C/C++/Java 之類的語言中,要么 xxx 本身是布爾類型的值,要么是一種可返回布爾類型值的操作,但是在 Python 中,這個“xxx”竟然還可以是任意的 Python 對象!
本文通過對文檔、字節(jié)碼和 CPython 解釋器的源碼逐步分析,發(fā)現(xiàn)了 Python 的真值判斷過程并不簡單,可以提煉出以下的幾個要點(diǎn):
- if/while 是隱性的布爾操作符: 它們除了有“判斷”真假的作用,還具有隱式地將普通對象計算出布爾結(jié)果的功能。實際的操作是解釋器根據(jù)“POP_JUMP_IF_FALSE”指令來完成的,其核心邏輯跟內(nèi)置的 bool() 是共用了一個底層方法
- 真值判斷過程依賴兩個魔術(shù)方法: 除非被判斷對象有__bool__() 方法返回False 或者有__len__() 方法返回0 ,否則布爾操作的結(jié)果都是 True。兩個魔術(shù)方法總是會先計算__bool__()
- 數(shù)字類型也可做真值判斷: 數(shù)字有__bool__() 魔術(shù)方法,但沒有__len__() 魔術(shù)方法,除了表示 0 的數(shù)字為 False,其它數(shù)字都為 True