抽絲剝繭,深入剖析 Python 如何實(shí)現(xiàn)變量交換!
Python 程序員肯定知道 a,b = b,a,這句話用來交換兩個(gè)變量。相較于其它語言需要引入一個(gè) temp 來臨時(shí)存儲變量的做法,Python 的這種寫法無疑非常優(yōu)雅。
簡潔優(yōu)雅的 C 寫法:
- int a = 1;
- int b = 2;
- int temp;
- temp = a;
- a = b;
- b = temp;
簡潔優(yōu)雅的 Python 寫法:
- a,b = 1,2
- a,bb = b,a
雖然語法非常方便,但我們始終不曾想過:它是怎么運(yùn)作的?背后支撐它的機(jī)制是什么?下面讓我們一步步分析它。
通俗的說法
最常見的解釋是:
a,b = b,a 中右側(cè)是元組表達(dá)式,即 b,a 是一個(gè)兩個(gè)元素的 tuple(a,b)。表達(dá)式左側(cè)是兩個(gè)待分配元素,而 = 相當(dāng)于元組元素拆包賦值操作。
這種方法,理解起來最簡單,但實(shí)際是這種情況么?
讓我們從字節(jié)碼上看下,是不是這種情況。
從字節(jié)碼一窺交換變量
大家可能不太了解 Python 字節(jié)碼。Python 解釋器是一個(gè)基于棧的虛擬機(jī)。Python 解釋器就是編譯、解釋 Python 代碼的二進(jìn)制程序。
虛擬機(jī)是一種執(zhí)行代碼的容器,相較于二進(jìn)制代碼具有方便移植的特點(diǎn)。而 Python 的虛擬機(jī)就是棧機(jī)器。
Python 中函數(shù)調(diào)用、變量賦值等操作,最后都轉(zhuǎn)換為對棧的操作。這些對棧的具體操作,就保存在字節(jié)碼里。
dis 模塊可以反編譯字節(jié)碼,使其變成人類可讀的棧機(jī)器指令。如下,我們看反編譯 a,b=b,a 的代碼。
- >>> import dis
- >>> dis.dis("a,bb=b,a")
- 1 0 LOAD_NAME 0 (b)
- 2 LOAD_NAME 1 (a)
- 4 ROT_TWO
- 6 STORE_NAME 1 (a)
- 8 STORE_NAME 0 (b)
- 10 LOAD_CONST 0 (None)
- 12 RETURN_VALUE
可見,在 Python 虛擬機(jī)的棧上,我們按照表達(dá)式右側(cè)的 b,a 的順序,先后壓入計(jì)算棧中,然后用一個(gè)重要指令 ROT_TWO,這個(gè)操作交換了 a 和 b 的位置,最后 STORE_NAME 操作將棧頂?shù)膬蓚€(gè)元素先后彈出,傳遞給 a 和 b 元素。
棧的特性是先進(jìn)后出(FILO)。當(dāng)我們按b,a順序壓入棧的時(shí)候,彈出時(shí)先出的就是a,再彈出就是b。STORE_NAME指令會把棧頂元素彈出,并關(guān)聯(lián)到相應(yīng)變量上。
如果沒有第 4 列的指令 ROT_TWO,此次 STORE_NAME 彈出的第一個(gè)變量會是后壓棧的 a,這樣就是 a=a 的效果。有了 ROT_TWO 則完成了變量的交換。
好了,我們知道靠壓棧、彈棧和交換棧頂?shù)膬蓚€(gè)元素,實(shí)現(xiàn)了 a,b = b,a 的操作。
同時(shí),我們也知道了,上訴元組拆包賦值的說法,是不恰當(dāng)?shù)摹?/p>
那 ROT_TWO 是怎么具體操作的呢?
后臺怎么執(zhí)行?
見名知意,可以猜出來 ROT_TWO 是交換兩個(gè)棧頂變量的操作。在 Python 源代碼的層面上,來看是如何交換兩個(gè)棧頂?shù)脑亍?/p>
下載 Python 源代碼,進(jìn)入 Python/ceval.c 文件,在 1101 行,我們看到了 ROT_TWO 的操作。
- TARGET(ROT_TWO){
- PyObject *top = TOP();
- PyObject *second = SECOND();
- SET_TOP(second);
- SET_SECOND(top);
- FAST_DISPATCH();
- }
代碼比較簡單,我們用 TOP 和 SECOND 宏獲取了棧上的 a,b 元素,然后再用 SET_TOP、SET_SECOND 宏把值寫入棧中。以此完成交換棧頂元素的操作。
求值順序的奇怪現(xiàn)象!
下面,我們來看一個(gè)奇怪的現(xiàn)象,在這篇文章里,也可以看到這個(gè)現(xiàn)象。如下,我們試圖排序這個(gè)列表:
- >>> a = [0, 1, 3, 2, 4]
- >>> a[a[2]], a[2] = a[2], a[a[2]]
- >>> a
- >>> [0, 1, 2, 3, 4]
- >>> a = [0, 1, 3, 2, 4]
- >>> a[2], a[a[2]] = a[a[2]],a[2]
- >>> a
- >>> [0, 1, 3, 3, 4]
按照理解 a,b = b,a 和 b,a=a,b 是一樣的結(jié)果,但從上例中我們看到,這兩者的結(jié)果是不同的。
導(dǎo)致這一現(xiàn)象的原因在于:求值的順序。毫無疑問,整個(gè)表達(dá)式先求右側(cè)的兩個(gè)元素,然后作為常數(shù)保存起來。最后賦值給左側(cè)的兩個(gè)變量。
最后賦值時(shí),需要注意,我們從左到右依次賦值,如果 a[2] 先修改的話,勢必會影響到其后的 a[a[2]] 的列表下標(biāo)。
“你可以使用反匯編代碼,來分析產(chǎn)生這個(gè)現(xiàn)象的具體步驟。” |
奇怪的變回拆包現(xiàn)象!!
當(dāng)我們使用常數(shù)作為右側(cè)元組,來給左側(cè)變量賦值時(shí);或使用超過三個(gè)元素,來完成便捷交換時(shí),其在字節(jié)碼層次上便不是 ROT_TWO 這種操作了。
- >>> dis.dis("a,b,c,d=b,c,d,a")
- 1 0 LOAD_NAME
- 3 LOAD_NAME
- 6 LOAD_NAME
- 9 LOAD_NAME
- 12 BUILD_TUPLE
- 15 UNPACK_SEQUENCE
- 18 STORE_NAME
- 21 STORE_NAME
- 24 STORE_NAME
- 27 STORE_NAME
- 30 LOAD_CONST
- 33 RETURN_VALUE
- >>>
很明顯,這里是在偏移 12 字節(jié)處 BUILD_TUPLE 組裝元組,然后解包賦值給左側(cè)變量。上文所述的通俗說法,在這里又成立了!
也就是說,當(dāng)小于四個(gè)元素交換時(shí),Python 采用優(yōu)化的棧操作來完成交換。
當(dāng)使用常量或者超過四個(gè)元素時(shí),采用元組拆包賦值的方式來交換。
至于為什么是四個(gè)元素,應(yīng)該是因?yàn)?Python 最多支持到 ROT_THREE 操作,四個(gè)元素的話,系統(tǒng)不知道該怎么優(yōu)化了。但在新版本的 Python 中,我看到了 ROT_FOUR 操作,所以這時(shí)候,四個(gè)元素還是 ROT_* 操作來優(yōu)化的。
- >>>import opcode
- >>>opcode.opmap["ROT_THREE"]
- 3
此例中,該版本 Python 支持 ROT_THREE 操作,你也可以使用 ROT_FOUR 查看自己 Python 是否支持,進(jìn)而確定是否可以四個(gè)以上元素便捷交換。