為什么 Python 的 f-string 可以連接字符串與數(shù)字?
毫無疑問,Python 是一門強(qiáng)類型語言。強(qiáng)類型語言。強(qiáng)類型語言!
這就意味著,不同類型的對(duì)象通常需要先做顯式地類型轉(zhuǎn)化, 然后才能進(jìn)行某些操作。
下面以字符串和數(shù)字為例,看看強(qiáng)行操作會(huì)產(chǎn)生什么結(jié)果:
- >>> "Python貓" + 666
- Traceback (most recent call last):
- File "<stdin>", line 1, in <module>
- TypeError: can only concatenate str (not "int") to str
它報(bào)類型錯(cuò)誤了(TypeError),說字符串只能連接(concatenate)字符串,不能連接 int 類型。 這正是強(qiáng)類型語言的基本約束。
但是,如果我們先把數(shù)字“轉(zhuǎn)化”成字符串類型,再執(zhí)行“+”操作,就不會(huì)報(bào)錯(cuò)了:
- >>> "Python貓" + str(666)
- 'Python貓666'
上面的這個(gè)例子,對(duì)讀者們來說,應(yīng)該并不難理解。
由此,我們要引出一個(gè)問題:如何在不作顯式類型轉(zhuǎn)化的情況下,進(jìn)行字符串與數(shù)字類型的拼接呢?
在《詳解Python拼接字符串的七種方式》這篇文章中,它梳理了七種拼接字符串的寫法,我們可以逐個(gè)來試驗(yàn)一下。
幾種字符串拼接方式:
1、格式化類:%、format()、template
2、拼接類:+、()、join()
3、插值類:f-string
為了節(jié)省篇幅,此處直接把可以順利拼接的 4 種寫法羅列如下:
- >>> "%s %d" % ("Python貓", 666)
- 'Python貓 666'
- >>> from string import Template
- >>> s = Template('${s1}${s2}')
- >>> s.safe_substitute(s1='Python貓',s2=666)
- 'Python貓666'
- >>> "Python貓{}".format(666)
- 'Python貓666'
- >>> num = 666
- >>> f"Python貓{num}"
- 'Python貓666'
第一種寫法(即 % 格式化)來自古老的 C 語言,其中的“%d”是一個(gè)占位符,表示它將要接收一個(gè)整數(shù),并格式化成字符串。
第二和第三種寫法,它們是第一種寫法的升級(jí)版,不同的是,它們的占位符是通用型的,不必指定“%s”、“%d”等等明確的類型。這兩種寫法中,數(shù)字類型的參數(shù)被傳給特定的格式化方法(即 safe_substitute 與 format),在這些方法的內(nèi)部,它們會(huì)作類型轉(zhuǎn)化處理。
可以說,上述三種寫法都不難理解,它們的意圖都有跡可循。
但是,現(xiàn)在再看看最后一種寫法,也就是 f-string 寫法,似乎就不是那么明顯了。
首先,在字符串內(nèi)部,它并沒有像“%格式化”那樣指定占位符的類型;其次,所要拼接的數(shù)字并沒有作為任何函數(shù)的參數(shù)來傳遞。
也就是說,在明面上根本看不出任何要作類型轉(zhuǎn)化的意圖。但是,由于我們已知 Python 是強(qiáng)類型語言,已知數(shù)字類型絕對(duì)不可能直接拼接到字符串里,因此,只能說明 f-string 語法在底層作了某種類型轉(zhuǎn)化的操作!
那么,我們就可以再提出一個(gè)新的問題:f-string 語法在處理字符串與數(shù)字時(shí),是如何實(shí)現(xiàn)數(shù)字的類型轉(zhuǎn)化的呢?
也許有的讀者會(huì)猜想它是調(diào)用了內(nèi)置的 str() 或 repr()(或它們對(duì)應(yīng)的魔術(shù)方法__str__() 與 __repr__()),從而實(shí)現(xiàn)類型轉(zhuǎn)化,但是,答案并沒有如此簡(jiǎn)單!
f-string 語法是在 Python 3.6 版本引入的。為了省事,我們直接找到 PEP-498 文檔,在里面查閱看是否有關(guān)于實(shí)現(xiàn)原理的線索。
文檔地址:https://www.python.org/dev/peps/pep-0498
PEP 里提到f-string 的語法格式是這樣的:
- f'<text> { <expression> <optional !s, !r, or !a> <optional : format specifier> } <text> ...'
其中,花括號(hào)里的內(nèi)容就是要作格式化的內(nèi)容,除去可選的“optional”部分后,“expression”部分就是真正要處理的內(nèi)容。對(duì)應(yīng)前文的例子,數(shù)字 666 就是一個(gè) expression。
expression 會(huì)按 __format__ 協(xié)議進(jìn)行格式化,但是并不會(huì)直接調(diào)用 __format__() 這個(gè)方法。
文檔上指出,實(shí)際的執(zhí)行過程等效于type(value).__format__(value, format_spec)或者 format(value, format_spec) 。
事實(shí)上,字符串對(duì)象的 foramt() 方法跟 Python 內(nèi)置的 foramt() 函數(shù),它們都會(huì)調(diào)用__format__() 魔術(shù)方法,所以,f-string 其實(shí)是前文中 format() 格式化寫法的升級(jí)版。
在默認(rèn)情況下,format_spec 是一個(gè)空字符串,而format(value, "") 的效果等同于str(value) ,因此,在不指定其它 format_spec 的情況下,可以簡(jiǎn)單地認(rèn)為 f-string 就是調(diào)用了 str() 來作的類型轉(zhuǎn)化……
至此,我們看到了 f-string 的實(shí)現(xiàn)原理,明白了它在拼接字符串與數(shù)字時(shí),效果等效于前文的 format() 格式化方法,也等效于使用 str() 進(jìn)行類型轉(zhuǎn)化。
本文轉(zhuǎn)載自微信公眾號(hào)「Python貓」,可以通過以下二維碼關(guān)注。轉(zhuǎn)載本文請(qǐng)聯(lián)系Python貓公眾號(hào)。