聊一聊 Python 的換行以及轉(zhuǎn)義
Python 里面可以通過換行來標(biāo)識一行語句的結(jié)束,當(dāng)你在一行的末尾敲擊 Enter 鍵時,便可開始新的一行語句。
name = "高老師"
print(name) # 高老師
這段代碼很簡單,因為 name = "高老師" 后面已經(jīng)沒有內(nèi)容了,是一個換行,那么就代表這個語句結(jié)束了。但是在 Python 中我們還可以指定分號,表示該語句結(jié)束了。
name = "高老師"; print(name); age = 18; print(age)
"""
高老師
18
"""
可以看到當(dāng)我們在 name = "高老師" 后面指定了分號之后,就代表該語句結(jié)束了。但是 Python 的語法解析并不會直接跳到下一行,而是繼續(xù)向后尋找,即便當(dāng)中出現(xiàn)了空格。
由于都在一行,所以解釋器會找到 print(name),然后繼續(xù)向后尋找。盡管這么做是可以的,但不推薦這種寫法,這種寫法純屬在惡作劇,當(dāng)然我們這里演示就不算了。
再比如 if 語句,有時候會出現(xiàn)寫在一行的情況。
a = 123
if a > 100: print("a > 100"); print("兩個 print 具有相同的縮進")
"""
a > 100
兩個 print 具有相同的縮進
"""
如果 if 語句寫在了一行,那么語句塊的代碼就應(yīng)該只有一句,像我們這里的兩個 print 就不應(yīng)該寫在同一行。并且這兩個 print 的縮進層級是一樣的,即:
a = 123
if a > 100: print("a > 100"); print("兩個 print 具有相同的縮進")
# 等價于
if a > 100:
print("a > 100")
print("兩個 print 具有相同的縮進")
關(guān)于 Python 中的語句,根據(jù)交互式界面的表現(xiàn)形式我們可以分為兩種:
圖片
我們看到當(dāng)輸入 num = 123 按下回車的時候,下一行的開始出現(xiàn)的是 >>>,這表示上一行語句已經(jīng)結(jié)束了。但是當(dāng)輸入 if num > 100: 按下回車的時候,下一行出現(xiàn)的是 ...,這表示這行語句還沒有結(jié)束。
像 if xx:,for xx:,while xx:,def xx():,class xx: 等等這樣帶有 : 的語句,一般是需要多行來表達的,一旦按下回車,就意味著下面肯定還有內(nèi)容,而且還會帶有縮進,在交互式界面中就會出現(xiàn) ...。而這樣的語句我們在一行中只能出現(xiàn)一次,比如:
圖片
這樣寫是無法通過語法檢測的,因為當(dāng)中出現(xiàn)了兩個 :,我們說這樣的語句一行只能出現(xiàn)一次。當(dāng)然肯定也不會有人這么做,所以這些知道就好。
說完了換行,我們再來聊一聊反斜杠。
如果一行代碼比較長,我們需要分開多行來寫該怎么辦呢?答案是使用反斜杠 \,反斜杠在 Python 中表示轉(zhuǎn)義。
a = \
123456
# \ 表示轉(zhuǎn)義,意思就是使后面的換行符失去效果
# 這樣 Python 就不會認(rèn)為這條語句結(jié)束了
# 因為 123456 前面還有一些空格,因此等價于 a = 123456
a = \
123456
# 這行代碼就等價于 a = 123456 了
再比如字符串:
s = "這是一段很" "長的字符串" "具體有多長我也不知道"
print(s) # 這是一段很長的字符串具體有多長我也不知道
Python 的字符串比較特別的是,不需要顯式的使用加號。如果使用了加號,像這段代碼就會先創(chuàng)建 3 個字符串,然后再拼接在一起。如果不使用加號,那么 Python 在語法解析的時候就會知道這是一個字符串,只不過分開寫了。
s = "這是一段很" \
"長的字符串" \
"具體有多長我也不知道"
當(dāng)然我們也可以分開寫,但是要使用 \ 將換行符轉(zhuǎn)義掉。但是下面的做法則不行:
圖片
如果把 \ 改成 + 號就不行了,這個在 Go 里面可以,但是不同語言的語法檢測不一樣。因為 + 后面沒有內(nèi)容了,直接換行語句結(jié)束,那么這是無法通過語法檢測的,所以 + 后面出現(xiàn)了紅色波浪線。
而且我們看到第三行字符串兩邊也出現(xiàn)了紅色波浪線,這是縮進不對造成的,因為上面的語句已經(jīng)結(jié)束,所以這是一條單獨的語句,應(yīng)該靠左對齊。這里顯然沒有對齊,而是出現(xiàn)了縮進。
圖片
這樣寫是可以的,此時就等價于"這是一段很長的字符串" + "具體有多長我也不知道"。
但是還有一個特殊情況,那就是出現(xiàn)了括號。
圖片
這樣寫也是沒有問題的,因為 Python 在檢測代碼的時候發(fā)現(xiàn)了小括號的左半部分,那么即便出現(xiàn)了換行,Python 也不會認(rèn)為語句結(jié)束了。只有當(dāng)再找到小括號的右半部分,Python 才會認(rèn)為語句結(jié)束,所以此時我們是不需要 \ 的。
再來看幾個需要動點腦筋的:
s = "這是一段很"
"長的字符串"
"具體有多長我也不知道"
print(s)
# 會打印什么呢?
只會打印這是一段很,因為遇到換行符語句結(jié)束了,下面兩行只是創(chuàng)建兩個字符串對象,而且還沒有賦值,因此創(chuàng)建完之后就被銷毀了。
s = "這是一段很" \
"長的字符串"; \
"具體有多長我也不知道"
print(s)
# 會打印什么呢?注意第二行出現(xiàn)了;
會打印這是一段很長的字符串,因為我們手動指定了 ;,表示結(jié)束這段語句。后面出現(xiàn)的"具體有多長我也不知道"也是只創(chuàng)建了一個字符串對象,沒有賦值,創(chuàng)建完畢直接銷毀。
因此上面的代碼就等價于:
s = "這是一段很長的字符串"; "具體有多長我也不知道"
# 或者等價于
s = "這是一段很長的字符串"
"具體有多長我也不知道"
要是我們將第二行結(jié)尾的 \ 給去掉,會怎么樣?
圖片
可以看到如果把第二行的 \ 去掉了,這里又出現(xiàn)了紅色波浪線,這個問題我們上面說過了。因為第二行出現(xiàn)了 ;,那么第三行就是單獨的語句,所以應(yīng)該要靠在左邊。
圖片
這樣寫是沒問題的,但第三行還是如我們之前所說,只是創(chuàng)建了一個字符串對象。
Python 的轉(zhuǎn)義
Python 的轉(zhuǎn)義也是一個老生常談的問題了,它是通過反斜杠來實現(xiàn)的。但 \ 有兩個作用:
- 和一些特定的字符組合,從而具備特殊意義(\n, \t, \r 等等)
- 使 Python 的一些本來就具有特殊意義的字符失去其意義。
s = "my name is \nVan"
print(s)
"""
my name is
Van
"""
s = "my name is \"Van"
print(s)
"""
my name is "Van
"""
我們看到 \ 和字符 n 組合,整體形成了換行。而 \ 和 " 組合則并不是變成新的什么東西,而是使 " 失去其本來的意義。因為遇到 " 表示字符串結(jié)束了,但是前面出現(xiàn)了 \,使得 " 失去了其具有的意義,遇到下一個 " 才表示字符串結(jié)束。而中間那個 " 則是正常輸出了出來,但是 \ 卻不見了,因為 \ 和 " 組合就等于 "。
說到這兒,再補充一下 Python 字符串的幾種表示方式:
print(hex(97), hex(98), hex(99))
"""
0x61 0x62 0x63
"""
# 在字符串中,每個字符還可以使用 \x 加兩個 16 進制數(shù)字表示
print("\x61\x62\x63")
"""
abc
"""
# 或者使用 \ 加上三個 8 進制數(shù)字表示
print(oct(97), oct(98), oct(99))
"""
0o141 0o142 0o143
"""
print("\141\142\143")
"""
abc
"""
# 不過上面只能表示 ASCII 字符串,因為一個漢字占三個字節(jié)
# 所以當(dāng)包含一個字節(jié)無法表示的字符時,解析就會出現(xiàn)亂碼
print("\xe9\xab\x98\xe8\x80\x81\xe5\xb8\x88")
"""
é??è?????
"""
print(b"\xe9\xab\x98\xe8\x80\x81\xe5\xb8\x88".decode("utf-8"))
"""
高老師
"""
當(dāng)然,在 Python 里面每個字符還可以使用 \u 或者 \U 來表示。
# \u 表示 unicode,后面跟 4 個十六進制數(shù)表示的 unicode 碼點
print(hex(97), hex(98), hex(99))
"""
0x61 0x62 0x63
"""
print("\u0061 \u0062 \u0063")
"""
a b c
"""
print(ord("高"), ord("老"), ord("師"))
"""
39640 32769 24072
"""
print(hex(39640), hex(32769), hex(24072))
"""
0x9ad8 0x8001 0x5e08
"""
print("\u9ad8 \u8001 \u5e08")
"""
高 老 師
"""
# 如果是 emoji,它的碼點超出了 FFFF
# 此時 4 個 16 進制數(shù)無法表示,因此需要 8 個十六進制數(shù)
print(hex(ord("??")), hex(ord("??")))
"""
0x1f923 0x1f921
"""
# 如果是 4 個十六進制數(shù),那么可以使用 \u 或者 \U
# 如果是 8 個十六進制數(shù),那么只能使用 \U
print(f"\U0001f923 -> \U0001f921")
"""
?? -> ??
"""
還是蠻有趣的,Python 字符串的表示方式還挺豐富。
Python 的 r 前綴
如果字符串的開頭出現(xiàn)了 r,會是什么情況呢?
s1 = "my name is \nVan"
s2 = r"my name is \nVan"
print(s1)
"""
my name is
Van
"""
print(s2)
"""
my name is \nVan
"""
如果是 r"" 這種形式,表示的是這個字符串是原生的,這里的 r 表示 raw。里面出現(xiàn)的任何東西都當(dāng)成普通字符串,什么 \n 啊,\t 啊,就是普通的字符串。但是我們說過,\ 具有兩個作用:
- 和某些特殊字符組合,從而具備一些特殊意義
- 使得某些本來就具有特殊意義的字符,失去其意義
而 r"" 這種形式,只會限制 \ 的第一個作用,卻不會限制其第二個作用。
圖片
我們看到即使加上了前綴 r,第一行語句還是不合法的,因為 " 表示字符串的邊界,即使加上了 r,對于 " 依舊是無能為力的,這時候還是需要 \ 進行轉(zhuǎn)義。
s1 = "my name is \"Van"
s2 = r"my name is \"Van"
print(s1)
print(s2)
"""
my name is "Van
my name is \"Van
"""
然后我們又觀察到了一個奇特的現(xiàn)象,當(dāng)不加 r 的時候,\" 就表示 ",而加上了 r,\" 則表示 \",因為 r 表示原生的,\ 會原原本本的輸出出來。但我們說了,r 不會限制 \ 的第二個作用,所以 \ 不僅輸出了出來,還使得 " 失去了其原本的意義。
最后引出 Python 中一個比較讓人費解的問題,估計已經(jīng)有人猜到了,那就是字符串結(jié)尾出現(xiàn)了 \。
圖片
兩行代碼都是不合法的。
第一行代碼不合法是因為右邊的 " 表示字符串的結(jié)尾,現(xiàn)在我們使用 \ 讓其失去了本來的意義,而后面又是空行導(dǎo)致相當(dāng)于寫了一半的語句結(jié)束了,所以不合法能夠理解。
第二行同樣不合法,因為 r 限制不了 \ 的第二個作用,也就是第二行的 \ 依舊會使得 " 失去其意義,導(dǎo)致同樣是寫了一半的語句強行結(jié)束了。因此解決辦法就是再來一個 \,形成 \\。
s1 = "my name is Van\\"
s2 = r"my name is Van\\"
print(s1)
print(s2)
"""
my name is Van\
my name is Van\\
"""
第二行代碼的輸出多了一個 \,因為不加 r 的話,\\ 等價于 \,因為第一個 \ 在使第二個 \ 失去意義的時候,其使命也就結(jié)束了,因此只會輸出一個 \。
但是對于有 r 前綴的字符串來說,\ 就表示普通的字符,所以是什么就輸出什么,只不過即便它是普通字符,依舊具備第二個功能。因此對于第二行有前綴 r 的字符串來說,第一個 \ 不僅讓第二個 \ 失去了意義,使得它不能再干擾結(jié)尾的 ",而且兩個 \ 都會原本的輸出出來。
如果 \ 出現(xiàn)在其他位置呢?
s1 = "my nam\e is Van"
s2 = r"my nam\e is Van"
print(s1)
print(s2)
"""
my nam\e is Van
my nam\e is Van
"""
輸出是一樣的,因為 \ 和字符 e 無法形成具有特殊意義的字符,而且 e 也是一個普通的字符,不具備什么特殊意義。所以對于 s1 來說,就直接把 \ 完整的輸出了,但是不推薦這種寫法。
對于 s1 來說,應(yīng)該指定兩個 \\。如果就只想寫一個 \ 的話,那么應(yīng)該指定前綴 r,所以 s2 是沒問題的。