較全面的Python字符串操作指南
字符串的定義
日常編碼中,大家會(huì)發(fā)現(xiàn),太多時(shí)候我們需要對(duì)數(shù)據(jù)進(jìn)行處理,而這數(shù)據(jù)不管是數(shù)組、列表、字典,最終都逃不開(kāi)字符串的處理。
所以今天要來(lái)跟大家發(fā)散的聊聊字符串!
估計(jì)很多人看到是將字符串肯定覺(jué)得索然無(wú)味(老子都會(huì)),可大佬們不妨再往下看看?
python定義字符、字符串沒(méi)有java那樣的嚴(yán)格,不管是單引號(hào)、雙引號(hào)、甚至是三個(gè)單引號(hào)和雙引號(hào)都可以用來(lái)定義字符(串),只要成對(duì)出現(xiàn)即可。比如:
- # 單個(gè)字符
- a='a'
- # 使用單引號(hào)定義字符串
- name='Uranus'
- # 使用雙引號(hào)定義字符串
- code = "Hello World ..."
- # 既然說(shuō)到了string,怎么能不點(diǎn)開(kāi)源碼看看呢?
- class str(object):
- """
- str(object='') -> str
- str(bytes_or_buffer[, encoding[, errors]]) -> str
- Create a new string object from the given object. If encoding or
- errors is specified, then the object must expose a data buffer
- that will be decoded using the given encoding and error handler.
- Otherwise, returns the result of object.__str__() (if defined)
- or repr(object).
- encoding defaults to sys.getdefaultencoding().
- errors defaults to 'strict'.
- """
雖然這些不是主要說(shuō)的,但還是簡(jiǎn)單提下,三個(gè)單引號(hào)或者雙引號(hào),主要是用來(lái)作為文檔注釋的,請(qǐng)不要拿來(lái)定義字符串(雖然這樣并不會(huì)出現(xiàn)語(yǔ)法錯(cuò)誤)。
今天主要說(shuō)下關(guān)于打段的字符串應(yīng)該如何定義,PEP8有規(guī)定,一行代碼的長(zhǎng)度請(qǐng)勿超過(guò)120個(gè)字符。那么如果遇到這種情況,該怎么辦?
- # 不推薦的使用方式:
- line = """
- Create a new string object from the given object.
- If encoding or errors is specified,
- then the object must expose a data buffer that will be
- decoded using the given encoding and error handler.
- """
- # 或者這樣
- line = "Create a new string object from the given object. " \
- "If encoding or errors is specified," \
- "then the object must expose a data buffer that will be" \
- " decoded using the given encoding and error handler."
- # 更好的實(shí)現(xiàn)方式:
- line = ("Create a new string object from the given object."
- "If encoding or errors is specified,"
- "then the object must expose a data buffer that will be "
- "decoded using the given encoding and error handler."
- )
字符串中.is()的用法
.is*(), 既然是is,那么它返回的結(jié)果只有兩種,True or False
先來(lái)對(duì)比一下數(shù)字:
- isdigit()
- True: Unicode數(shù)字,byte數(shù)字(單字節(jié)),全角數(shù)字(雙字節(jié)),羅馬數(shù)字
- False: 漢字?jǐn)?shù)字
- Error: 無(wú)
- isdecimal()
- True: Unicode數(shù)字,全角數(shù)字(雙字節(jié))
- False: 羅馬數(shù)字,漢字?jǐn)?shù)字
- Error: byte數(shù)字(單字節(jié))
- isnumeric()
- True: Unicode數(shù)字,全角數(shù)字(雙字節(jié)),羅馬數(shù)字,漢字?jǐn)?shù)字
- False: 無(wú)
- Error: byte數(shù)字(單字節(jié))
總結(jié)幾個(gè)偏門(mén)知識(shí)點(diǎn):
- a='①②③④⑤'
- isdigit()、isnumeric() 為True isdecimal()為False
- b='一壹'
- isnumeric()會(huì)認(rèn)為是True的哦!
再來(lái)看一個(gè)等式:
- isalnum() = isdigit() + isalpha() + isspace()
- isdigit()表示字符串內(nèi)全部為數(shù)字
- isalpha()表示字符串內(nèi)全部為字符
- isspace()表示字符串有一個(gè)或多個(gè)空格組成
- isalnum()表示字符串內(nèi)全部為數(shù)字和字符
- a='12345'
- b='①②③④⑤'
- c='abc123'
- print(a.isdigit()) # True
- print(b.isalpha()) # True
- print(c.isalnum()) # True
針對(duì)字符串大小寫(xiě)的方法:
- .isupper() 字符串全部由大寫(xiě)組成
- .islower() 字符串全部由小寫(xiě)組成
- .istitle() 字符串形式為駝峰命名,eg:"Hello World"
以上這些用法去掉is,則變?yōu)榱藢?duì)應(yīng)的字符串轉(zhuǎn)發(fā)方法。學(xué)一套會(huì)兩套,買(mǎi)一送一….
最后說(shuō)一個(gè)不帶.的is* --- isinstance(obj,type)。
- 判斷一個(gè)object是什么類型…
- type可選類型為:int,float,bool,complex,str,bytes,unicode,list,dict,set,tuple
- 并且type可以為一個(gè)原組:isinstance(obj, (str, int))
判斷字符串中的內(nèi)容
.*with() starts ends 不僅支持開(kāi)頭結(jié)尾的匹配,還支持start和end兩個(gè)參數(shù)來(lái)動(dòng)態(tài)定義字符串的index位置。
- long_string = "To live is to learn,to learn is to better live"
- long_string.startswith('To')
- long_string.startswith('li', 3, 5)
- long_string.endswith('live')
- long_string.endswith('live', 0, 7)
同樣支持start、end來(lái)判斷字符串的還有 .find()、.rfind()和 .index()、.rindex()
這兩類字符串尋址方法均支持從左到右、從右至左兩種尋址方式,不同的是:
find在未找到時(shí),返回-1,而index在未找到時(shí),會(huì)拋出ValueError的異常…
- long_string.index('live') # 3
- long_string.rindex('live') # 42
字符串的內(nèi)容變更
狹義來(lái)說(shuō)使用,字符串的替換使用.replace()即可,那為什么還要單獨(dú)說(shuō)呢?因?yàn)樗幸粋€(gè)可選參數(shù)count。
- long_string = "To live is to learn,to learn is to better live"
- long_string.count('live') # 2
- long_string.replace('live','Live',1)
- output:
- 'To Live is to learn,to learn is to better live'
- # 可以看到,第二個(gè)live并未進(jìn)行替換
剛才說(shuō)了狹義,那么廣義呢?
1.(l/r)strip()
將字符串左、右、兩端的特定字符過(guò)濾掉,默認(rèn)為空格…
strip()要注意的地方是,strip('TolLive') 中的字符并非完整匹配,而是針對(duì)每一個(gè)字符進(jìn)行匹配,說(shuō)起來(lái)混,直接上例子:
- long_string = "To live is to learn,to learn is to better live"
- long_string.strip('TolLive')
- 's to learn,to learn is to better'
2.字符串切片
字符串的切片分為long_string[start:end;step] start、end區(qū)間為左閉右開(kāi)…這個(gè)網(wǎng)上說(shuō)的太多了,再拉出來(lái)詳細(xì)講就要挨打了…
(l/r)just(width,[fillchar])、center(width, [fillchar])、zfill(width)
這些均為填充固定長(zhǎng)度的字符,默認(rèn)使用空格(zfill為左補(bǔ)0,z是zero的意思…),看意思就明白了,不用多講了….
字符串格式化輸出
本來(lái)fill和center等可以放在這里,但是他們使用頻率和重量級(jí)不夠格,就丟在上面了。
Python格式化輸出分為兩類,那是在pyton2的時(shí)代,即 % 和 format。這兩種網(wǎng)上的資料太多了,說(shuō)的太多顯得沒(méi)逼格…
但,還是要簡(jiǎn)單說(shuō)說(shuō)其中特殊的地方。
1.% 格式化輸出:
- 如何在%的格式輸出中,輸出用來(lái)看做標(biāo)記為的%符號(hào)呢?使用兩個(gè)百分號(hào)(%%)
- %(-)(width) width為設(shè)置長(zhǎng)度,默認(rèn)左填充空格,添加-號(hào)為右填充
- .width代表字符串截?cái)?,保留多少長(zhǎng)度的字符串
- type %s字符串 %d十進(jìn)制整數(shù) %f小數(shù) …
- 多個(gè)參數(shù)是,后面的參數(shù)需要使用括號(hào)包裹起來(lái)
- '姓名:%-5s 年齡:%4d 愛(ài)好: %.8s' % ('王大錘',30,'python、Java')
- output:
- '姓名:王大錘 年齡: 30 愛(ài)好:python、J'
2.format格式輸出:
format在python3開(kāi)始官方就表示為替換%的輸出方式,之所以還保留著%,主要是為了兼容性考慮…
- 對(duì)比%,format使用花括號(hào){}表示變量
- < > ^ 代表了format的對(duì)齊方式
- '{:-^40s}'.format('華麗的分割線')
- output:
- '-----------------華麗的分割線-----------------'
3.f-string
Python3.6的版本更新時(shí),新增了f-string,英文好的可以去看官方解釋PEP 498 -- Literal String Interpolation 。
f-string是字符串引號(hào)前以f/F開(kāi)頭,并使用{}標(biāo)注替換位置的使用形式。
之所以官方推出f-string,主要是因?yàn)樗母叩男阅?、更?qiáng)的功能。例子走起:
- name = 'Uranus'
- f'Hello,{name}'
- f'Hello,{name.lower()}'
- f'Hello,{name:^10s}'
- f'Hello,{(lambda x: x*2) (name)}'
- output:
- 'Hello,Uranus'
- 'Hello,uranus'
- 'Hello, Uranus '
- 'Hello,UranusUranus'
怎么說(shuō),是高端了一些,但我這人有點(diǎn)念舊啊…