自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

Python中正則表達(dá)式的巧妙使用 !包你必掌握正則!

開發(fā) 后端
正則表達(dá)式就是從字符串中發(fā)現(xiàn)規(guī)律,并通過“抽象”的符號表達(dá)出來。打個比方,對于2,5,10,17,26,37這樣的數(shù)字序列,如何計(jì)算第7個值,肯定要先找該序列的規(guī)律,然后用n2+1這個表達(dá)式來描述其規(guī)律,進(jìn)而得到第7個值為50。

 前言

正則表達(dá)式就是從字符串中發(fā)現(xiàn)規(guī)律,并通過“抽象”的符號表達(dá)出來。打個比方,對于2,5,10,17,26,37這樣的數(shù)字序列,如何計(jì)算第7個值,肯定要先找該序列的規(guī)律,然后用n2+1這個表達(dá)式來描述其規(guī)律,進(jìn)而得到第7個值為50。對于需要匹配的字符串來說,同樣把發(fā)現(xiàn)規(guī)律作為***步,本文主要使用正則表達(dá)式完成字符串的查詢匹配、替換匹配和分割匹配。

[[265821]]

常用的正則符號

在進(jìn)入字符串的匹配之前,先來了解一下都有哪些常用的正則符號,見下表所示:

 

Python中正則表達(dá)式的巧妙使用 !包你必掌握正則!

 

如果讀者能夠比較熟練地掌握上表中的內(nèi)容,相信在字符串處理過程中將會游刃有余。如前文所說,本節(jié)將基于正則表達(dá)式完成字符串的查詢、替換和分割操作,這些操作都需要導(dǎo)入re模塊,并使用如下介紹的幾個函數(shù)。

字符串的匹配查詢

re模塊中的findall函數(shù)可以對指定的字符串進(jìn)行遍歷匹配,獲取字符串中所有匹配的子串,并返回一個列表結(jié)果。該函數(shù)的參數(shù)含義如下:

findall(pattern, string, flags=0)

pattern:指定需要匹配的正則表達(dá)式。

string:指定待處理的字符串。

flags:指定匹配模式,常用的值可以是re.I、re.M、re.S和re.X。re.I的模式是讓正則表達(dá)式對大小寫不敏感;re.M的模式是讓正則表達(dá)式可以多行匹配;re.S的模式指明正則符號.可以匹配任意字符,包括換行符 ;re.X模式允許正則表達(dá)式可以寫得更加詳細(xì),如多行表示、忽略空白字符、加入注釋等。

字符串的匹配替換

re模塊中的sub函數(shù)的功能是替換,類似于字符串的replace方法,該函數(shù)根據(jù)正則表達(dá)式把滿足匹配的內(nèi)容替換為repl。該函數(shù)的參數(shù)含義如下:

sub(pattern, repl, string, count=0, flags=0)

pattern:同findall函數(shù)中的pattern。

repl:指定替換成的新值。

string:同findall函數(shù)中的string。

count:用于指定最多替換的次數(shù),默認(rèn)為全部替換。

flags:同findall函數(shù)中的flags。

字符串的匹配分割

re模塊中的split函數(shù)是將字符串按照指定的正則表達(dá)式分隔開,類似于字符串的split方法。該函數(shù)的具體參數(shù)含義如下:

split(pattern, string, maxsplit=0, flags=0)

pattern:同findall函數(shù)中的pattern。

maxsplit:用于指定***分割次數(shù),默認(rèn)為全部分割。

string:同findall函數(shù)中的string。

flags:同findall函數(shù)中的flags。

實(shí)戰(zhàn)案例

如果上面的函數(shù)和參數(shù)含義都已經(jīng)掌握了,還需要進(jìn)一步通過案例加強(qiáng)理解,接下來舉例說明上面的三個函數(shù):

  1. # 導(dǎo)入用于正則表達(dá)式的re模塊 
  2. import re 
  3. # 取出字符串string8中所有的天氣狀態(tài) 
  4. string8 = "{ymd:'2018-01-01',tianqi:'晴',aqiInfo:'輕度污染'},{ymd:'2018-01-02',tianqi:'陰~小雨',aqiInfo:'優(yōu)'},{ymd:'2018-01-03',tianqi:'小雨~中雨',aqiInfo:'優(yōu)'},{ymd:'2018-01-04',tianqi:'中雨~小雨',aqiInfo:'優(yōu)'}" 
  5. # 基于正則表達(dá)式使用findall函數(shù) 
  6. print(re.findall("tianqi:'(.*?)'", string8)) 
  7. # 取出string9中所有含O字母的單詞 
  8. string9 = 'Together, we discovered that a free market only thrives when there are rules to ensure competition and fair play, Our celebration of initiative and enterprise' 
  9. # 基于正則表達(dá)式使用findall函數(shù) 
  10. print(re.findall('w*ow*',string9, flags = re.I)) 
  11. # 將string10中的標(biāo)點(diǎn)符號、數(shù)字和字母刪除 
  12. string10 = '據(jù)悉,這次發(fā)運(yùn)的4臺蒸汽冷凝罐屬于國際熱核聚變實(shí)驗(yàn)堆(ITER)項(xiàng)目的核二級壓力設(shè)備,先后完成了壓力試驗(yàn)、真空試驗(yàn)、氦氣檢漏試驗(yàn)、千斤頂試驗(yàn)、吊耳載荷試驗(yàn)、疊裝試驗(yàn)等驗(yàn)收試驗(yàn)。' 
  13. # 基于正則表達(dá)式使用sub函數(shù) 
  14. print(re.sub('[,。、a-zA-Z0-9()]','',string10)) 
  15. # 將string11中的每個子部分內(nèi)容分割開 
  16. string11 = '2室2廳 | 101.62平 | 低區(qū)/7層 | 朝南  
  17.  上海未來 - 浦東 - 金楊 - 2005年建' 
  18. # 基于正則表達(dá)式使用split函數(shù) 
  19. split = re.split('[-| 
  20. ]', string11) 
  21. print(split) 
  22. # 分割結(jié)果的清洗 
  23. split_strip = [i.strip() for i in split] 
  24. print(split_strip) 
  25. out
  26. ['晴''陰~小雨''小雨~中雨''中雨~小雨'
  27. ['Together''discovered''only''to''competition''Our''celebration''of'
  28. 據(jù)悉這次發(fā)運(yùn)的臺蒸汽冷凝罐屬于國際熱核聚變實(shí)驗(yàn)堆項(xiàng)目的核二級壓力設(shè)備先后完成了壓力試驗(yàn)真空試驗(yàn)氦氣檢漏試驗(yàn)千斤頂試驗(yàn)吊耳載荷試驗(yàn)疊裝試驗(yàn)等驗(yàn)收試驗(yàn) 
  29. ['2室2廳 '' 101.62平 '' 低區(qū)/7層 '' 朝南 '' 上海未來 '' 浦東 '' 金楊 '' 2005年建'
  30. ['2室2廳''101.62平''低區(qū)/7層''朝南''上海未來''浦東''金楊''2005年建'

如上結(jié)果所示,在***個例子中通過正則表達(dá)式"tianqi:'(.*?)'"實(shí)現(xiàn)目標(biāo)數(shù)據(jù)的獲取,如果不使用括號的話,就會產(chǎn)生類似"tianqi:'晴'", "tianqi:'陰~小雨'"這樣的值,所以,加上括號就是為了分組,且僅返回組中的內(nèi)容;

第二個例子并沒有將正則表達(dá)式寫入圓括號,如果寫上圓括號也是返回一樣的結(jié)果,所以findall就是用來返回滿足匹配條件的列表值,如果有括號,就僅返回括號內(nèi)的匹配值;

第三個例子使用替換的方法,將所有的標(biāo)點(diǎn)符號換為空字符,進(jìn)而實(shí)現(xiàn)刪除的效果;

第四個例子是對字符串的分割,如果直接按照正則 '[,。、a-zA-Z0-9()]' 分割的話,返回的結(jié)果中包含空字符,如 '2室2廳' 后面就有一個空字符。為了刪除列表中每個元素的首尾空字符,使用了列表表達(dá)式,并且結(jié)合字符串的strip方法完成空字符的壓縮。

責(zé)任編輯:武曉燕 來源: 今日頭條
相關(guān)推薦

2010-03-25 18:25:36

Python正則表達(dá)式

2019-09-24 09:29:26

Python數(shù)據(jù)接口

2018-09-27 15:25:08

正則表達(dá)式前端

2024-09-14 09:18:14

Python正則表達(dá)式

2009-02-17 09:10:01

正則表達(dá)式Java優(yōu)化

2021-01-27 11:34:19

Python正則表達(dá)式字符串

2020-09-04 09:16:04

Python正則表達(dá)式虛擬機(jī)

2019-12-17 17:01:02

MySQLSQL數(shù)據(jù)庫

2009-09-16 17:29:30

正則表達(dá)式使用詳解

2011-08-16 16:40:06

iPhone應(yīng)用正則表達(dá)式OgreKit

2023-10-07 08:25:09

Java處理工具正則表達(dá)式

2016-09-12 09:57:08

grep命令表達(dá)式Linux

2010-03-01 15:51:59

Python則表達(dá)式

2010-03-11 08:55:45

python正則表達(dá)式

2019-12-10 10:40:57

Python正則表達(dá)式編程語言

2012-04-28 15:22:46

PHP

2020-11-04 09:23:57

Python

2024-12-25 15:09:38

Python字符串函數(shù)

2015-10-08 09:15:37

C++源碼分析

2009-02-18 09:48:20

正則表達(dá)式Java教程
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號