自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<sub id="x1rfm"><rt id="x1rfm"></rt></sub>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫

賬號(hào)設(shè)置退出

一篇文章深析Python爬蟲核心，正則表達(dá)式其實(shí)很容易！

作者：空手憶歲月 2018-08-22 11:55:02

開發(fā) 后端

Python中的正則表達(dá)式通過import re 來使用。[] 常用來指定一個(gè)字符集，^ $ * + . | ? {} [] () 這就是元字符了，學(xué)會(huì)這些應(yīng)該就夠你用的了。

python爬蟲正則表達(dá)式介紹

元字符

^ $ * + . | ? {} [] () 這就是元字符了，學(xué)會(huì)這些應(yīng)該就夠你用的了。

python中的正則表達(dá)式通過import re 來使用。

1、python爬蟲正則表達(dá)式，[] 常用來指定一個(gè)字符集，如：[abc ]; [a-z] 里面所有的字母會(huì)被一一匹配例子：

面例子都解釋的很清楚了，我就不重復(fù)一行行解釋了。注：示例中^表示取反。

[a-z]表示從字母a到z所有的字母。

[0-9]等價(jià)于[0123456789] 也可以用d 表示。所有其它的元字符在[]中將失去原有的意義，比如示例中的^在[]表示取反。

2、^ 表示匹配字符串的開頭。在多行模式下匹配每一行的開頭。

注：^一般放在字符串開頭

3、$ 表示匹配字符串的結(jié)尾。在多行模式下匹配每一行的尾部。

注：$一般放在字符串結(jié)尾。

上面三個(gè)可以看成一個(gè)小塊，你記住了嗎？理解了嗎？看明白了嗎？還有你自己敲一遍代碼了嗎？？？？？?。。?！一定自己嘗試敲一遍代碼！

好接下來，繼續(xù) 由于元字符是特殊字符，如果我們要匹配元字符本身的字符應(yīng)該怎么辦呢？當(dāng)我們想把元字符變?yōu)闉槠胀ǚ?hào)是可以使用（反斜杠）進(jìn)行轉(zhuǎn)義。

4、反斜杠后面可以加不同的字符以表示特殊意義。也可用于取消所有元字符，變?yōu)槠胀ǚ?hào)。

你只要能記住加黑加粗的其它的我打賭你肯定也全會(huì)了。所以記住加粗的，自己把下面的代碼敲一遍。示例

正則表達(dá)式可以匹配不定長的字符集，另外也可以指定字符串的重復(fù)次數(shù)。

* （星號(hào)）指定前一個(gè)字符可以匹配0次或者多次，而不是只有1次，匹配結(jié)果會(huì)盡可能的重復(fù)多次***不超過20億次。（后面若加問號(hào)？變?yōu)榉秦澙纺Ｊ絻H匹配0次：ab*? 結(jié)果為a）

+ （加號(hào)）匹配前一個(gè)字符1次或者多次。（后面若加問號(hào)？變?yōu)榉秦澙纺Ｊ絻H匹配1次：ab+? 結(jié)果為ab）

？（問號(hào)）匹配前一個(gè)字符0次或者1次。（后面若加問號(hào)？變?yōu)榉秦澙纺Ｊ絻H匹配0次：ab?? 結(jié)果為a）？可以是python原本的貪婪模式變?yōu)榉秦澙纺Ｊ健?/p>

{m} （花括號(hào)） m是數(shù)字，表示重復(fù)前一個(gè)字符m次。

{m,n} 表示重復(fù)前一個(gè)字符m-n次。若省略m則表示0-n次，若省略n表示m到***次。（后面若加問號(hào)？變?yōu)榉秦澙纺Ｊ絻H匹配0次：ab{2,100}? 結(jié)果為abb）

（） | . . 它匹配除了換行字符外的任何字符，在 alternate 模式（re.DOTALL）下它甚至可以匹配換行

| 代表左右表達(dá)式任意匹配一個(gè)。a|b 匹配a或者匹配b 。如果沒有被(...)括起來它的范圍是整個(gè)正則表達(dá)式。

(...) 將正則表達(dá)式分組，每個(gè)分組為一個(gè)整體，將優(yōu)先返回分組內(nèi)的數(shù)據(jù)

責(zé)任編輯：龐桂玉來源：今日頭條

Python 網(wǎng)絡(luò)爬蟲正則表達(dá)式

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

<sub id="0vvmo"></sub>

<blockquote id="0vvmo"><i id="0vvmo"></i></blockquote>

<cite id="0vvmo"></cite>

<style id="0vvmo"></style>