自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

如何運(yùn)用PHP函數(shù)preg_match_all測(cè)試正則表達(dá)式效果

開(kāi)發(fā) 后端
對(duì)于初學(xué)者來(lái)說(shuō),PHP函數(shù)preg_match_all可能只是在書(shū)本上了解了它的使用方法,在實(shí)際編程中的經(jīng)驗(yàn)還是比較少的。

PHP函數(shù)preg_match_all的具體使用方法我們可以在PHP語(yǔ)言學(xué)習(xí)中初步掌握,那么在實(shí)際使用中我們是否能正確的對(duì)這個(gè)函數(shù)進(jìn)行運(yùn)用呢?今天我們就為大家介紹PHP函數(shù)preg_match_all在正則表達(dá)式測(cè)試中的運(yùn)用。

PHP函數(shù)preg_match_all代碼實(shí)例:

  1. $html = '< div id="biuuu">
  2. php自學(xué)網(wǎng)
  3. < /div><div id="biuuu_2">
  4. php自學(xué)網(wǎng)2
  5. < /div>
  6. < div id="biuuu_3">
  7. php自學(xué)網(wǎng)3
  8. < /div>';  

 

#t#PHP函數(shù)preg_match_all實(shí)例要求:分別將每一個(gè)DIV元素的ID和內(nèi)容取出,如biuuu,biuuu_2,biuuu_3,php自學(xué)網(wǎng),php自學(xué)網(wǎng)2和php自學(xué)網(wǎng)3(一些常用的抓站方法就是這樣匹配的)

分析:字符串是一個(gè)簡(jiǎn)單的HTML元素,每一個(gè)DIV元素對(duì)應(yīng)該一個(gè)ID和內(nèi)容,并且是獨(dú)立的,首先考慮如何取出一個(gè)DIV內(nèi)的ID值和內(nèi)容, 如:php自學(xué)網(wǎng),然后匹配其它類(lèi)似的元素。一個(gè)DIV中需要取出兩個(gè)值,也就是兩個(gè)匹配的表達(dá)式,第一個(gè)表達(dá)式用于匹配ID值(biuuu),第二個(gè)表 達(dá)式用于匹配ID的內(nèi)容(php自學(xué)網(wǎng)),正則表達(dá)式常用的表達(dá)式使用小括號(hào),那么前面的元素將會(huì)變成如下形式:

  1. < div 
  2. id="(biuuu)">
  3. (php自學(xué)網(wǎng))
  4. < /div> 
  5. < div id="(表達(dá)式1)">
  6. (表達(dá)式2)
  7. < /div>  

好,使用如上小括號(hào)把需要匹配的區(qū)域進(jìn)行了劃分,接下來(lái)就是如何匹配各個(gè)表達(dá)式內(nèi)的內(nèi)容,我們猜想一個(gè)ID可能是字母,數(shù)字或下劃線,那這就變得簡(jiǎn)單了,使用中括號(hào)就可以實(shí)現(xiàn),如下:

表達(dá)式1:[a-zA-Z0-9_]+ (表示匹配大小寫(xiě)字母,數(shù)字和下劃線)

那如何匹配表達(dá)式2,因?yàn)镮D的內(nèi)容可以是任意的字符,但是要注意,不能匹配<或>字符,因?yàn)槿绻ヅ溥@兩個(gè)字符將會(huì)把后面使用的DIV都匹配出來(lái),因此需要排除這兩個(gè)字符開(kāi)始的元素,也就是不匹配以<或>字符,如下:

表達(dá)式2:[^<>]+ (表示不匹配<和>字符)

這樣,PHP函數(shù)preg_match_all需要匹配的子表達(dá)式就實(shí)現(xiàn)了,但是還要需要匹配一個(gè)的表達(dá)式,方法如下:

表達(dá)式:/ '"(表達(dá)式1)"'>(表達(dá)式2)</div>/

注意其中的雙引號(hào)"和/需要使用轉(zhuǎn)義字符轉(zhuǎn)義,然后把前面兩個(gè)表達(dá)式放進(jìn)去,如下:

  1. '"([a-z0-9_]+)"'>/
  2. < div id="([a-z0-9_]+)">
  3. ([^<>]+)
  4. < /div>/   

這樣就實(shí)現(xiàn)一個(gè)匹配每一個(gè)DIV元素ID值和內(nèi)容的正則表達(dá)式,然后使用preg_match_all函數(shù)測(cè)試如下:

 

  1. $html = 
  2. '< div id="biuuu">
  3. php自學(xué)網(wǎng)
  4. < /div>
  5. < div id="biuuu_2">
  6. php自學(xué)網(wǎng)2
  7. < /div>
  8. < div id="biuuu_3">
  9. php自學(xué)網(wǎng)3
  10. < /div>';   
  11. preg_match_all('/
  12. < divsiddivsid="([a-z0-9_]+)">
  13. ([^<>]+)
  14. < /div>/',$html,$result);   
  15. var_dump($result);  

PHP函數(shù)preg_match_all示例結(jié)果:

 

  1. array(3) {   
  2. [0]=> array(3)   
  3. {   
  4. [0]=> string(30) "
    <div id="biuuu">php自學(xué)網(wǎng)</div>"   
  5. [1]=> string(33) "
    <div id="biuuu_2">php自學(xué)網(wǎng)2</div>"   
  6. [2]=> string(33) "
    <div id="biuuu_3">php自學(xué)網(wǎng)3</div>"   
  7. }   
  8. [1]=> array(3)   
  9. {   
  10. [0]=> string(5) "biuuu"   
  11. [1]=> string(7) "biuuu_2"   
  12. [2]=> string(7) "biuuu_3"   
  13. }   
  14. [2]=> array(3)   
  15. {   
  16. [0]=> string(8) "php自學(xué)網(wǎng)"   
  17. [1]=> string(9) "php自學(xué)網(wǎng)2"   
  18. [2]=> string(9) "php自學(xué)網(wǎng)3"   
  19. }   
  20. }  

 

共有三個(gè)表達(dá)式,分別顯示每一個(gè)表達(dá)式匹配的值,并以數(shù)組的形式存儲(chǔ),這樣就把每一個(gè)DIV元素的ID和內(nèi)容取出。使用正則表達(dá)式最主要還是要知道需要什么,然后跟椐需要進(jìn)行匹配,并且思路清晰,并適當(dāng)?shù)慕柚鶳HP函數(shù)preg_match_all進(jìn)行輸出調(diào)試,非常方便。

責(zé)任編輯:曹凱 來(lái)源: 百度博客
相關(guān)推薦

2009-05-22 11:38:55

PHPpreg_match_正則表達(dá)式

2009-09-16 14:22:44

preg_match正

2009-11-26 18:00:46

PHP正則表達(dá)式pre

2009-11-30 17:16:34

PHP函數(shù)preg_m

2011-05-11 17:40:30

PHP正則表達(dá)式

2009-09-16 09:58:53

PHP正則表達(dá)式函數(shù)

2009-09-16 10:43:22

PHP正則表達(dá)式函數(shù)

2009-08-20 14:57:00

C#正則表達(dá)式

2012-04-28 15:22:46

PHP

2009-09-16 14:32:43

PHP正則表達(dá)式替換

2009-09-16 13:14:10

Ereg正則表達(dá)式

2009-09-16 10:59:24

PHP正則表達(dá)式元字符

2009-09-16 11:17:12

PHP正則表達(dá)式定位字

2009-11-30 17:06:35

PHP ereg()函

2018-09-27 15:25:08

正則表達(dá)式前端

2020-09-04 09:16:04

Python正則表達(dá)式虛擬機(jī)

2021-05-25 09:18:04

正則表達(dá)式Linux字符串

2009-09-16 11:27:52

PHP正則表達(dá)式正則表達(dá)式實(shí)現(xiàn)

2009-11-17 10:20:37

PHP正則表達(dá)式

2009-09-16 16:01:57

PHP正則表達(dá)式正則表達(dá)式的應(yīng)用
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)