自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<tfoot id="dedwu"></tfoot>

<blockquote id="dedwu"><p id="dedwu"></p></blockquote>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

詳談如何實現(xiàn)PHP HTML截取代碼

作者：佚名 2009-12-01 16:12:37

開發(fā) 后端

PHP HTML截取代碼的方法并不是很難，只要我們了解了其中的含義，就能靈活運(yùn)用這一方法在其他地方。希望本文涉及的內(nèi)容對又需要的朋友有所幫助。

我們今天將為大家?guī)淼氖顷P(guān)于PHP HTML截取代碼的主要實現(xiàn)方式，希望初學(xué)者能通過本文介紹的內(nèi)容對這方面有一個深刻的認(rèn)識。

#t#需求：將一段文字截取一定的物理長度顯示，注意，要截取的不是字符串的字節(jié)數(shù)，UFT-8 的編碼中文字符是3個字節(jié)或者4個字節(jié)的，而顯示的時候中文會占兩個字符的長度，英文字符只占一個，全角的時候又有不同。

而且給的數(shù)據(jù)是HTML代碼串，比如這樣：

< div class=”aaa”>
< a href=”/aaa.php?id=1″>
張三
< /a> 
評論了 
< a href=”/aaa.php?id=444″>
李四
< /a> 
分享的 
< a href=”bbb.html”>
一篇文章文章一長串的東西
< /a>
< /div>

PHP HTML截取代碼的時候是要截取 div 標(biāo)簽內(nèi)部的東西，而且要保留HTML標(biāo)簽，只是對其中的文字做處理。比如我可能只是截取到“李四”的“李”字，但是如果就這樣放到前端的話，“李四”前面的 a 標(biāo)簽是沒有閉合的，所以截取之后要保證HTML的語法正確。
這個問題確實不太好搞，讓我郁悶了兩天。請注意，這只是一個字符串，只不過內(nèi)容是HTML代碼，是沒有什么DOM的。如果是在前端處理就好辦了，直接DOM獲取，然后對里面的節(jié)點(diǎn)進(jìn)行處理，***把innerHTML 之類的東西輸出就搞定了?，F(xiàn)在可不行了，得換個思路。同事的思路是這樣的：

遍歷字符串的每一個字符。設(shè)置一個標(biāo)記，碰到標(biāo)簽開始的標(biāo)記< 就置為1，接下來的字符都不記數(shù)，然后碰到>之后再開始計數(shù)。對標(biāo)簽內(nèi)部的字符串處理的時候，還要先判斷當(dāng)前字符的編碼是不是可能是中文，一般來說PHP中 UTF-8 編碼的中文字符的長度都是3，所以如果碰到是中文字符編碼，就要跳過兩個不記數(shù)……說到這里我自己頭已經(jīng)開始大了。個人認(rèn)為這種方法很不爽，首先這種精致的邏輯不太容易控制，而且 UFT-8 編碼下中文產(chǎn)生的長度有可能是3個或4個所以代碼的嚴(yán)密性值得懷疑。

我個人的思路是，用 Tidy 來搞（具體用法請看PHP手冊吧）。昨天研究了一下那個 Tidy ，發(fā)現(xiàn)這個東西還是挺好用的。首先，把這個字符串轉(zhuǎn)換成 Tidy 對象，這樣：

$tidy = tidy_parse_string
($str, array(), ‘utf8′);   
// ***一個是設(shè)置編碼的，注意，
這里是utf8 ，不是utf-8，沒有中間那個連線。

然后獲取$tidy中的 body（因為轉(zhuǎn)換之后$tidy會自動加上<head><body>等標(biāo)簽）：
$body = tidy_get_body($tidy);
這個時候你可以用 var_dump 看一些 $body 的結(jié)構(gòu)，會發(fā)現(xiàn)它把每個標(biāo)簽都變成了一個對應(yīng)的對象，里面有相應(yīng)的屬性。舉例來說，比如 <a href=”#”>sdf</a> ，這么一條語句對應(yīng)的一些屬性有：

name=>”a”
value => “<a href=”#”>sdf</a>”
child=> array{[0]=>一個文本節(jié)點(diǎn)對象，value是 sdf}
attribute=array{”href”=>”#”}
…..其他屬性

可以看到，我們其實是可以單獨(dú)去處理 a 標(biāo)簽對應(yīng)節(jié)點(diǎn)下面的文字節(jié)點(diǎn)的值的，那樣PHP HTML截取代碼就不會破壞任何HTML完整性。原來我以為改變 a 標(biāo)簽中文字節(jié)點(diǎn)的值之后， a 標(biāo)簽的value也會跟著改變，那樣我直接返回a標(biāo)簽對應(yīng)節(jié)點(diǎn)的value就OK了，沒想到不是那個樣子，哎，所以處理過其中的文字之后還是要自己拼出新的HTML。
知道了Tidy對象的結(jié)構(gòu)之后，一切就好辦了，只要遍歷所有的節(jié)點(diǎn)，對于本需求來說，就是找到那個 div 標(biāo)簽，然后開始處理里面的節(jié)點(diǎn)。代碼如下：

if(mb_strwidth($subchild->value, 
‘utf-8′) >= $len)   
{   
$subchild->value = mb_strimwidth
($subchild->value, 0, $len, ‘…', ‘utf-8′);   
$trimed_str .= $subchild->value;   
break;   
}   
else   
{   
$trimed_str .= $subchild->value;   
$len = $len - mb_strwidth($subchild->
value, ‘utf-8′);   
}

里面的$subchild 就是一個子節(jié)點(diǎn)。注意，這里使用了 mb_strwidth 來獲取字符串長度。嚴(yán)重推薦一下這個 mb_strwidth，很好用，它會把中文當(dāng)作兩個字符長度處理，正好符合這里的需求！而且PHP HTML截取代碼的時候用到了 mb_strimwidth，這個函數(shù)也會把中文當(dāng)作兩個字符長度處理，mb_ 開頭的函數(shù)真是好用啊。

具體的PHP HTML截取代碼代碼我就不寫出來了，因為是針對一個需求寫的，沒做成通用的形式。哪天我有時間做成通用的再發(fā)布一下。
另外，可惜FireFox不支持 text-overflow 屬性，不然也不用后臺那么辛苦地去截斷了。如果大家有更好的方法，歡迎提出！不勝感激。

責(zé)任編輯：曹凱來源： jb51.net

PHP HTML截取代碼

點(diǎn)贊

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

<legend id="4788h"><track id="4788h"></track></legend>

<cite id="4788h"></cite>

<cite id="4788h"></cite>