Objective-C解析HTML!
使用Objective-C解析HTML或者XML,系統(tǒng)自帶有兩種方式一個是通過libxml,一個是通過NSXMLParser。不過這兩種方式都需要自己寫很多編碼來處理抓取下來的內(nèi)容,而且不是很直觀。
有一個比較好的類庫hpple,它是一個輕量級的包裝框架,可以很好的解決這個問題 。它是用XPath來定位和解析HTML或者XML。
安裝步驟:
-加入 libxml2 到你的項目中
Menu Project->Edit Project Settings
搜索 “Header Search Paths”
添加新的 search path “${SDKROOT}/usr/include/libxml2″
Enable recursive option
-加入 libxml2 library 到你的項目
Menu Project->Edit Project Settings
搜索 “Other Linker Flags”
添加新的 search flag “-lxml2″
-將下面hpple的源代碼 加入到你的項目中:
HTFpple.h
HTFpple.m
HTFppleElement.h
HTFppleElement.m
XPathQuery.h
XPathQuery.m
-XPath學習地址http://www.w3schools.com/XPath/default.asp
示例代碼:
- #import "TFHpple.h"
- NSData *data = [[NSData alloc] initWithContentsOfFile:@"example.html"];
- // Create parser
- xpathParser = [[TFHpple alloc] initWithHTMLData:data];
- //Get all the cells of the 2nd row of the 3rd table
- NSArray *elements = [xpathParser search:@"//table[3]/tr[2]/td"];
- // Access the first cell
- TFHppleElement *element = [elements objectAtIndex:0];
- // Get the text within the cell tag
- NSString *content = [element content];
- [xpathParser release];
- [data release];
下載 地址:https://github.com/topfunky/hpple
另外,還有一個類似的解決方案可以參考
ElementParser http://github.com/Objective3/ElementParser
源碼下載:http://down.51cto.com/data/616107