Python抓取的具體應(yīng)用解答
如果你在Python抓取中遇到問題,查了很多地方不知道怎么解決,你可以通過以下的文章對 Python抓取有一個詳細(xì)的了解,通過對它的了解你可以在股票信息等其他信息中獲取自己想要查詢的東西。
需要在python上加點東西,做起來就簡單了。 jquery在做html內(nèi)容提取,分析的時候很方便。而python做類似的工作就麻煩一點,原來我都是用正則表達(dá)式或者HtmlParser的 。兩者用著都不是太爽,今天發(fā)現(xiàn)了一個好東西 pyquery ,一個類似jquery的python庫。
摘抄一段使用說明 :
- from pyquery import PyQuery as pq
- from lxml import etree
- d = pq(" <html> < span>html>")
- d = pq(etree.fromstring(" <html> < span>html>"))
- d = pq(url='http://google.com/')
- d = pq(filename=path_to_html_file)
- Now d is like the $ in jquery:
- d("#hello")
- [ <p#hello.hello>]
- p = d("#hello")
- p.html()
- 'Hello world !'
- p.html("you know <a href='http://
- python.org/'>Python < span>a> rocks")
- [ <p#hello.hello>]
- p.html()
- 'you know <a href="http://python.org/">
- Python < span>a> rocks'
- p.text()
- 'you know Python rocks'
簡單吧,安裝也很簡單解壓縮 python setup.py install 就可以了,可能要安裝ezsetup現(xiàn)在的版本是0.3,還有一些jquery的東西沒有實現(xiàn),比如:radio,:password,以及一些ajax的功能,通過以的介紹你就可以更好的了解Python抓取的應(yīng)用了,趕緊試試吧。
【編輯推薦】