自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<blockquote id="mzhtg"></blockquote><blockquote id="mzhtg"><p id="mzhtg"></p></blockquote>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

WOT技術大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設置退出

Python微博移動端爬蟲實例（附代碼）

作者：挖掘機小王子 2018-01-02 16:30:27

開發(fā) 后端

本文簡要講述用Python爬取微博移動端數(shù)據(jù)的方法?？梢钥匆幌翿obots協(xié)議。另外盡量不要爬取太快。如果你毫無節(jié)制的去爬取別人數(shù)據(jù)，別人網(wǎng)站當然會反爬越來越嚴厲。至于為什么不爬PC端，原因是移動端較簡單，很適合爬蟲新手入門。有時間再寫PC端吧！

本文簡要講述用Python爬取微博移動端數(shù)據(jù)的方法。可以看一下Robots協(xié)議。另外盡量不要爬取太快。如果你毫無節(jié)制的去爬取別人數(shù)據(jù)，別人網(wǎng)站當然會反爬越來越嚴厲。至于為什么不爬PC端，原因是移動端較簡單，很適合爬蟲新手入門。有時間再寫PC端吧！

環(huán)境介紹

Python3/Windows-10-64位/微博移動端

網(wǎng)頁分析

以獲取評論信息為例（你可以以自己的喜好獲得其他數(shù)據(jù)）。如下圖：

在這里就會涉及到一個動態(tài)加載的概念，也就是我們只有向下滑動鼠標滾輪才會加載出更多的評論數(shù)據(jù)。這也是網(wǎng)頁經(jīng)常使用的方式。接下來就應該找到評論信息的真實網(wǎng)址，找到真實網(wǎng)址的方法就是打開瀏覽器的開發(fā)者工具，火狐/谷歌是F12鍵。打開如下：

打開以后點擊網(wǎng)絡，網(wǎng)絡用來記錄瀏覽器和服務器交換的信息。接下來將鼠標滾輪緩慢向下滾動，在這個過程中就會彈出類似于上圖的信息，也就是評論信息加載出來了。找到評論信息，應該會在***條。如下圖：

真實網(wǎng)址：https://m.weibo.cn/api/comments/show?id=4160547165300149&page=3

將網(wǎng)址在火狐里面打開如下圖：

上面的網(wǎng)址其實pages=3就代表第三頁，所以只需模擬網(wǎng)址即可，pages=4,5,6。。。。

另外由于是Json文件，所以提取數(shù)據(jù)非常方便，只需用切片操作即可。

責任編輯：龐桂玉來源： Python中文社區(qū)

Python 爬蟲微博移動端

51CTO技術棧公眾號

業(yè)務
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學堂精培企業(yè)培訓 CTO訓練營