自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<cite id="itivy"></cite>

^{<blockquote id="itivy"><i id="itivy"></i></blockquote>}

<em id="itivy"></em>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫

賬號(hào)設(shè)置退出

這個(gè)用Python寫的開源爬蟲網(wǎng)站讓你秒搜所有豆瓣好書

作者：佚名 2019-05-21 14:08:40

開發(fā) 前端

最近猿哥在GitHub上發(fā)現(xiàn)了一個(gè)網(wǎng)站，是中國科學(xué)院自動(dòng)化研究所的一大神(lanbing510)用Python寫的一個(gè)爬蟲，他在16年的時(shí)候就爬下了豆瓣所有的讀書數(shù)據(jù)并做了個(gè)WebApp接口方來挖掘查找和閱讀好書。怪我知道的太晚

程序員在提升自己的道路，大多還是會(huì)選擇閱讀編程書籍這一途徑，但找到一本好書就沒那么容易了。

通過查看各大銷售網(wǎng)站的銷量數(shù)據(jù)和評(píng)價(jià)，以及豆瓣評(píng)分和評(píng)價(jià)人數(shù)，可以幫助我們更快的挖掘出經(jīng)典的計(jì)算機(jī)書籍，還有那些被人們忽視的好書。

最近猿哥在GitHub上發(fā)現(xiàn)了一個(gè)網(wǎng)站，是中國科學(xué)院自動(dòng)化研究所的一大神(lanbing510)用Python寫的一個(gè)爬蟲，他在16年的時(shí)候就爬下了豆瓣所有的讀書數(shù)據(jù)并做了個(gè)WebApp接口方來挖掘查找和閱讀好書。怪我知道的太晚

后來lanbing510再次爬了一遍豆瓣讀書的數(shù)據(jù)，總共更新了3232088本圖書信息，共2138386KB，并將其開源

為什么說它很好用呢?猿哥演示一遍你就知道了：

可以看出這網(wǎng)站的界面非常簡(jiǎn)潔，沒有花里花哨的內(nèi)容，只有干貨，你可以直接通過關(guān)鍵字、分?jǐn)?shù)、和評(píng)價(jià)人數(shù)這三個(gè)選項(xiàng)進(jìn)行搜索，比如我們可以搜索關(guān)鍵字：編程;分?jǐn)?shù)：9.0;評(píng)價(jià)人數(shù)：100人以上

查找結(jié)果的顯示方式有按照分?jǐn)?shù)排序和人數(shù)排序兩種，按照分?jǐn)?shù)排序的截圖如下：

按照評(píng)價(jià)人數(shù)排序的截圖如下：

除了以上演示的操作，這個(gè)網(wǎng)站并實(shí)現(xiàn)了以下功能：

可以爬下豆瓣讀書標(biāo)簽下的所有圖書
按評(píng)分排名依次存儲(chǔ)
存儲(chǔ)到Excel中，可方便大家篩選搜羅，比如篩選評(píng)價(jià)人數(shù)>1000的高分書籍;可依據(jù)不同的主題存儲(chǔ)到Excel不同的Sheet
采用User Agent偽裝為瀏覽器進(jìn)行爬取，并加入隨機(jī)延時(shí)來更好的模仿瀏覽器行為，避免爬蟲被封

也就是說你不僅可以在網(wǎng)站上搜索，還能通過下載各類目下的Excel書單文件，直接在Excel中搜索

效果截圖如下：

附上網(wǎng)站地址：http://sobook.lanbing510.info

GitHub地址：https://github.com/lanbing510/DouBanSpider

責(zé)任編輯：未麗燕來源：程序員書庫

豆瓣 Python 圖書

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

<style id="39wj4"></style>

<cite id="39wj4"><track id="39wj4"></track></cite>

<blockquote id="39wj4"><rt id="39wj4"></rt></blockquote>

^{<thead id="39wj4"></thead>}