自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

手把手教你用Python網(wǎng)絡(luò)爬蟲(chóng)實(shí)現(xiàn)起點(diǎn)小說(shuō)下載

開(kāi)發(fā) 后端
今天要跟大家分享一個(gè)小說(shuō)爬取案例--------起點(diǎn)小說(shuō)的小說(shuō)下載。

[[390839]]

今天要跟大家分享一個(gè)小說(shuō)爬取案例--------起點(diǎn)小說(shuō)的小說(shuō)下載。

在做這個(gè)案例之前,我們需要對(duì)其進(jìn)行分析,

1.界面分析,如圖:

通過(guò)分析很容易就找到了我們的get請(qǐng)求參數(shù),然后獲取相應(yīng)頁(yè)面的小說(shuō)名和鏈接:

獲取到數(shù)據(jù)之后,我們就隨機(jī)挑選一篇小說(shuō)來(lái)進(jìn)行下載,我們選第一篇,

然后打開(kāi)它的文章目錄,可以看到是這樣的,如圖:

基本上這篇小說(shuō)很長(zhǎng),可以看到它卷一和卷二是免費(fèi)的,后面的收費(fèi),那么今天我們就只爬免費(fèi)的章節(jié)。

那么我們現(xiàn)在開(kāi)始分析網(wǎng)頁(yè)結(jié)構(gòu),如圖:

那么,我們可以先把卷一的名字和章節(jié)數(shù)以及章節(jié)下的每個(gè)章節(jié)的名字都打印出來(lái)。

首先我們可以分析下這個(gè)網(wǎng)頁(yè)地址,如圖:

  1. https://book.qidian.com/info/1014243481#Catalog 

發(fā)覺(jué)前面的沒(méi)變,基本就是后面的變了,增加了一個(gè)info/1014243481#Catalog,下面開(kāi)始分析:

info:信息的意思,

1014243481:小說(shuō)對(duì)應(yīng)的ID,

#Catalog:數(shù)據(jù)補(bǔ)全,無(wú)太大意義

因?yàn)閯倓傄呀?jīng)將文章鏈接的內(nèi)容爬取出來(lái),所以現(xiàn)在只需要拼接一個(gè)#Catalog 即可:

下面我們就可以對(duì)它發(fā)起請(qǐng)求然后在分析它的頁(yè)面了,首先發(fā)起get請(qǐng)求,按照前面的網(wǎng)頁(yè)分析結(jié)構(gòu)來(lái)看,我們應(yīng)該這樣寫(xiě):

可以看出,因?yàn)檫@里有異步加載,所以我們的請(qǐng)求不會(huì)一下子全部顯示出來(lái),需要不斷的請(qǐng)求,當(dāng)然最好加個(gè)延遲。

這樣我們就獲取到了這個(gè)頁(yè)面所有的小說(shuō),也可以這樣,因?yàn)槲覀儧](méi)找接口,所以強(qiáng)行解析只能解析部分內(nèi)容,但是也很全面了。如圖:

找的還算挺詳細(xì),只不過(guò)沒(méi)有找接口時(shí)所拿到的數(shù)據(jù)那么規(guī)范好看了。

 

責(zé)任編輯:姜華 來(lái)源: Python爬蟲(chóng)與數(shù)據(jù)挖掘
相關(guān)推薦

2021-01-30 10:37:18

ScrapyGerapy網(wǎng)絡(luò)爬蟲(chóng)

2021-08-09 13:31:25

PythonExcel代碼

2021-12-11 20:20:19

Python算法線(xiàn)性

2022-10-19 14:30:59

2021-05-10 06:48:11

Python騰訊招聘

2021-03-23 09:05:52

PythonExcelVlookup

2021-02-02 13:31:35

Pycharm系統(tǒng)技巧Python

2021-02-10 09:34:40

Python文件的壓縮PyCharm

2017-10-27 10:29:35

人臉識(shí)別UbuntuPython

2011-03-28 16:14:38

jQuery

2021-02-04 09:00:57

SQLDjango原生

2021-02-06 14:55:05

大數(shù)據(jù)pandas數(shù)據(jù)分析

2022-08-04 10:39:23

Jenkins集成CD

2017-10-29 21:43:25

人臉識(shí)別

2018-12-29 09:38:16

Python人臉檢測(cè)

2021-05-17 21:30:06

Python求均值中值

2009-04-22 09:17:19

LINQSQL基礎(chǔ)

2021-01-21 09:10:29

ECharts柱狀圖大數(shù)據(jù)

2021-01-08 10:32:24

Charts折線(xiàn)圖數(shù)據(jù)可視化

2021-09-02 08:56:48

JavaBMIHashSet
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)