自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<cite id="yf3so"><rp id="yf3so"></rp></cite>

<blockquote id="yf3so"><i id="yf3so"></i></blockquote>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專(zhuān)欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

賬號(hào)設(shè)置退出

我們一起分享一次實(shí)用的爬蟲(chóng)經(jīng)驗(yàn)

作者：Python進(jìn)階者 2021-11-24 07:56:57

開(kāi)發(fā) 前端

一開(kāi)始我以為很簡(jiǎn)單，我照著他給的網(wǎng)站，然后一頓抓包操作，到頭來(lái)竟然沒(méi)有找到響應(yīng)數(shù)據(jù)，不論是在ALL還是XHR里邊都沒(méi)有找到任何符合要求的數(shù)據(jù)，真是納悶。講到這里，【杯酒】大佬一開(kāi)始也放大招，嚇得我不敢說(shuō)話。

大家好，我是Python進(jìn)階者。

前言

前幾天鉑金群有個(gè)叫【艾米】的粉絲在問(wèn)了一道關(guān)于Python網(wǎng)絡(luò)爬蟲(chóng)的問(wèn)題，如下圖所示。

不得不說(shuō)這個(gè)粉絲的提問(wèn)很詳細(xì)，也十分的用心，給他點(diǎn)贊，如果大家日后提問(wèn)都可以這樣的話，想必可以節(jié)約很多溝通時(shí)間成本。

其實(shí)他抓取的網(wǎng)站是愛(ài)企查，類(lèi)似企查查那種。

一、思路

一開(kāi)始我以為很簡(jiǎn)單，我照著他給的網(wǎng)站，然后一頓抓包操作，到頭來(lái)竟然沒(méi)有找到響應(yīng)數(shù)據(jù)，不論是在ALL還是XHR里邊都沒(méi)有找到任何符合要求的數(shù)據(jù)，真是納悶。講到這里，【杯酒】大佬一開(kāi)始也放大招，嚇得我不敢說(shuō)話。

其實(shí)是想復(fù)雜了，一會(huì)兒你就知道了。

懷著一顆學(xué)習(xí)的心，我看了杯酒的代碼，發(fā)現(xiàn)他構(gòu)造的URL中有下圖這個(gè)：

然后我再去網(wǎng)頁(yè)中去找這個(gè)URL，可是這個(gè)URL在原網(wǎng)頁(yè)中根本就找不到???這就離譜了，總不能空穴來(lái)風(fēng)吧，事出必有因!

二、分析

原來(lái)這里有個(gè)小技巧，有圖有真相。

之后根據(jù)抓包情況，就可以看到數(shù)據(jù)了。

在里邊可以看到數(shù)據(jù)：

這里【杯酒】大佬查詢的關(guān)鍵詞是：數(shù)據(jù)，所以得到了好幾頁(yè)數(shù)據(jù)，而我和【艾米】都是直接查的：上海手術(shù)器械廠，這個(gè)只有一頁(yè)，不太好觀察規(guī)律，所以一直卡住了。

之后將得到的代碼中的URL的關(guān)鍵詞，改為：上海手術(shù)器械廠，就可以順利的得到數(shù)據(jù)，是不是很神奇呢?

三、代碼

下面就奉上本次爬蟲(chóng)的代碼，歡迎大家積極嘗試。

# -*- coding: utf-8 -*- 
import requests 
import user_agent 
from urllib import parse 
 
 
def search(key_word): 
    for page_num in range(1, 2): 
        url = f'https://aiqicha.baidu.com/s/advanceFilterAjax?q={parse.quote(key_word)}&t=&p={str(page_num)}&s=10&o=0&f=%7B%7D' 
        headers = { 
            'User-Agent': user_agent.generate_user_agent(), 
            'Referer': 'https://aiqicha.baidu.com/s?q=%E6%95%B0%E6%8D%AE&t=0', 
        } 
        print(url) 
        response = requests.get(url=url, headers=headers) 
        print(requests) 
        print(response.json()) 
        # break 
 
 
if __name__ == '__main__': 
    search('上海手術(shù)器械廠')

只需要將關(guān)鍵詞換成你自己想要搜索的就可以了。

下圖是運(yùn)行的結(jié)果：

下圖是原網(wǎng)頁(yè)的截圖，可以看到數(shù)據(jù)可以對(duì)的上：

四、總結(jié)

我是Python進(jìn)階者。本文基于粉絲提問(wèn)，針對(duì)一次有趣的爬蟲(chóng)經(jīng)歷，分享一個(gè)實(shí)用的爬蟲(chóng)經(jīng)驗(yàn)給大家。下次再遇到類(lèi)似這種首頁(yè)無(wú)法抓取的網(wǎng)頁(yè)，或者看不到包的網(wǎng)頁(yè)，不妨試試看文中的“以退為進(jìn)，投機(jī)取巧”方法，說(shuō)不定有妙用噢!

責(zé)任編輯：武曉燕來(lái)源： Python爬蟲(chóng)與數(shù)據(jù)挖掘

爬蟲(chóng)經(jīng)驗(yàn)抓包

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開(kāi)發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)