自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

圖片偽裝反爬蟲(chóng)的原理和破解方法

安全 應(yīng)用安全
圖片偽裝反爬蟲(chóng)的本質(zhì)就是用圖片替換了原來(lái)的內(nèi)容,從而讓爬蟲(chóng)程序無(wú)法正常獲取,我們只要將里面的內(nèi)容識(shí)別、提取出來(lái)就可以破解這種反爬蟲(chóng)。

本文轉(zhuǎn)載自微信公眾號(hào)「志斌的python筆記」,作者志斌 。轉(zhuǎn)載本文請(qǐng)聯(lián)系志斌的python筆記公眾號(hào)。

大家好,我是志斌~

今天志斌來(lái)給大家分享一下如何破解文本混淆反爬蟲(chóng)中的圖片偽裝反爬蟲(chóng)~

01定義

現(xiàn)在許多大型網(wǎng)站的反爬蟲(chóng)方式是將圖片與文字混合在一起,放到頁(yè)面上進(jìn)行展示。這種混合展示的方式并不會(huì)影響用戶(hù)的正常閱讀,但是卻可以限制爬蟲(chóng)程序獲取這些內(nèi)容。如下圖:

02原理

這種反爬蟲(chóng)的原理十分簡(jiǎn)單,就是將本應(yīng)是普通文本內(nèi)容的部分在前端頁(yè)面中用圖片來(lái)進(jìn)行替換,從而達(dá)到“魚(yú)目混珠“的效果。

03破解

因?yàn)檫@種反爬蟲(chóng)方式是將內(nèi)容進(jìn)行替換,所以我們無(wú)法進(jìn)行繞過(guò),只能破解它來(lái)獲取我們想要的內(nèi)容。

破解的方法也比較簡(jiǎn)單,我們只需要將圖片下載下來(lái)然后對(duì)里面的內(nèi)容進(jìn)行提取即可。提取圖片中的文字有很多方式,我用的是百度AI來(lái)進(jìn)行提取。代碼如下:

  1. from aip import AipOcr 
  2. APP_ID = '你的APPID' 
  3. API_KEY = 'API Key' 
  4. SECRET_KEY = '你的Secret Key' 
  5. client = AipOcr(APP_ID, API_KEY, SECRET_KEY) 
  6. with open(img,'rb'as f: 
  7.   image = f.read() 
  8. word = client.basicGeneral(image) 

在之前的文章中我分享過(guò)一個(gè)用百度api進(jìn)行提取圖片中內(nèi)容的方式,有興趣的讀者可以看看這篇文章20行代碼教你如何批量提取圖片中文字。

04小結(jié)

1. 圖片偽裝反爬蟲(chóng)的本質(zhì)就是用圖片替換了原來(lái)的內(nèi)容,從而讓爬蟲(chóng)程序無(wú)法正常獲取,我們只要將里面的內(nèi)容識(shí)別、提取出來(lái)就可以破解這種反爬蟲(chóng)。

2. 破解這種反爬蟲(chóng)的難度并不大,但是代碼書(shū)寫(xiě)可能較為繁瑣,讀者們可以提前寫(xiě)好流程圖,然后在進(jìn)行書(shū)寫(xiě)。

3. 目前這種反爬蟲(chóng)方法已經(jīng)被各類(lèi)大型網(wǎng)站所應(yīng)用,所以大家要掌握這種反爬蟲(chóng)的繞過(guò)方法。

4. 本文旨在學(xué)習(xí)與研究圖片偽裝反爬蟲(chóng),請(qǐng)大家不要用于非法用途。

 

責(zé)任編輯:武曉燕 來(lái)源: 志斌的python筆記
相關(guān)推薦

2021-10-15 11:37:44

反爬蟲(chóng)破解

2021-06-28 18:57:15

CSS網(wǎng)頁(yè)爬蟲(chóng)

2022-11-24 10:24:32

2016-10-13 15:51:50

2022-09-14 23:06:45

2020-10-20 10:47:51

破解MassLogge

2009-04-27 21:28:56

2022-09-20 07:02:20

網(wǎng)絡(luò)爬蟲(chóng)反爬蟲(chóng)

2018-01-29 09:28:44

2024-06-07 08:56:43

HTTPPythonSelenium

2022-07-03 10:43:23

JS逆向破解

2021-06-10 18:24:59

反爬蟲(chóng)驗(yàn)證碼爬蟲(chóng)

2017-04-27 20:45:48

爬蟲(chóng)反爬蟲(chóng)

2021-06-06 19:53:05

爬蟲(chóng)處理字體反爬

2017-05-15 10:39:48

爬蟲(chóng)應(yīng)對(duì)機(jī)制

2016-10-14 16:35:39

2018-08-09 11:35:40

Python網(wǎng)絡(luò)爬蟲(chóng)語(yǔ)言編程

2020-05-21 09:25:17

Python反爬蟲(chóng)DDOS攻擊

2017-06-30 13:23:02

2025-04-23 08:35:00

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)