一個爬蟲的故事:這是人干的事兒?
作者:軒轅之風O
爬蟲原理我是一個爬蟲,每天穿行于互聯(lián)網(wǎng)之上,爬取我需要的一切。說起來還要感謝HTTP協(xié)議,因為它,全世界的網(wǎng)站和瀏覽器才能夠連接通信,而我也是借助HTTP協(xié)議,獲取我想要的數(shù)據(jù)。
爬蟲原理我是一個爬蟲,每天穿行于互聯(lián)網(wǎng)之上,爬取我需要的一切。
說起來還要感謝HTTP協(xié)議,因為它,全世界的網(wǎng)站和瀏覽器才能夠連接通信,而我也是借助HTTP協(xié)議,獲取我想要的數(shù)據(jù)。
我只需要偽裝成一個瀏覽器,向服務器發(fā)送HTTP請求,就能拿到網(wǎng)頁HTML文件。
接著,我再按照HTML的格式規(guī)范,去解析其中的圖片、鏈接、表單
責任編輯:武曉燕
來源:
編程技術宇宙