馬老師曾說,我對錢沒有興趣!于是我用Python分析了馬老師的語錄,發(fā)現(xiàn)...
對于馬老師,估計無人不知無人不曉,小編第一次看馬老師的演講點評在是贏在中國上面,對于他的口才我深深折服。里面有很多金句,細想想還是很有益處的。最為津津樂道的是馬老師跟撒貝寧的在開講啦節(jié)目上面的對話:我對錢沒有興趣。
也許錢對于他這樣的大佬確實沒有啥興趣,小編還在發(fā)愁每個月的房租怎么交,還在愁花唄的賬單呢。
突發(fā)奇想,既然是玩Python,不如把馬老師曾經(jīng)講過的金句和語錄進行一個全方位的總結(jié),用Python來盤點一下,看看到底都有哪些亮點。
01.數(shù)據(jù)的爬取
我們需要對于數(shù)據(jù)進行抓取,小編提取的是“名言通”提供的數(shù)據(jù),其網(wǎng)址為www.mingyantong.com.由于網(wǎng)頁是屬于靜態(tài)網(wǎng)頁,因此對于爬取程序的編寫相對比較簡單,部分如下圖所示:
上述的程序中,我們首先構(gòu)造了請求頭,然后根據(jù)網(wǎng)頁數(shù)量構(gòu)造請求鏈接,然后分頁的來爬取對應(yīng)的信息,這里我們提取的是每個名句的內(nèi)容,以及名句的子網(wǎng)頁、評論的數(shù)量和點贊數(shù)量。
02.數(shù)據(jù)的分析和提取
提取到數(shù)據(jù)后,接下來是對于數(shù)據(jù)的分析,我們提取到的數(shù)據(jù)為:
對于點贊數(shù)和評論數(shù)我們需要將其轉(zhuǎn)換為int類型的數(shù)據(jù),因此可以采用下述的代碼進行處理:
03.數(shù)據(jù)的可視化
1).金句的點贊
我們首先來看一下大家對于金句的點贊情況,如下圖所示:
從上圖可以看出,大家對于金句的點贊分布絕大多數(shù)集中在0-200條之前,而且呈現(xiàn)逐漸遞減的趨勢,分布極為不均勻。
2).Top5的金句
有了點贊的數(shù)量和評論的數(shù)量,我們來看一下,點贊數(shù)量前五名的金句和評論數(shù)前五名的金句分別是哪些。
上圖中,字體越大,代表著點贊數(shù)或者是評論數(shù)越高,我們可以看出,點贊數(shù)最高和評論數(shù)最高的金句是同一句話,我們可以拿出來單獨給大家看一下。
今天會很殘酷,明天會更殘酷,后天會很美好,但大部分人會死在明天晚上。
這句話也警示我們,凡事需要踏踏實實的堅持到底,才能夠會有收獲。否則將會一無所獲。
3).點贊和評論分布
接下來,看一下點贊數(shù)前五的金句,其點贊數(shù)和評論數(shù)之間的一個分布情況。
上圖可以看出,對于評論數(shù)量和點贊數(shù)量,二者沒有過多的關(guān)系,點贊數(shù)很高的金句,其評論數(shù)量有可能會很少,例如上圖中第二個句子中,點贊數(shù)排名第二,但是評論數(shù)卻為零。
4).詞云分析
最后,我們來看一下我們爬取的馬云所有的金句,來制作一個詞云,看一下,金句的關(guān)鍵詞有哪一些。
我們可以看出,對于馬老師的語錄中,最重要的關(guān)鍵詞有”我們“、”自己“ 、”成功“等等,一定程度上可以說明是以”我們大家“的共同角度,探討了自身的一些內(nèi)容,以及如何去成功等一系列的話題。
好了,以上就是小編今天為大家?guī)淼鸟R老師的著名金句,相信大家也會從馬老師的金句中有所感悟,你最喜歡馬老師的哪一句?