Python 告訴你,你為什么是單身汪
本文轉(zhuǎn)載自微信公眾號「蘿卜大雜燴」,作者蘿卜大雜燴。轉(zhuǎn)載本文請聯(lián)系蘿卜大雜燴公眾號。
緣起
不知道從什么時候開始,廣大程序猿們(不包括程序媛們)總是被調(diào)侃,一直都是那個靠實(shí)力單身的群體。
而根據(jù)網(wǎng)上不知道是否準(zhǔn)確的數(shù)據(jù)顯示,中國的單身人口高達(dá)2億,我的天,不能這兩億都是程序猿吧
今天不是來探究這個單身數(shù)字的,而是選擇了一個切入點(diǎn),來探究下,碼農(nóng)單身到底是哪里的鍋。
切入點(diǎn)
而我選擇的切入點(diǎn)就是人口結(jié)構(gòu)數(shù)據(jù),通過觀察人口結(jié)構(gòu),男女比例,來看看單不單身,是不是由你說了算。
首先感謝下“快易理財(cái)網(wǎng)”的數(shù)據(jù)
https://www.kuaiyilicai.com
我這里使用的數(shù)據(jù),都是來自于該網(wǎng)站,網(wǎng)站上還有各類財(cái)經(jīng)數(shù)據(jù),有興趣的小伙伴兒們可以去看看。
獲取我國女性占比
首先我們先來抓取下我國女性的逐年占比數(shù)據(jù),看看找對象在什么時代能容易些
抓取該網(wǎng)站還是很容易的,直接解析 HTML 文件即可
- import requests
- from bs4 import BeautifulSoup
- url = 'https://www.kuaiyilicai.com/stats/global/yearly_per_country/g_population_female_perc/chn.html'
- res = requests.get(url).text
- html = BeautifulSoup(res, 'html.parser')
- html.find('tbody').find_all('td')
這樣,就獲取到了所有的表格數(shù)據(jù)
- [<td>2018年</td>,
- <td>48.68%</td>,
- <td>2017年</td>,
- <td>48.67%</td>,
- <td>2016年</td>,
- <td>48.65%</td>,
- <td>2015年</td>,
- <td>48.64%</td>,
- <td>2014年</td>,
- <td>48.63%</td>,
- ...
不過這個表格數(shù)據(jù)里會有谷歌廣告的代碼,需要去掉下
- chinese_data = html.find('tbody').find_all('td')
- i = 0
- for d in chinese_data:
- if r"adsbygoogle" in d.text:
- chinese_data.pop(i)
- i += 1
接下來就可以獲取年份和對應(yīng)的數(shù)據(jù)了
- year = []
- data = []
- i = 1
- for d in chinese_data:
- if i == 1 or i%2 != 0:
- year.append(d.text)
- else:
- temp = d.text.split('%')
- data.append(temp[0])
- i += 1
拿到 year 和 data 兩個列表后,我們就可以開始作圖了。
當(dāng)然我還獲取了世界上其他國家的女性比例,出生性別比例等數(shù)據(jù),抓取方式都類似,就不再一一重復(fù)了。
作圖分析
歷年女性占比分析
可以看到,我國的女性占比常年是低于50%,大膽推測,這絕對和我們上下五千年的歷史文化遺留有關(guān)啊,嗯,就說到這,不能再多說了。
然后還能看出,在新中國建國初期,女性的比例是最低的,之后才逐年增加。按道理來講,在經(jīng)歷了軍閥混戰(zhàn),抗日戰(zhàn)爭等數(shù)十年戰(zhàn)亂后,數(shù)以百萬的熱血男兒血灑中華大地的背景下,男女比例應(yīng)該有所平衡啊,沒想到竟然還是男女比例失衡的這么嚴(yán)重。
不過情形在慢慢變好,在上世紀(jì)80年代左右,我國的女性占比很好的穩(wěn)定在了48.69%-48.68%這里,而48.69%竟然已經(jīng)是女性占比的最高比例了。
接著又不太清楚是什么情況,在新千年的前十年里,女性比例又大幅下降,隨后才又逐年增長,不知道正在上小學(xué)或者初中的小男孩們,有沒有感覺到身邊的異性有點(diǎn)少啊。
我這里還做了柱狀圖,同樣可以看到在60年到70年這十年里,女性比例的增長還是非常明顯的
接下來我們著重看看2018年的數(shù)據(jù)吧,這一年女性占比為48.68%,而根據(jù)人口普查,2018年我國總?cè)丝跒?3.93億 (1,392,730,000),那么男性比女性就多出了36,768,072,整整3千6百多萬人啊。所以說如果你在去年還是單身,那么不要悲傷,因?yàn)樽钌龠€有3千多萬人陪著你,當(dāng)然如果你現(xiàn)在成功脫單了,祝賀你,你是那個踏過獨(dú)木橋的人,堪稱中了超級福利彩票,請一定要珍惜!
歷年出生比例分析
出生人口性別比是指活產(chǎn)男嬰數(shù)與活產(chǎn)女嬰數(shù)的比值。正常情況下,出生性別比是由生物學(xué)規(guī)律決定的,保持在1.02—1.07之間。
也就是說正常情況下統(tǒng)計(jì)學(xué)界和生物學(xué)界已經(jīng)默認(rèn)了男性出生比例要高于女性呀,苦不苦,看看人家薩達(dá)姆吧。
下面就來看看我國歷年的出生性別走勢圖
可以看到,在1990年以前,我們出生性別比例還都能保持在正常水平,但是在臨近新千年和新千年的頭十年里,這一比例大幅增長,難道說在這一期間“養(yǎng)兒防老”這一口號正在盛行?
具體原因就不再深究了,咱也不知道,咱也不敢說啊。
我們還是找一年為例子,看看該年出生的男女?dāng)?shù)量的差值
我以2007年為例子,這一年的出生性別比例為1.17,雖然我們拿不到當(dāng)年的總的出生人數(shù),但是可以拿到當(dāng)年的出生率和人口總數(shù)啊,那么也是可以勉強(qiáng)計(jì)算下的。
在我的一番小學(xué)數(shù)學(xué)操作下,得出2007年出生男孩比女孩多了1,672,560人,一百多萬啊,這還只是一年,那么多年累計(jì)下來,差個3千多萬也就正常了
所以說,在2007年出生的男同胞們,雖然還!沒!到!找!對!象!的年紀(jì),但是要趁早啊,你們壓力山大,形勢險峻啊!大學(xué)時能下手,不要等到畢業(yè);高中時有機(jī)會,不要留到異地;初中時有想法,別想著上高中的;小學(xué)時春心蕩漾了,你就等著挨揍吧(男女混合雙打,就問你怕不怕)!
上面說了這么多國內(nèi)的苦大仇深,接下來看看世界范圍內(nèi)的數(shù)據(jù)吧,是幸福還是痛苦,比對才能出真理啊
世界各國女性占比
我這里先選取了世界范圍內(nèi)女性占比前十的數(shù)據(jù),來看看哪個國家的男同胞們最幸福
我們一直聽到的都是東歐美女多,剩女也多,看來真的不假啊。拉脫維亞、立陶宛、烏克蘭,白俄羅斯這些國家是不是大家都耳熟能詳,在多少個慢慢長夜,孤枕難眠的時候,哎呀我去,跑題了!
不過前些年網(wǎng)絡(luò)上流行的國內(nèi)屌絲小伙,到了烏克蘭通過個人奮斗,成功迎娶白富美,走上人生巔峰的事跡還是一直在激勵著我(們)呀。
這么多年過去了,他還好嗎?
再來看下榜單的第一位,庫拉索,這是個神馬地方,表示沒聽過。百度之
原來是荷蘭王國的自治領(lǐng)地啊,人口常年在15萬人左右,感覺沒啥好說的。
下面就刺激了,我們來看看女性比例排名后十的國家和地區(qū)都是哪些呢
從后面數(shù)五個,清一色的穆斯林國家,這真的是再正常不過了,原因你懂的。而卡塔爾和阿聯(lián)酋的女性比例竟然還不到30%,這也太低了,怪不得有同事從中東回來說,看見母豬都是親切的。
世界范圍出生性別比例
最后我們再來看下在世界范圍內(nèi),出生性別比例的數(shù)據(jù)
比例最高的前十名
沒想到我國竟然榮登榜首,看來兩千多年的封建史,帶來的某些根深蒂固的思維,不是一時之間就可以完全沖破的。時至今日,還有相當(dāng)一部分的人保留著陳舊的思想--重男而輕女。但是啊,時代不同了,男女都一樣嘍
女子能頂半邊天
所以說,綜上分析,作為程序猿們,我們成功脫單,那是個人實(shí)力和人格魅力的成功體現(xiàn),如果還在單身,沒事兒的朋友,大環(huán)境不好啊
別說了
好了,今天的分享就到這里了,怎么樣,找到你單身的原因了嘛,你趕上那個最好最壞的時代了嗎?