自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

高考結(jié)束,用 Python 來(lái)分析下哪里的高考是地獄級(jí)難度

大數(shù)據(jù) 數(shù)據(jù)分析 前端
一年一度的高考,可以說是廣大學(xué)子必經(jīng)的磨練,正所謂十年寒窗苦,一朝天下知。而高考,也成為了當(dāng)前中國(guó)最為廣泛,最為公平的晉升之路,可以說考上了一個(gè)名牌大學(xué),那么未來(lái)的道路會(huì)好走很多。

一年一度的高考,可以說是廣大學(xué)子必經(jīng)的磨練,正所謂十年寒窗苦,一朝天下知。而高考,也成為了當(dāng)前中國(guó)最為廣泛,最為公平的晉升之路,可以說考上了一個(gè)名牌大學(xué),那么未來(lái)的道路會(huì)好走很多。

但是又由于我國(guó)幅員遼闊,各地的教育資源又不盡相同,從而導(dǎo)致不同省份的升學(xué)難度也不盡相同。有的地方的高考屬于優(yōu)惠模式,而有的省份的高考競(jìng)爭(zhēng),又可以稱得上是地獄模式。下面我們就通過一組數(shù)據(jù)來(lái)具體看一下。

考生人數(shù)

高考的升學(xué)難不難,一個(gè)較為直觀的因素就是內(nèi)部競(jìng)爭(zhēng)壓力大不大,那么每個(gè)省份的考生人數(shù)就很關(guān)鍵了。

考生人數(shù)前十名的省份

圖片

從上圖可以看出,河南的考生人數(shù)遠(yuǎn)遠(yuǎn)超過其他省份,而且聽說復(fù)讀生占據(jù)了3成的比例,這個(gè)內(nèi)卷太嚴(yán)重了。

山東、廣東和四川的考生也超過了70萬(wàn)人,內(nèi)部競(jìng)爭(zhēng)壓力也應(yīng)該很大。

考生人數(shù)后十名的省份

在后十名當(dāng)中,三個(gè)直轄市都上榜了,畢竟面積小,人口相對(duì)也少。還有就是大西北的新疆,寧夏,內(nèi)蒙等,當(dāng)然還有青藏雙姝西藏和青海。

在這些省份當(dāng)中,除了三個(gè)直轄市以外,其他省份的教育資源都不是特別好,那么可以想象的到,即使內(nèi)部壓力不大,但是在與其他省份,比如河南,山東等考試競(jìng)爭(zhēng)的時(shí)候,還是會(huì)吃虧比較大的。

歷年各省分?jǐn)?shù)線

這里我們從下面的網(wǎng)站抓取了歷年各省的分?jǐn)?shù)線,先來(lái)橫向?qū)Ρ认拢?/p>

http://college.gaokao.com/areapoint/p1/

抓取與數(shù)據(jù)處理部分代碼

df = pd.DataFrame()
for i in range(1, 206):
test = "http://college.gaokao.com/areapoint/p%s/" % str(i)
print(test)
d = pd.read_html(test)[0]
df = pd.concat([df, d], axis=0, ignore_index=True)
benke = df[df["批次名稱"].isin(['本科一批'])|df["批次名稱"].isin(['本科批'])|df["批次名稱"].isin(['本科'])|df["批次名稱"].isin(['平行錄取一段'])|df["批次名稱"].isin(['普通類一段'])]
benke_2020 = benke[benke["年份"]==2020].drop_duplicates()
benke_2020_like = benke_2020[(benke_2020["文理分科"]=='理科')|(benke_2020["文理分科"]=='綜合改革')]
benke_2020_like_wenke = benke_2020[(benke_2020["文理分科"]=='文科')|(benke_2020["文理分科"]=='綜合改革')]
benke_2020_like_sort = benke_2020_like.sort_values(by=['最低控制分?jǐn)?shù)線'], ascending=False)
benke_2020_like_sort_wenke = benke_2020_like_wenke.sort_values(by=['最低控制分?jǐn)?shù)線'], ascending=False)

下面先來(lái)看下2021年,各省份的分?jǐn)?shù)線情況:

圖片

可以看到,一本理科分?jǐn)?shù)線最高的為四川,高達(dá)521,這個(gè)數(shù)字好像不是特別高,因?yàn)槲覀兯坪跞匀挥浀?020年的最高分?jǐn)?shù)線。

圖片

接下來(lái)是文科比較

圖片

錄取分?jǐn)?shù)線最高的竟然是云南,而且高達(dá)565,不得不說,文科還是更卷??!

對(duì)比2020年,浙江則是最高的594,只能說浙江的同學(xué)們,太難了,也太厲害了!

當(dāng)然了,河南的同學(xué)也不容易,雙雙第二名,苦著呢!

我們?cè)偻ㄟ^圖例來(lái)更加直觀的看一下各省份的錄取分?jǐn)?shù)線。

2020理科一本分?jǐn)?shù)前十

在2020年,前十名里,一本分?jǐn)?shù)線都超過了500分,競(jìng)爭(zhēng)壓力還是很大的,而到了2021年,前十名里,不僅總體分?jǐn)?shù)下降了,而且有五名都是500分以下,這是不是說明高中生們的壓力沒有那么大了呢~

2020文科一本分?jǐn)?shù)前十

圖片

圖片

總體來(lái)說,文科想來(lái)要比理科的分?jǐn)?shù)高,但是2021年還是比2020年要低了不少的。

當(dāng)然了,上面這些還不能很全面的反映一個(gè)省份的高考難易程度,我們?cè)賮?lái)看一下各個(gè)省份的高校情況。

高質(zhì)量高校

我這里提前獲取了全國(guó)各省份的高校數(shù)據(jù),下面先來(lái)看下各省高校數(shù)量情況。

df = pd.read_csv("college_data.csv")
df_new = df.drop_duplicates(subset=['name']) # 有重復(fù)的數(shù)據(jù),需要?jiǎng)h除
df_site = df_new[df_new['site'] != '——']
df_site = df_site[df_site['site'] != '------']

# 高??倲?shù)量分析
site_counts = df_site['site'].value_counts()
dict_site = {'name': site_counts.index, 'counts': site_counts.values}
data = pd.DataFrame(dict_site)

b = (Bar()
.add_xaxis(data['name'].values.tolist()[:10])
.add_yaxis("", data['counts'].values.tolist()[:10])
.set_global_opts(
xaxis_opts=opts.AxisOpts(axislabel_opts=opts.LabelOpts(rotate=-15)),
title_opts=opts.TitleOpts(title="各城市高校數(shù)量", subtitle=""),
# datazoom_opts=opts.DataZoomOpts(),
)
.set_series_opts()
)
grid = Grid(init_opts=opts.InitOpts(theme=ThemeType.VINTAGE))
grid.add(b, grid_opts=opts.GridOpts(pos_left="20%"))
grid.render_notebook()

上面進(jìn)行了簡(jiǎn)單的數(shù)據(jù)處理,可以得到各省份的高校數(shù)量。

高校數(shù)量

可以看到高校數(shù)量最多的是江蘇,而號(hào)稱高校重災(zāi)區(qū)的河南也赫然在榜。

那么再來(lái)看下985&211數(shù)量情況呢?

這下差距就明顯了,北京太強(qiáng)了,獨(dú)一份的存在!

河南已經(jīng)不見了,鄭州大學(xué)就是獨(dú)苗!

高考難度等級(jí)

下面,我們來(lái)自己寫一個(gè)規(guī)則,判定下各省份的高考難度情況。

我們選擇的參考變量為各省份的高質(zhì)量院校數(shù)量和該省份的考生數(shù)量。

公式為:(高質(zhì)量院校/10)/(考生人數(shù)/10)

這里得到的數(shù)值就是每個(gè)省份的難易程度,數(shù)值越大,難度越高!

最終我們得到的數(shù)據(jù)大概如下,finally_par 就是最終的難度系數(shù)。

圖片

河南一馬當(dāng)先,這很河南啊!

高考難度前十名

圖片

可以看到,我們通過上面的計(jì)算方式得出的難度系數(shù)之后,河南,江西,廣西占據(jù)前三,不知道這三個(gè)地方的童鞋們是不是也是這種感受呢?

高考難度后十名

對(duì)于后十名,相信很多同學(xué)都有自己的看法。

很明顯,三大直轄市,人口少,高質(zhì)量高校多,那么相對(duì)來(lái)說考上名牌大學(xué)的機(jī)會(huì)也自然多了。

另外東三省也有幸上榜,人口少就是優(yōu)勢(shì)嗎?

高考難度地圖分布

下面我們來(lái)看下高質(zhì)量院校的分布與高考難度的分布情況。

高質(zhì)量院校分布熱力圖

很明顯,京津地區(qū)無(wú)可比擬。

高考難度分布熱力圖

圖片

基本和高質(zhì)量院校分布呈反向分布,看來(lái)建設(shè)高質(zhì)量的高等學(xué)府才是出路呀!

最后再來(lái)看一張更加直觀的地圖分布。

圖片

只想說一句,河南啊河南,你都紅了!

責(zé)任編輯:華軒 來(lái)源: 蘿卜大雜燴
相關(guān)推薦

2020-08-18 08:26:37

Python編程語(yǔ)言高考

2021-08-04 16:58:25

數(shù)據(jù)高考錄取人數(shù)

2012-06-11 09:29:16

2017-12-11 15:30:53

Python語(yǔ)言高考

2024-06-19 10:48:31

ChatGPTGPT項(xiàng)目

2018-12-18 09:54:30

2019-06-28 15:54:49

大數(shù)據(jù)

2018-06-06 16:41:53

Python高考考題

2018-06-13 09:23:30

Python爬蟲高考分?jǐn)?shù)線

2020-07-06 09:45:37

Python高考工具

2010-09-01 15:30:46

2015-06-15 15:41:56

高考考生特點(diǎn)

2021-06-22 16:37:11

支付寶高考查分移動(dòng)應(yīng)用

2015-06-09 09:39:27

2018-06-07 09:37:13

人工智能

2015-06-19 11:14:13

身份識(shí)別神器
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)