自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<pre id="yo3ig"><span id="yo3ig"></span></pre>

<sub id="yo3ig"></sub>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

賬號(hào)設(shè)置退出

高考結(jié)束，用 Python 來(lái)分析下哪里的高考是地獄級(jí)難度

作者：周蘿卜 2022-06-11 23:16:47

大數(shù)據(jù) 數(shù)據(jù)分析前端

一年一度的高考，可以說是廣大學(xué)子必經(jīng)的磨練，正所謂十年寒窗苦，一朝天下知。而高考，也成為了當(dāng)前中國(guó)最為廣泛，最為公平的晉升之路，可以說考上了一個(gè)名牌大學(xué)，那么未來(lái)的道路會(huì)好走很多。

一年一度的高考，可以說是廣大學(xué)子必經(jīng)的磨練，正所謂十年寒窗苦，一朝天下知。而高考，也成為了當(dāng)前中國(guó)最為廣泛，最為公平的晉升之路，可以說考上了一個(gè)名牌大學(xué)，那么未來(lái)的道路會(huì)好走很多。

但是又由于我國(guó)幅員遼闊，各地的教育資源又不盡相同，從而導(dǎo)致不同省份的升學(xué)難度也不盡相同。有的地方的高考屬于優(yōu)惠模式，而有的省份的高考競(jìng)爭(zhēng)，又可以稱得上是地獄模式。下面我們就通過一組數(shù)據(jù)來(lái)具體看一下。

考生人數(shù)

高考的升學(xué)難不難，一個(gè)較為直觀的因素就是內(nèi)部競(jìng)爭(zhēng)壓力大不大，那么每個(gè)省份的考生人數(shù)就很關(guān)鍵了。

考生人數(shù)前十名的省份

從上圖可以看出，河南的考生人數(shù)遠(yuǎn)遠(yuǎn)超過其他省份，而且聽說復(fù)讀生占據(jù)了3成的比例，這個(gè)內(nèi)卷太嚴(yán)重了。

山東、廣東和四川的考生也超過了70萬(wàn)人，內(nèi)部競(jìng)爭(zhēng)壓力也應(yīng)該很大。

考生人數(shù)后十名的省份

在后十名當(dāng)中，三個(gè)直轄市都上榜了，畢竟面積小，人口相對(duì)也少。還有就是大西北的新疆，寧夏，內(nèi)蒙等，當(dāng)然還有青藏雙姝西藏和青海。

在這些省份當(dāng)中，除了三個(gè)直轄市以外，其他省份的教育資源都不是特別好，那么可以想象的到，即使內(nèi)部壓力不大，但是在與其他省份，比如河南，山東等考試競(jìng)爭(zhēng)的時(shí)候，還是會(huì)吃虧比較大的。

歷年各省分?jǐn)?shù)線

這里我們從下面的網(wǎng)站抓取了歷年各省的分?jǐn)?shù)線，先來(lái)橫向?qū)Ρ认拢?/p>

http://college.gaokao.com/areapoint/p1/

抓取與數(shù)據(jù)處理部分代碼

df = pd.DataFrame()
for i in range(1, 206):
    test = "http://college.gaokao.com/areapoint/p%s/" % str(i)
    print(test)
    d = pd.read_html(test)[0]
    df = pd.concat([df, d], axis=0, ignore_index=True)
benke = df[df["批次名稱"].isin(['本科一批'])|df["批次名稱"].isin(['本科批'])|df["批次名稱"].isin(['本科'])|df["批次名稱"].isin(['平行錄取一段'])|df["批次名稱"].isin(['普通類一段'])]
benke_2020 = benke[benke["年份"]==2020].drop_duplicates()
benke_2020_like = benke_2020[(benke_2020["文理分科"]=='理科')|(benke_2020["文理分科"]=='綜合改革')]
benke_2020_like_wenke = benke_2020[(benke_2020["文理分科"]=='文科')|(benke_2020["文理分科"]=='綜合改革')]
benke_2020_like_sort = benke_2020_like.sort_values(by=['最低控制分?jǐn)?shù)線'], ascending=False)
benke_2020_like_sort_wenke = benke_2020_like_wenke.sort_values(by=['最低控制分?jǐn)?shù)線'], ascending=False)

下面先來(lái)看下2021年，各省份的分?jǐn)?shù)線情況：

可以看到，一本理科分?jǐn)?shù)線最高的為四川，高達(dá)521，這個(gè)數(shù)字好像不是特別高，因?yàn)槲覀兯坪跞匀挥浀?020年的最高分?jǐn)?shù)線。

接下來(lái)是文科比較

錄取分?jǐn)?shù)線最高的竟然是云南，而且高達(dá)565，不得不說，文科還是更卷??！

對(duì)比2020年，浙江則是最高的594，只能說浙江的同學(xué)們，太難了，也太厲害了！

當(dāng)然了，河南的同學(xué)也不容易，雙雙第二名，苦著呢！

我們?cè)偻ㄟ^圖例來(lái)更加直觀的看一下各省份的錄取分?jǐn)?shù)線。

2020理科一本分?jǐn)?shù)前十

在2020年，前十名里，一本分?jǐn)?shù)線都超過了500分，競(jìng)爭(zhēng)壓力還是很大的，而到了2021年，前十名里，不僅總體分?jǐn)?shù)下降了，而且有五名都是500分以下，這是不是說明高中生們的壓力沒有那么大了呢~

2020文科一本分?jǐn)?shù)前十

總體來(lái)說，文科想來(lái)要比理科的分?jǐn)?shù)高，但是2021年還是比2020年要低了不少的。

當(dāng)然了，上面這些還不能很全面的反映一個(gè)省份的高考難易程度，我們?cè)賮?lái)看一下各個(gè)省份的高校情況。

高質(zhì)量高校

我這里提前獲取了全國(guó)各省份的高校數(shù)據(jù)，下面先來(lái)看下各省高校數(shù)量情況。

df = pd.read_csv("college_data.csv")
df_new = df.drop_duplicates(subset=['name'])  # 有重復(fù)的數(shù)據(jù)，需要?jiǎng)h除
df_site = df_new[df_new['site'] != '——']
df_site = df_site[df_site['site'] != '------']

# 高?？倲?shù)量分析
site_counts = df_site['site'].value_counts()
dict_site = {'name': site_counts.index, 'counts': site_counts.values}
data = pd.DataFrame(dict_site)

b = (Bar()
    .add_xaxis(data['name'].values.tolist()[:10])
    .add_yaxis("", data['counts'].values.tolist()[:10])
    .set_global_opts(
    xaxis_opts=opts.AxisOpts(axislabel_opts=opts.LabelOpts(rotate=-15)),
    title_opts=opts.TitleOpts(title="各城市高校數(shù)量", subtitle=""),
    # datazoom_opts=opts.DataZoomOpts(),
)
    .set_series_opts()
    )
grid = Grid(init_opts=opts.InitOpts(theme=ThemeType.VINTAGE))
grid.add(b, grid_opts=opts.GridOpts(pos_left="20%"))
grid.render_notebook()

上面進(jìn)行了簡(jiǎn)單的數(shù)據(jù)處理，可以得到各省份的高校數(shù)量。

高校數(shù)量

可以看到高校數(shù)量最多的是江蘇，而號(hào)稱高校重災(zāi)區(qū)的河南也赫然在榜。

那么再來(lái)看下985&211數(shù)量情況呢？

這下差距就明顯了，北京太強(qiáng)了，獨(dú)一份的存在！

河南已經(jīng)不見了，鄭州大學(xué)就是獨(dú)苗！

高考難度等級(jí)

下面，我們來(lái)自己寫一個(gè)規(guī)則，判定下各省份的高考難度情況。

我們選擇的參考變量為各省份的高質(zhì)量院校數(shù)量和該省份的考生數(shù)量。

公式為：(高質(zhì)量院校/10)/(考生人數(shù)/10)

這里得到的數(shù)值就是每個(gè)省份的難易程度，數(shù)值越大，難度越高！

最終我們得到的數(shù)據(jù)大概如下，finally_par 就是最終的難度系數(shù)。

河南一馬當(dāng)先，這很河南啊！

高考難度前十名

可以看到，我們通過上面的計(jì)算方式得出的難度系數(shù)之后，河南，江西，廣西占據(jù)前三，不知道這三個(gè)地方的童鞋們是不是也是這種感受呢？

高考難度后十名

對(duì)于后十名，相信很多同學(xué)都有自己的看法。

很明顯，三大直轄市，人口少，高質(zhì)量高校多，那么相對(duì)來(lái)說考上名牌大學(xué)的機(jī)會(huì)也自然多了。

另外東三省也有幸上榜，人口少就是優(yōu)勢(shì)嗎？

高考難度地圖分布

下面我們來(lái)看下高質(zhì)量院校的分布與高考難度的分布情況。

高質(zhì)量院校分布熱力圖

很明顯，京津地區(qū)無(wú)可比擬。

高考難度分布熱力圖

基本和高質(zhì)量院校分布呈反向分布，看來(lái)建設(shè)高質(zhì)量的高等學(xué)府才是出路呀！

最后再來(lái)看一張更加直觀的地圖分布。

只想說一句，河南啊河南，你都紅了！

責(zé)任編輯：華軒來(lái)源：蘿卜大雜燴

數(shù)據(jù)分析高考 Python

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)

<sub id="kcd4x"></sub>

<sub id="kcd4x"><i id="kcd4x"></i></sub>