自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<ruby id="bcyz5"></ruby>

<cite id="bcyz5"><track id="bcyz5"></track></cite>

<sub id="bcyz5"><p id="bcyz5"></p></sub>

^{<sub id="bcyz5"></sub>}

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫

賬號(hào)設(shè)置退出

R語言作圖：如何在數(shù)據(jù)可視化過程中調(diào)整因子順序

作者：Codewar 2020-08-21 14:09:46

大數(shù)據(jù) 數(shù)據(jù)可視化

今天的內(nèi)容依然是來自《R for datascience》，目前已經(jīng)看到了15.4了，每次遇到比較有意思的我自己不會(huì)的操作就會(huì)在這兒寫下來，所以，如果你對(duì)我寫的東西感興趣的話，建議你去看原版書籍，順便關(guān)注我一波。嘿嘿。

今天的內(nèi)容依然是來自《R for datascience》，目前已經(jīng)看到了15.4了，每次遇到比較有意思的我自己不會(huì)的操作就會(huì)在這兒寫下來，所以，如果你對(duì)我寫的東西感興趣的話，建議你去看原版書籍，順便關(guān)注我一波。嘿嘿。

實(shí)例操練

這個(gè)例子使用的數(shù)據(jù)集為tidyverse包自帶的數(shù)據(jù)集，大家可以使用?gss_cat查看相關(guān)變量，這兒不再贅述。

在數(shù)據(jù)可視化過程中改變因子順序是一個(gè)經(jīng)常性的操作，比如我們想看看不同religions的average number of hours spent watching TV per day有什么不同，我們可以用以下代碼：

relig_summary <- gss_cat %>% 
  group_by(relig) %>% 
  summarise( 
    age = mean(age, na.rm = TRUE), 
    tvhours = mean(tvhours, na.rm = TRUE), 
    n = n() 
  ) 
 
ggplot(relig_summary, aes(tvhours, relig)) + geom_point()

運(yùn)行代碼得到輸出的點(diǎn)圖如下：

上面的這個(gè)點(diǎn)圖其實(shí)很不好看，我們可能會(huì)覺得能不能把religions的順序變一變，讓有最小tvhours的religion在y軸的最下面，有最大tvhours的在最上面。

怎么做呢，需要用到fct_reorder()方法，這個(gè)方法取2個(gè)參數(shù)：

第一個(gè)就是你想改變順序的因子，本例中：religions
第二個(gè)，改變順序的參照物，本例中：tvhours

代碼如下：

ggplot(relig_summary, aes(tvhours, fct_reorder(relig, tvhours))) + 
  geom_point()

可以看到，改變了religions的順序后這個(gè)圖就更加清晰明白了。

再看一個(gè)例子：

rincome_summary <- gss_cat %>% 
  group_by(rincome) %>% 
  summarise( 
    age = mean(age, na.rm = TRUE), 
    tvhours = mean(tvhours, na.rm = TRUE), 
    n = n() 
  ) 
 
ggplot(rincome_summary, aes(age, fct_reorder(rincome, age))) + geom_point()

上面的代碼，可以畫出按年齡排序后不同rincome和age的關(guān)系：

但是，問題出在按年齡排序后我們的收入(y軸)顯得很亂，所以這個(gè)方法并不好，考慮到收入本來就是有順序的，所以好的處理方法為保留收入的原始順序，于是我們寫出了如下代碼：

rincome_summary <- gss_cat %>% 
  group_by(rincome) %>% 
  summarise( 
    age = mean(age, na.rm = TRUE), 
    tvhours = mean(tvhours, na.rm = TRUE), 
    n = n() 
  ) 
 
ggplot(rincome_summary, aes(age, rincome)) + geom_point()

這次再看我們的圖，雖然其他的收入levels都排的挺好，但是我們不希望“Not applicable”排在第一。這個(gè)時(shí)候我們可以用fct_relevel()，它也有2個(gè)參數(shù)：

需要排序的因子，本例中：rincome
需要放在最前面的levels，本例中：Not applicable

代碼如下：

ggplot(rincome_summary, aes(age, fct_relevel(rincome, "Not applicable"))) + 
  geom_point()

這一下，我們的圖形就比較滿意了。

再看一個(gè)例子：線圖的顏色控制：

by_age <- gss_cat %>% 
  filter(!is.na(age)) %>% 
  count(age, marital) %>% 
  group_by(age) %>% 
  mutate(prop = n / sum(n)) 
 
ggplot(by_age, aes(age, prop, colour = marital)) + 
  geom_line(na.rm = TRUE) 
 
ggplot(by_age, aes(age, prop, colour = fct_reorder2(marital, age, prop))) + 
  geom_line() + 
  labs(colour = "marital")

上面的代碼畫的是不同的年齡中婚姻狀況的比例變化：

我們通過fct_reorder2實(shí)現(xiàn)了圖例和x變量最大時(shí)y的值的順序一致，可以更加明晰。

最后再看一個(gè)柱狀圖調(diào)整因子順序的例子

下面的代碼可以，正序逆序改變x軸標(biāo)簽：

gss_cat %>% 
  mutate(marital = marital %>% fct_infreq() ) %>% 
  ggplot(aes(marital)) + 
    geom_bar() 
 
gss_cat %>% 
  mutate(marital = marital %>% fct_infreq() %>% fct_rev()) %>% 
  ggplot(aes(marital)) + 
    geom_bar()

大家可以在自己電腦上運(yùn)行試試，關(guān)鍵就在于fct_rev()。

小結(jié)

今天通過3個(gè)例子給大家介紹了可視化中因子順序的改變，感謝大家耐心看完。發(fā)表這些東西的主要目的就是督促自己，希望大家關(guān)注評(píng)論指出不足，一起進(jìn)步。內(nèi)容我都會(huì)寫的很細(xì)，用到的數(shù)據(jù)集也會(huì)在原文中給出鏈接，你只要按照文章中的代碼自己也可以做出一樣的結(jié)果，一個(gè)目的就是零基礎(chǔ)也能懂，因?yàn)樽约壕褪鞘裁椿A(chǔ)沒有從零學(xué)Python和R的，加油。

責(zé)任編輯：未麗燕來源：今日頭條

可視化數(shù)據(jù)集 R語言

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)

^{<sub id="jrv1a"></sub>}

<sub id="jrv1a"></sub>