自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

R語言作圖:如何在數(shù)據(jù)可視化過程中調(diào)整因子順序

大數(shù)據(jù) 數(shù)據(jù)可視化
今天的內(nèi)容依然是來自《R for datascience》,目前已經(jīng)看到了15.4了,每次遇到比較有意思的我自己不會(huì)的操作就會(huì)在這兒寫下來,所以,如果你對(duì)我寫的東西感興趣的話,建議你去看原版書籍,順便關(guān)注我一波。嘿嘿。

今天的內(nèi)容依然是來自《R for datascience》,目前已經(jīng)看到了15.4了,每次遇到比較有意思的我自己不會(huì)的操作就會(huì)在這兒寫下來,所以,如果你對(duì)我寫的東西感興趣的話,建議你去看原版書籍,順便關(guān)注我一波。嘿嘿。

實(shí)例操練

這個(gè)例子使用的數(shù)據(jù)集為tidyverse包自帶的數(shù)據(jù)集,大家可以使用?gss_cat查看相關(guān)變量,這兒不再贅述。

在數(shù)據(jù)可視化過程中改變因子順序是一個(gè)經(jīng)常性的操作,比如我們想看看不同religions的average number of hours spent watching TV per day有什么不同,我們可以用以下代碼:

  1. relig_summary <- gss_cat %>% 
  2.   group_by(relig) %>% 
  3.   summarise( 
  4.     age = mean(age, na.rm = TRUE), 
  5.     tvhours = mean(tvhours, na.rm = TRUE), 
  6.     n = n() 
  7.   ) 
  8.  
  9. ggplot(relig_summary, aes(tvhours, relig)) + geom_point() 

運(yùn)行代碼得到輸出的點(diǎn)圖如下:

上面的這個(gè)點(diǎn)圖其實(shí)很不好看,我們可能會(huì)覺得能不能把religions的順序變一變,讓有最小tvhours的religion在y軸的最下面,有最大tvhours的在最上面。

怎么做呢,需要用到fct_reorder()方法,這個(gè)方法取2個(gè)參數(shù):

  • 第一個(gè)就是你想改變順序的因子,本例中:religions
  • 第二個(gè),改變順序的參照物,本例中:tvhours

代碼如下:

  1. ggplot(relig_summary, aes(tvhours, fct_reorder(relig, tvhours))) + 
  2.   geom_point() 

 

可以看到,改變了religions的順序后這個(gè)圖就更加清晰明白了。

再看一個(gè)例子:

  1. rincome_summary <- gss_cat %>% 
  2.   group_by(rincome) %>% 
  3.   summarise( 
  4.     age = mean(age, na.rm = TRUE), 
  5.     tvhours = mean(tvhours, na.rm = TRUE), 
  6.     n = n() 
  7.   ) 
  8.  
  9. ggplot(rincome_summary, aes(age, fct_reorder(rincome, age))) + geom_point() 

上面的代碼,可以畫出按年齡排序后不同rincome和age的關(guān)系:

但是,問題出在按年齡排序后我們的收入(y軸)顯得很亂,所以這個(gè)方法并不好,考慮到收入本來就是有順序的,所以好的處理方法為保留收入的原始順序,于是我們寫出了如下代碼:

  1. rincome_summary <- gss_cat %>% 
  2.   group_by(rincome) %>% 
  3.   summarise( 
  4.     age = mean(age, na.rm = TRUE), 
  5.     tvhours = mean(tvhours, na.rm = TRUE), 
  6.     n = n() 
  7.   ) 
  8.  
  9. ggplot(rincome_summary, aes(age, rincome)) + geom_point() 

 

這次再看我們的圖,雖然其他的收入levels都排的挺好,但是我們不希望“Not applicable”排在第一。這個(gè)時(shí)候我們可以用fct_relevel(),它也有2個(gè)參數(shù):

  • 需要排序的因子,本例中:rincome
  • 需要放在最前面的levels,本例中:Not applicable

代碼如下:

  1. ggplot(rincome_summary, aes(age, fct_relevel(rincome, "Not applicable"))) + 
  2.   geom_point()

這一下,我們的圖形就比較滿意了。

再看一個(gè)例子:線圖的顏色控制:

  1. by_age <- gss_cat %>% 
  2.   filter(!is.na(age)) %>% 
  3.   count(age, marital) %>% 
  4.   group_by(age) %>% 
  5.   mutate(prop = n / sum(n)) 
  6.  
  7. ggplot(by_age, aes(age, prop, colour = marital)) + 
  8.   geom_line(na.rm = TRUE
  9.  
  10. ggplot(by_age, aes(age, prop, colour = fct_reorder2(marital, age, prop))) + 
  11.   geom_line() + 
  12.   labs(colour = "marital"

上面的代碼畫的是不同的年齡中婚姻狀況的比例變化:

 

我們通過fct_reorder2實(shí)現(xiàn)了圖例和x變量最大時(shí)y的值的順序一致,可以更加明晰。

最后再看一個(gè)柱狀圖調(diào)整因子順序的例子

下面的代碼可以,正序逆序改變x軸標(biāo)簽:

  1. gss_cat %>% 
  2.   mutate(marital = marital %>% fct_infreq() ) %>% 
  3.   ggplot(aes(marital)) + 
  4.     geom_bar() 
  5.  
  6. gss_cat %>% 
  7.   mutate(marital = marital %>% fct_infreq() %>% fct_rev()) %>% 
  8.   ggplot(aes(marital)) + 
  9.     geom_bar() 

大家可以在自己電腦上運(yùn)行試試,關(guān)鍵就在于fct_rev()。

小結(jié)

今天通過3個(gè)例子給大家介紹了可視化中因子順序的改變,感謝大家耐心看完。發(fā)表這些東西的主要目的就是督促自己,希望大家關(guān)注評(píng)論指出不足,一起進(jìn)步。內(nèi)容我都會(huì)寫的很細(xì),用到的數(shù)據(jù)集也會(huì)在原文中給出鏈接,你只要按照文章中的代碼自己也可以做出一樣的結(jié)果,一個(gè)目的就是零基礎(chǔ)也能懂,因?yàn)樽约壕褪鞘裁椿A(chǔ)沒有從零學(xué)Python和R的,加油。

責(zé)任編輯:未麗燕 來源: 今日頭條
相關(guān)推薦

2017-10-17 11:58:54

R語言UpSetR可視化

2020-03-11 14:39:26

數(shù)據(jù)可視化地圖可視化地理信息

2017-10-14 13:54:26

數(shù)據(jù)可視化數(shù)據(jù)信息可視化

2024-07-11 15:20:10

2011-08-11 14:35:47

SQL Server插入更新

2018-05-16 07:53:51

R函數(shù)可視化

2022-11-02 11:09:56

制造業(yè)IT領(lǐng)導(dǎo)者

2024-03-07 09:00:04

Rust數(shù)據(jù)可視化

2017-02-16 09:30:04

數(shù)據(jù)可視化信息

2022-06-29 08:28:58

數(shù)據(jù)可視化數(shù)據(jù)可視化平臺(tái)

2021-04-09 10:42:03

數(shù)據(jù)可視化框架大數(shù)據(jù)

2024-01-31 16:36:53

2015-08-20 10:00:45

可視化

2017-09-11 13:33:44

大數(shù)據(jù)數(shù)據(jù)可視化決策樹

2023-10-23 16:11:14

2020-10-26 15:33:13

可視化數(shù)據(jù)項(xiàng)目

2021-03-05 14:49:28

編程語言工具

2018-05-14 09:43:07

數(shù)字化轉(zhuǎn)型

2017-06-19 08:30:35

大數(shù)據(jù)數(shù)據(jù)可視化報(bào)表

2020-07-13 14:35:25

可視化數(shù)據(jù)編程
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)