自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

沒資源?下一秒就可以加入的10個數(shù)據(jù)科學項目!

企業(yè)動態(tài)
數(shù)據(jù)資源十分難得,分析過程更是困難重重。挖掘數(shù)據(jù)背后的意義能夠幫助更多的研究者點燃數(shù)據(jù)研究的熱情,也會幫助其他人入門數(shù)據(jù)分析,以下就是我們找到的十個典范。

沒資源?下一秒就可以加入的10個數(shù)據(jù)科學項目!

大數(shù)據(jù)文摘作品

編譯:王夢澤、黃文暢、云舟

數(shù)據(jù)資源十分難得,分析過程更是困難重重。挖掘數(shù)據(jù)背后的意義能夠幫助更多的研究者點燃數(shù)據(jù)研究的熱情,也會幫助其他人入門數(shù)據(jù)分析,以下就是我們找到的十個典范。

1. 刪除Facebook頁面:參與度指標和帖子@d1gi

這是一個關于數(shù)據(jù)新聞工作的案例:在2016年美國總統(tǒng)大選期間,有團隊從Facebook挖掘了外界影響的數(shù)據(jù),并據(jù)此與一些社會上大型的社交媒體展開了正面交鋒。這場調(diào)查被包括華盛頓郵報和紐約時代周刊在內(nèi)的知名媒體所收錄。

這份數(shù)據(jù)是由數(shù)據(jù)新聞研究中心的Jonathan Albright為Digital Journalism提供的,是由5個宣稱具有外在影響力的網(wǎng)頁中的每一個頁面上自然發(fā)言讀者的帖子所構成的目錄冊。

它不僅保存了每篇帖子的完整文檔,也揭示了除購買廣告外,使用Facebook平臺所能帶來的其他潛在影響力。具體來說,這五個網(wǎng)頁的內(nèi)容傳播力度更大。此外,這個數(shù)據(jù)集的討論區(qū)是今年data.world里面最為火爆的。

Jonathan鼓勵大家使用這個數(shù)據(jù)集來開展自己的研究和分析。這個集成數(shù)據(jù)集也展示了data.world上的其他新聞數(shù)據(jù)工作。

集成數(shù)據(jù)集:

https://data.world/gswider/data-journalism-on-data-world?utm_campaign=distinct_values&utm_source=blog&utm_medium=medium&utm_content=171229

Jonathan制作的互動性可視化界面

Jonathan制作的互動性可視化界面

2. 數(shù)字貨幣的每日行情@scuttlemonkey

如果你在去年的這個時候投資了比特幣,你現(xiàn)在可能已經(jīng)賺得盆豐缽滿了。但如果你沒有投資,也可以在這個數(shù)據(jù)集里使用比特幣后悔計算器,來得出你錯過的收益。

這個項目在IFTTT使用data.world的同步程序,從Coin Metrics(一個提供可視化服務的數(shù)據(jù)聚合器)提取每日最新數(shù)字貨幣的數(shù)據(jù)。在此數(shù)據(jù)集的討論區(qū)中,你可以查看十多種加密貨幣的價格走勢及多種視覺效果圖。

數(shù)據(jù)集討論區(qū):

https://data.world/scuttlemonkey/coin-metrics/discuss/visualizations/64263?utm_campaign=dataquest&utm_source=blog&utm_content=180122

Patrick制作的數(shù)據(jù)可視化效果

Patrick制作的數(shù)據(jù)可視化效果

3. 聯(lián)邦政府如何應對類鴉片類藥物泛濫問題@usaspending

在美國,由于類鴉片類藥物濫用而導致的服藥過量率上升趨勢令人擔憂,它影響著全美成千上萬的家庭。來自USAspending.gov的最新數(shù)據(jù)是由經(jīng)財政部發(fā)布在data.world上的,里面包含詳細的項目介紹和機構信息,你可以通過它了解聯(lián)邦政府為解決這一問題所做的工作。

haotianxu91對此數(shù)據(jù)集進行了深入挖掘,并探究了能否把聯(lián)邦政府提供的數(shù)據(jù)和對鴉片類藥物濫用的治療以及預防項目聯(lián)系到一起。

項目詳情:

https://data.world/search?q=org%3Atreasury&utm_campaign=dataquest&utm_source=blog&utm_content=180122

Data.world上公開且容易獲取的數(shù)據(jù)使得美國許多州及聯(lián)邦政府機構都在努力提高財政支出的責任感和透明度。輸入data.world組織名稱來搜索代理機構,就可能在data.world找到更多的政府數(shù)據(jù)。

data.world鏈接:

https://data.world/search?q=org%3Atreasury&utm_campaign=dataquest&utm_source=blog&utm_content=180122

由Haotian Xu提供

由Haotian Xu提供

4. 關聯(lián)電影數(shù)據(jù)庫@linked-data

在data.world,我們認為數(shù)據(jù)在(不久的)未來是有關聯(lián)的,我們十分期待看到更多的社區(qū)成員解鎖關聯(lián)數(shù)據(jù)的真正潛力,并且使用SPARQL—一種數(shù)據(jù)庫的語義查詢語言(以data.world的貓頭鷹吉祥物命名)。

使用SPARQL對這組數(shù)據(jù)集進行查詢再現(xiàn)了著名的“Kevin Bacon的六度空間”理論(“Six Degrees of Kevin Bacon” )——對于數(shù)據(jù)集中的任意兩位演員,通過查詢他們以前合作的搭檔,你會發(fā)現(xiàn)他們之間所間隔的人(如果存在)不會超過六個。

只需在查詢語句的第7和第8行中替換你想要查詢的演員名字,然后點擊“運行查詢”,就可以開啟“SPARQL的六度空間”了。(提示:結果十分有趣,可以多試幾次。)

SPARQL的六度空間:

https://data.world/login?next=%2Flinked-data%2Flinkedmdb%2Fworkspace%2Fquery%3Fqueryid%3Db671cc87-2078-4057-b1eb-366e9c5f48e1%26utm_campaign%3Ddataquest%26utm_content%3D180122%26utm_source%3Dblog

5. 最需要幫助的颶風重災區(qū)@alyssaanalyzes

有39個地區(qū)被列入了Harvey總統(tǒng)宣布的颶風多發(fā)重災區(qū)(PDD),雖然大多數(shù)遭受到財產(chǎn)損失的地區(qū)都需要修復和重建的援助,但資源有限的地區(qū)在獲得聯(lián)邦災難恢復項目關注后會受益更多。

SP小組識別出了那些受財產(chǎn)損失影響最大的社區(qū),并將數(shù)據(jù)發(fā)布在data.world。這個項目也同樣被其他一些研究者推進,在data.world搜索“Hurricane Harvey”,會出現(xiàn)由許多個小組成員和組織創(chuàng)建的幾十個數(shù)據(jù)集,他們希望通過給需要的人提供容易獲取的重要數(shù)據(jù),能夠為災后重建出一份力。

Hurricane Harvey的搜索結果:

https://data.world/search?q=hurricane+harvey&type=dataset&utm_campaign=dataquest&utm_source=blog&utm_content=180122

由Alyssa制作的數(shù)據(jù)可視化效果

由Alyssa制作的數(shù)據(jù)可視化效果

6. 新澤西州法醫(yī)數(shù)據(jù)@stevestirling

根據(jù)柯林字典,2017年“假新聞”一詞的使用量增加了365%。盡管人們對于媒體越來越不信任,但由于數(shù)據(jù)成為了全球頂級新聞機構公信度的基石,我們終于在今年看到了新聞領域的重大轉(zhuǎn)變。

這組數(shù)據(jù)來自新澤西的州法醫(yī)辦公室,在歷經(jīng)數(shù)月對記錄的爭論后,數(shù)據(jù)發(fā)布的24小時內(nèi),新上任的州長Phil Murphy承諾將在即將到來的立法會議上會對系統(tǒng)進行“全面改革”。

這個例子說明了數(shù)據(jù)新聞是如何幫助社區(qū),甚至影響公共政策的。了解更多新澤西先鋒媒體的這場耗時18個月的調(diào)查請戳—死亡與功能障礙:新澤西州是如何背棄死者,背叛生者,令國家蒙羞的。

文章鏈接:

http://death.nj.com/?utm_campaign=dataquest&utm_source=blog&utm_content=180122

由 NJ Advance Media報道

由 NJ Advance Media報道

7. 醫(yī)藥支出@data4democracy

民主數(shù)據(jù)始于2016年12月,當時全球各地的人們開始在數(shù)據(jù)相關的問題上展開合作,使用Slack進行策劃,GitHub編程以及data.world共享數(shù)據(jù)。沒有成文的規(guī)定也沒有正式的組織,他們的目標是用最短的時間來完成真正的有效的工作。

這個數(shù)據(jù)集來自最早的一批項目,當前在全球已有2000多名電子志愿者。通過使用這個數(shù)據(jù)集和data.world R包,小組成員Jennifer Thompson可以收集一個dashboard所需的數(shù)據(jù),創(chuàng)建并推出派生的數(shù)據(jù)集,并構建從站點提取實時數(shù)據(jù)的Shiny dashboard。在R Views(由RStudio編輯的R社區(qū)博客)中了解Jennifer所做的工作。

Jennifer工作內(nèi)容鏈接:

https://rviews.rstudio.com/2017/05/26/civic-data-wrangling-in-r-and-on-data.world/?utm_campaign=dataquest&utm_source=blog&utm_content=180122

由 Jennifer Thompson開發(fā)

由 Jennifer Thompson開發(fā)

8. 國家足跡賬戶2017年版@footprint

想知道Grenada, Guyana和Gambia這三個國家的共同之處嗎?它們都在全球足跡網(wǎng)(Global Footprint Network)的最小生態(tài)足跡名單之上。

全球足跡網(wǎng)(Global Footprint Network)的國家足跡賬戶 (NFAs) 記錄了自1961年起生態(tài)資源使用情況以及各國的資源承載力。該組織在data.world上發(fā)布了2017年版的數(shù)據(jù),對其進行分析后,可以幫助我們更好的了解經(jīng)濟發(fā)展與自然資源消耗之間的聯(lián)系。

加入全球足跡網(wǎng)減少我們2018年的生態(tài)足跡,從計算自己的生態(tài)足跡來開始你的第一步吧!

全球足跡網(wǎng):

http://www.footprintcalculator.org/?utm_campaign=dataquest&utm_source=blog&utm_content=180122

9. Tableau Desktop數(shù)據(jù)分析入門@tableauhelp

TableauHelp的教程能夠幫助人們學習使用Tableau。數(shù)據(jù)項目包括指南、教程和練習,通過一個模擬練習來學習有關商業(yè)數(shù)據(jù)分析和可視化的基礎知識。

學習在Tableau創(chuàng)建各種視圖來研究數(shù)據(jù)鏈接:

https://data.world/login?next=%2Ftableauhelp%2Ftableau-desktop-101-step-into-the-shoes-of-a-data-analyst%2Fworkspace%2Ffile%3Ffilename%3D01_lets_get_started.md%3Futm_campaign%3Ddataquest%26utm_content%3D180122%26utm_source%3Dblog

TableauHelp提供的教程

10. 人群百態(tài)@makeovermonday

社會數(shù)據(jù)項目周一大改造(Makeover Monday)的成員每周一會發(fā)布一條圖表和其數(shù)據(jù)的鏈接,圖表可以經(jīng)由社區(qū)重新繪制。無論是簡單的條形圖還是復雜的信息圖,他們都鼓勵每個人參與進來。

鏈接:

http://www.makeovermonday.co.uk/

原文鏈接:https://www.dataquest.io/blog/10-data-science-projects-join/

【本文是51CTO專欄機構大數(shù)據(jù)文摘的原創(chuàng)譯文,微信公眾號“大數(shù)據(jù)文摘( id: BigDataDigest)”】

     大數(shù)據(jù)文摘二維碼

戳這里,看該作者更多好文

責任編輯:趙寧寧 來源: 51CTO專欄
相關推薦

2018-05-16 09:47:07

數(shù)據(jù)

2020-12-22 10:15:00

Windows 10Windows微軟

2024-09-18 05:15:00

OpenCV樹莓派目標檢測

2020-07-06 10:55:38

CIO首席信息官IT

2009-12-17 09:09:48

Windows 7系統(tǒng)分區(qū)

2024-01-07 16:56:59

Python人工智能神經(jīng)網(wǎng)絡

2014-05-19 10:16:31

算法機器學習

2022-10-17 07:16:08

SQL機器學習AI

2024-05-06 11:12:22

圖像處理數(shù)學計算NumPy

2023-10-18 10:21:23

JavaScript前端

2022-03-01 15:26:29

漏洞網(wǎng)絡攻擊

2017-02-13 09:33:32

2018-07-19 06:07:22

物聯(lián)網(wǎng)安全物聯(lián)網(wǎng)IOT

2021-01-09 09:23:29

CSS頁面渲染開發(fā)

2020-05-11 17:12:52

換臉Python圖像

2017-08-01 09:07:17

筆記本指紋識別

2020-11-19 08:00:03

打工人離職工作

2018-03-01 15:00:15

Oracle數(shù)據(jù)中心云計算

2018-12-03 08:04:25

負載均衡機器流量

2015-07-10 11:18:19

點贊
收藏

51CTO技術棧公眾號