幾款數(shù)據可視化的工具介紹
DT(Data Technology)時代已經來臨,使用BI工具代替手工統(tǒng)計分析數(shù)據,已經成為企業(yè)和政府快速致勝的武器。好的BI工具能有效的幫助企業(yè)提高分析效率、減少分析成本、提高數(shù)據價值、完善信息化水平。
新型的數(shù)據可視化產品層出不窮,基本上各種語言都有自己的可視化庫,傳統(tǒng)數(shù)據分析及BI軟件也都擴展出一定的可視化功能,再加上專門的用于可視化的成品軟件,我們的可選范圍實在是太多了。那么,我們要選擇的可視化工具,必須滿足互聯(lián)網爆發(fā)的大數(shù)據需求,必須快速的收集、篩選、分析、歸納、展現(xiàn)決策者所需要的信息,并根據新增的數(shù)據進行實時更新。
- 實時性:數(shù)據可視化工具必須適應大數(shù)據時代數(shù)據量的爆炸式增長需求,必須快速的收集分析數(shù)據、并對數(shù)據信息進行實時更新;
- 簡單操作:數(shù)據可視化工具滿足快速開發(fā)、易于操作的特性,能滿足互聯(lián)網時代信息多變的特點;
- 更豐富的展現(xiàn):數(shù)據可視化工具需具有更豐富的展現(xiàn)方式,能充分滿足數(shù)據展現(xiàn)的多維度要求;
- 多種數(shù)據集成支持方式:數(shù)據的來源不僅僅局限于數(shù)據庫;很多數(shù)據可視化工具都支持團隊協(xié)作數(shù)據、數(shù)據倉庫、文本等多種方式,并能夠通過互聯(lián)網進行展現(xiàn)。
數(shù)據可視化主要通過編程和非編程兩類工具實現(xiàn)。主流編程工具包括以下三種類型:從藝術的角度創(chuàng)作的數(shù)據可視化,比較典型的工具是 Processing,它是為藝術家提供的編程語言;從統(tǒng)計和數(shù)據處理的角度,既可以做數(shù)據分析,又可以做圖形處理,如R,SAS;介于兩者之間的工具,既要兼顧數(shù)據處理,又要兼顧展現(xiàn)效果,D3.js、Echarts都是很不錯的選擇,二者這種基于Java的數(shù)據可視化工具更適合在互聯(lián)網上互動的展示數(shù)據。
1. 入門級
入門級的意思是該工具是可視化工作者必須掌握的技能,難度不一定小、門檻也不一定低。相反,對于可視化大拿來說,這些工具依舊起到四兩撥千斤的妙用。
Excel
別以為EXCEL只會處理表格,你可以把它當成數(shù)據庫,也可以把它當成IDE,甚至可以把它當成數(shù)據可視化工具來使用。它可以創(chuàng)建專業(yè)的數(shù)據透視表和基本的統(tǒng)計圖表,但由于默認設置了顏色、線條和風格,使其難以創(chuàng)建用于看上去“高大上”視覺效果。盡管如此,我仍然推薦你使用Excel。
億信BI
億信BI真正敏捷實用的商業(yè)智能分析平臺,相信每一個接觸到數(shù)據可視化的人都聽說過億信BI,億信BI是一款數(shù)據可視化工具,可輕松實現(xiàn)中國式報表、dashboard儀表盤、統(tǒng)計圖、地圖分析、分析報告、多維分析等它不需要編程,而僅僅通過簡單的拖拽操作即可完成驚艷的效果。對比Excel,它是專業(yè)應對數(shù)據可視化方案的利器,主要表現(xiàn)在數(shù)據可視化、聚焦/深挖、靈活分析、交互設計等功能。億信BI是為數(shù)據而生,他洞悉數(shù)據的蛛絲馬跡,發(fā)現(xiàn)數(shù)據的潛在價值,預測數(shù)據的發(fā)展趨勢,他可以構建大型的總和數(shù)據分析平臺,也可以作為小型的個性化的解決方案。億信BI***的缺點在于它是商業(yè)軟件,不過官方提供試用。
2. 在線數(shù)據可視化
Google Charts
Google Charts是一個免費的開源js庫,使用起來非常簡單,只需要在標簽中將src指向然后即可開始繪制。它支持HTML5/SVG,可以跨平臺部署,并特意為兼容舊版本的IE采用了vml。
在新版google charts 發(fā)布之前,google有個類似的產品叫做Google Charts API,不同之處在于后者使用http請求的方式將參數(shù)提交到api,而后接口返回一張png圖片。
Flot
Flot是一個很棒的線圖和條形圖創(chuàng)建工具,可以運用于支持canvas的所有瀏覽器——意味著大多數(shù)主流瀏覽器。這是一個jQuery庫,如果你已經熟悉jQuery,你就可以容易的對圖像進行回調、風格和行為操作。 浮懸的優(yōu)點是你可以訪問大量的調用函數(shù),這樣就可以運行你自己的代碼。設定一種風格,可以讓在用戶懸停鼠標、點擊、移開鼠標時展示不同的效果。比起其他制圖工具,浮懸給予你更多的靈活空間。浮懸提供的選項不多,但它可以很好地執(zhí)行常見的功能。
D3
D3(Data Driven Documents)是支持SVG渲染的另一種Java庫。但是D3能夠提供大量線性圖和條形圖之外的復雜圖表樣式,例如Voronoi圖、樹形圖、圓形集群和單詞云等。D3.js是數(shù)據驅動文件(Data-Driven Documents)的縮寫,他通過使用HTMLCSS和SVG來渲染精彩的圖表和分析圖。D3對網頁標準的強調足以滿足在所有主流瀏覽器上使用的可能性,使你免于被其他類型架構所捆綁的苦惱,它可以將視覺效果很棒的組件和數(shù)據驅動方法結合在一起。
Echarts百度出品的優(yōu)秀產品之一,也是國內目前開源項目中少有的精品。一個純 Java 的圖表庫,可以流暢的運行在 PC 和移動設備上,兼容當前絕大部分瀏覽器,底層依賴輕量級的 Canvas 類庫 ZRender,提供直觀,生動,可交互,可高度個性化定制的數(shù)據可視化圖表。3.0版本中更是加入了更多豐富的交互功能以及更多的可視化效果,并且對移動端做了深度的優(yōu)化。Echarts最令人心動的是它豐富的圖表類型,以及極低的上手難度。
Highcharts在Echarts出現(xiàn)之初,功能還不是那么完善,可視化工作者往往會選擇HighCharts。Highcharts 系列軟件包含 Highcharts JS,Highstock JS,Highmaps JS 共三款軟件,均為純 Java 編寫的 HTML5 圖表庫。Highcharts 是一個用純 Java 編寫的一個圖表庫, 能夠很簡單便捷的在 Web 網站或是 Web 應用程序添加有交互性的圖表。Highstock 是用純 Java 編寫的股票圖表控件,可以開發(fā)股票走勢或大數(shù)據量的時間軸圖表,Highmaps 是一款基于 HTML5 的優(yōu)秀地圖組件。
R嚴格來說,R是一種數(shù)據分析語言,與matlab、GNU Octave并列。然而ggplot2的出現(xiàn)讓R成功躋身于可視化工具的行列,作為R中強大的作圖軟件包,ggplot2牛在其自成一派的數(shù)據可視化理念。它將數(shù)據、數(shù)據相關繪圖、數(shù)據無關繪圖分離,并采用圖層式的開發(fā)邏輯,且不拘泥于規(guī)則,各種圖形要素可以自由組合。當熟悉了ggplot2的基本套路后,數(shù)據可視化工作將變得非常輕松而有條理。
DataV阿里出品的數(shù)據可視化解決方案,之所以推薦DataV這個后起之秀,完全是因為淘寶雙“11”活動中實時互動大屏幕太搶眼了。DataV支持多種數(shù)據源,尤其是和阿里系各種數(shù)據庫***銜接,如果你的數(shù)據本身就存在阿里云上,那選用DataV肯定是個省時省力的好辦法。圖表方面,DataV內置了豐富的圖表模板,支持實時數(shù)據采集和解析。
3. 類GUI數(shù)據可視化CrossfilterCrossfilter 是一個用來展示大數(shù)據集的 Java 庫,它可以把數(shù)據可視化和GUI控件結合起來,按鈕、下拉和滑塊演變成更復雜的界面元素,使你擴展內容,同時改變輸入參數(shù)和數(shù)據。交互速度超快,甚至在上百萬或者更多數(shù)據下都很快。Crossfilter也是一種Java庫,它可以在幾乎不影響速度的前提下對數(shù)據創(chuàng)建過濾器,將過濾后的數(shù)據用于展示,且涉及有限維度,因此可以完成對海量數(shù)據集的篩選與加載。
4. 進階工具 ProcessingProcessing 是用 Java 編程語言寫的,并且 Java 語言也是在語言樹中最接近 Processing 的。所以,如果您熟悉 C 或 Java 語言,Processing 將很容易學。Processing 并不包括 Java 語言的一些較為高級的特性,但這些特性中的很多特性均已集成到了 Processing。如今,圍繞它已經形成了一個專門的社區(qū),致力于構建各種庫以供用這種語言和環(huán)境進行動畫、可視化、網絡編程以及很多其他的應用。Processing 是一個很棒的進行數(shù)據可視化的環(huán)境,具有一個簡單的接口、一個功能強大的語言以及一套豐富的用于數(shù)據以及應用程序導出的機制。
WekaWeka是一個能根據屬性分類和集群大量數(shù)據的優(yōu)秀工具,Weka不但是數(shù)據分析的強大工具,還能生成一些簡單的圖表。weka首先是一個數(shù)據挖掘的利器,它能夠快速導入我們的結構化數(shù)據,然后對數(shù)據屬性做分類、聚類分析,幫助我們理解數(shù)據。但他的可視化功能同樣不遜色,選擇界面中的visualization,你會立刻明白:是它讓你理解數(shù)據,然后你才讓用戶可視化數(shù)據。