大數(shù)據(jù)也要可視化!盤點(diǎn)六家主力初創(chuàng)公司
盡管可視化不是數(shù)據(jù)分析中最有技術(shù)挑戰(zhàn)的一部分,但無疑它是最重要的。
存儲(chǔ)、數(shù)據(jù)庫、查詢處理和算法都是非常重要的,但是在以數(shù)據(jù)為驅(qū)動(dòng)的世界中,他們都是基礎(chǔ)層。如果你要從大量高度復(fù)雜的數(shù)據(jù)集中發(fā)現(xiàn)新東西,或者給人們提供分析即使是最簡單數(shù)據(jù)的能力,那么展現(xiàn)這些數(shù)據(jù)和展現(xiàn)這些數(shù)據(jù)如何被利用,就是很關(guān)鍵的。
以下是筆者認(rèn)為從根本上改變了數(shù)據(jù)可視化方式的六家初創(chuàng)公司,有些在表面之下是高度復(fù)雜的,有些是并不完美的,但是他們都在通過自己的行動(dòng)讓我們重新思考數(shù)據(jù)、通過圖表的方式讓我們看到事實(shí)。
Ayasdi
網(wǎng)絡(luò)圖表的想法并不新鮮,但是Ayasdi的方法倒是挺新鮮的。在后臺(tái),有一個(gè)HBase數(shù)據(jù)庫,一項(xiàng)被成為拓?fù)鋽?shù)據(jù)分析的技術(shù),數(shù)百臺(tái)機(jī)器學(xué)習(xí)算法以處理復(fù)雜的數(shù)據(jù)集,找到數(shù)據(jù)點(diǎn)之間的相似性。不過對(duì)于終端用戶來說,有一個(gè)數(shù)據(jù)集的地圖,看上去很像是網(wǎng)絡(luò)圖表,突出相關(guān)數(shù)據(jù)點(diǎn)的集群,讓分析師可能進(jìn)行進(jìn)一步研究。
BeyondCORE實(shí)際是在和Ayasdi相同的前提下運(yùn)行的——為用戶展示重要的相關(guān)性,這樣他們就不必思考沒有覆蓋到的查詢——但那是他采用一些不同的技術(shù)去達(dá)到目的。BeyondCORE采用一個(gè)不同的可視化方法,它堅(jiān)持使用標(biāo)準(zhǔn)圖表,但通過軟件發(fā)現(xiàn)的相關(guān)性,提供在虛擬實(shí)境中互動(dòng)地呈現(xiàn)一個(gè)談話用戶的選項(xiàng)。
ClearStory
ClearStory有一款非常特別的產(chǎn)品——盡管他們對(duì)很多細(xì)節(jié)秘而不宣,而且在發(fā)布前所有截屏都是帶鎖的。不過,從本質(zhì)上講,它試圖通過可視化展現(xiàn)一切細(xì)節(jié),顯示大量數(shù)據(jù)來源,當(dāng)源數(shù)據(jù)改變的時(shí)候自動(dòng)更新,并且調(diào)用協(xié)作和社交理念。
Datahero

與很多初創(chuàng)數(shù)據(jù)公司不同的是,Datahero并沒有試圖招攬那些已經(jīng)對(duì)業(yè)務(wù)智能軟件或者從Hadoop數(shù)據(jù)中心獲得見解已經(jīng)厭倦了的人們。相反,Datahero讓那些有簡單的業(yè)務(wù)數(shù)據(jù)或者個(gè)人數(shù)據(jù)的人們獲得一些簡單的表格,既不用安裝Excell功能,也不用過多地?fù)?dān)心表格的格式對(duì)不對(duì)。在早期,Datahero的可視化仍然是相當(dāng)普遍的,但它的易用性是很獨(dú)特的。
Platfora

Platfora試圖分析保存在Hadoop集群中的大量數(shù)據(jù),像分析自己Stripe數(shù)據(jù)那樣簡單。這是基于Hadoop和大規(guī)模并行隊(duì)列處理的,但是以一種類似HTML5的方式展現(xiàn),例如有拖拽、刪除、視覺切割和數(shù)據(jù)切割等操作。后者的能力,實(shí)際上在擁有比以往更多數(shù)據(jù)點(diǎn)的大數(shù)據(jù)世界中是很關(guān)鍵的。
Zoomdata
Zoomdata不是唯一一家支持移動(dòng)設(shè)備的分析公司,但是筆者所知的少數(shù)幾家專門為移動(dòng)設(shè)備而設(shè)計(jì)的公司之一。Zoomdata連接到標(biāo)準(zhǔn)業(yè)務(wù)數(shù)據(jù)源,但是利用觸摸屏和D3.js可視化來提供可視化的圖表,而且這些圖表的設(shè)計(jì)就像是藝術(shù)家的調(diào)色板一樣有趣。