DataHunter馬珂:數(shù)據(jù)可視化分析應該怎么玩
原創(chuàng)【51CTO.com原創(chuàng)稿件】大數(shù)據(jù)這幾年的發(fā)展速度有目共睹,而數(shù)據(jù)可視化是大數(shù)據(jù)領(lǐng)域中非常關(guān)鍵的一環(huán)。當下,諸多企業(yè)需要通過數(shù)據(jù)分析來指導業(yè)務決策,這樣一來,數(shù)據(jù)可視化就有了非常大的發(fā)展?jié)摿蛻脠鼍啊R虼?,近些年國?nèi)外也衍生出很多專注于該領(lǐng)域的企業(yè)級創(chuàng)業(yè)公司,DataHunter(北京數(shù)獵天下科技有限公司)便是其中之一。這家成立時間不長的年輕公司,憑借數(shù)據(jù)可視化分析與數(shù)據(jù)大屏產(chǎn)品,得到了人民日報、萬達集團、中國移動、三一重工、獵聘網(wǎng)等眾多客戶的認可。
近日,DataHunter CTO馬珂接受了51CTO的專訪,同記者就探索式數(shù)據(jù)分析技術(shù)、圖形化技術(shù)、數(shù)據(jù)可視化工具等方面進行了深入探討。馬珂曾是海軍總部工程師,長期從事數(shù)據(jù)庫管理、優(yōu)化,數(shù)據(jù)挖掘和可視化相關(guān)工作,有很豐富的實踐經(jīng)驗。
馬珂·DataHunter CTO
驗證式與探索式數(shù)據(jù)分析相輔相成
數(shù)據(jù)分析方式主要分為驗證式與探索式兩種,兩者相輔相成。驗證式數(shù)據(jù)分析是目前大多數(shù)企業(yè)使用相對較多的分析方法,偏重于模型和假設;而探索式數(shù)據(jù)分析更偏重于分析過程,其***的意義在于,允許分析人員或決策者在不清楚數(shù)據(jù)規(guī)律、不知道如何進行數(shù)據(jù)建模的情況下,通過數(shù)據(jù)本身所呈現(xiàn)出的各種可視化圖表,進行查看和分析,從而快速找到業(yè)務中存在的問題。
馬珂進一步表示,驗證式分析對數(shù)據(jù)質(zhì)量要求很高,這種模式必須先有想法,之后再通過數(shù)據(jù)進行驗證。如果數(shù)據(jù)本身出現(xiàn)問題,那么即便通過科學的數(shù)據(jù)建模進行分析,結(jié)果也肯定是錯誤的。相比于驗證式分析,探索式分析對數(shù)據(jù)質(zhì)量要求相對較低,同時也不需要復雜的數(shù)據(jù)建模。
據(jù)了解,探索式數(shù)據(jù)分析概念是由貝爾實驗室數(shù)學家John Tukey提出,他認為,統(tǒng)計分析不應該只重視模型和假設的驗證,而應該充分發(fā)揮數(shù)據(jù)分析的長處,在分析過程中發(fā)現(xiàn)新的理論假設和數(shù)據(jù)模型。
馬珂介紹,DataHunter致力于為企業(yè)提供簡單易用的數(shù)據(jù)可視化分析產(chǎn)品及數(shù)據(jù)大屏設計展示服務,基于探索式數(shù)據(jù)分析,助力企業(yè)發(fā)現(xiàn)問題并改進業(yè)務。數(shù)據(jù)可視化分析系統(tǒng)是核心產(chǎn)品之一,可以幫助企業(yè)對接各個業(yè)務系統(tǒng)數(shù)據(jù),打破數(shù)據(jù)孤島,并且無需復雜的數(shù)據(jù)建模,就可以進行探索式、交互式的數(shù)據(jù)分析,從而為業(yè)務決策提供支持。數(shù)據(jù)可視化大屏是核心產(chǎn)品之二,用于業(yè)務指揮中心,會議室,展廳,展會等場景,支持整合多種業(yè)務數(shù)據(jù)以及動態(tài)實時數(shù)據(jù)展示。
圖形化技術(shù)是探索式分析必不可少的支柱
探索式分析是數(shù)據(jù)分析的開端,而數(shù)據(jù)可視化是在數(shù)據(jù)分析的***一個環(huán)節(jié),用于呈現(xiàn)結(jié)論。
馬珂表示,在探索式數(shù)據(jù)分析中,圖形可以很好的幫助我們理解數(shù)據(jù),故圖形化技術(shù)是其中必不可少的支柱。圖形化技術(shù)在很多年前已經(jīng)被普遍應用,像柱圖、餅圖、折線圖等。大數(shù)據(jù)的快速發(fā)展,讓探索式數(shù)據(jù)分析逐漸成為主流,而圖形化技術(shù)也隨之又進入了一個新的階段。
可以說,圖形化技術(shù)使得數(shù)據(jù)分析成為一種“所見即所得”的模式。例如,在同一個業(yè)務看板上,通過協(xié)同過濾、數(shù)據(jù)鉆取等交互操作,相關(guān)圖表就會按照相應的條件進行聯(lián)動,從而大大提高了分析效率。
舒適度是影響數(shù)據(jù)可視化工具的核心要素
馬珂之所以選擇加入DataHunter,其一是因為對數(shù)據(jù)、圖形有濃厚的興趣,他認為,從大數(shù)據(jù)中觀察總結(jié)數(shù)據(jù)結(jié)果是很有意思的事情,而分析+圖形化是產(chǎn)出結(jié)果的重要手段。其二,是因為DataHunter是初創(chuàng)企業(yè),可以快速決策、快速試錯、快速調(diào)整。
對于產(chǎn)品的期許,馬珂這樣說,數(shù)據(jù)可視化分析產(chǎn)品應該重視舒適度,雖然DataHunter是To B的公司,但也要讓客戶用起來舒適,不產(chǎn)生困惑。“我們也會逐步讓客戶參與到整個產(chǎn)品的研發(fā)過程中來,根據(jù)實際的業(yè)務場景和用戶需求出發(fā),才能構(gòu)建出更加優(yōu)秀的產(chǎn)品。 ”
此外,馬珂也向51CTO記者透露了DataHunter 2018年的產(chǎn)品計劃。“未來一年,我們會在兩個方向上繼續(xù)深耕,一是客戶數(shù)據(jù)接入的適應性,如超大數(shù)據(jù)處理、數(shù)據(jù)連接池等;二是在數(shù)據(jù)展示層面,配備完整的、可擴展的圖形化工具。”
【51CTO原創(chuàng)稿件,合作站點轉(zhuǎn)載請注明原文作者和出處為51CTO.com】