五個角度淺析大數(shù)據(jù)與BI的區(qū)別
BI(Business Intelligence),中文翻譯是商務(wù)智能,是一套完整的解決方案,用來將組織中現(xiàn)有的數(shù)據(jù)進(jìn)行有效的整合,快速準(zhǔn)確的提供報表并提出決策依據(jù),幫助組織做出明智的業(yè)務(wù)經(jīng)營決策。
大數(shù)據(jù)(Big Data)是從收集的海量數(shù)據(jù)中,通過算法將這些來自不同渠道、格式的數(shù)據(jù)進(jìn)行直接分析,從中尋找到數(shù)據(jù)之間的相關(guān)性。簡單而言,大數(shù)據(jù)更偏重于發(fā)現(xiàn),以及猜測并印證的循環(huán)逼近過程。

不管定義如何不同,大數(shù)據(jù)與傳統(tǒng)BI是社會發(fā)展到不同階段的產(chǎn)物,我們從幾下幾個緯度來可以迅速的看出兩者的區(qū)別:
***、從數(shù)據(jù)來源角度
大數(shù)據(jù)應(yīng)用的數(shù)據(jù)來源,不僅僅包括非結(jié)構(gòu)化的數(shù)據(jù),還有各種系統(tǒng)數(shù)據(jù),數(shù)據(jù)庫數(shù)據(jù)。其中非結(jié)構(gòu)化數(shù)據(jù)主要是集中在互聯(lián)網(wǎng)以及一些社交網(wǎng)站上的數(shù)據(jù)以及一些機(jī)器設(shè)備的數(shù)據(jù),這些都構(gòu)成了大數(shù)據(jù)應(yīng)用的數(shù)據(jù)來源。對于大數(shù)據(jù)的分析工具來說,現(xiàn)階段也是對于非結(jié)構(gòu)化的數(shù)據(jù)分析的比較多。
BI系統(tǒng)則是在數(shù)據(jù)集成方面的技術(shù)越來越成熟,對于數(shù)據(jù)的提取,一個各種數(shù)據(jù)挖掘的要求來說,數(shù)據(jù)集成平臺會幫助企業(yè)實現(xiàn)數(shù)據(jù)的流通和交互使用,在企業(yè)內(nèi)部實施BI應(yīng)用就是為了可以更好的對數(shù)據(jù)進(jìn)行分享和使用。
第二、從思維方式角度
大數(shù)據(jù)對于傳統(tǒng)BI,既有繼承,也有發(fā)展,從”道”的角度講,BI與大數(shù)據(jù)區(qū)別在于前者更傾向于決策,對事實描述更多是基于群體共性,幫助決策者掌握宏觀統(tǒng)計趨勢,適合經(jīng)營運營指標(biāo)支撐類問題,大數(shù)據(jù)則內(nèi)涵更廣,傾向于刻畫個體,更多的在于個性化的決策。

第三、從發(fā)展方向角度
BI的發(fā)展要從傳統(tǒng)的商務(wù)智能模式開始轉(zhuǎn)換,對于企業(yè)來說,BI不僅僅是一個IT項目,更是一種管理和思維的方式,從技術(shù)的部署到業(yè)務(wù)的流程規(guī)劃,BI迎來新的發(fā)展。對于大數(shù)據(jù)來說,現(xiàn)階段更多的大數(shù)據(jù)關(guān)注在非結(jié)構(gòu)化數(shù)據(jù),不同的數(shù)據(jù)分析工具的出現(xiàn)和行內(nèi)的應(yīng)用范圍不斷的加大,對于大數(shù)據(jù)應(yīng)用來說,怎么與應(yīng)用的行業(yè)進(jìn)行一個深層次的結(jié)合才是最重要的。
第四、從工具的角度
傳統(tǒng)BI使用的是ETL、數(shù)據(jù)倉庫、OLAP、可視化報表技術(shù),屬于應(yīng)用和展示層技術(shù),目前都處于淘汰的邊緣,因為它解決不了海量數(shù)據(jù)(包括結(jié)構(gòu)化與非結(jié)構(gòu)化)的處理問題。而大數(shù)據(jù)應(yīng)用的是一個完整的技術(shù)體系,包括用Hadoop、流處理等技術(shù)解決海量的結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)的ETL問題,用Hadoop、MPP等技術(shù)計算海量數(shù)據(jù)的計算問題,用redis、HBASE等方式解決高效讀的問題,用Impala等技術(shù)實現(xiàn)在線分析等問題。因此是個全新的行業(yè)。
第五、從人員的角度
傳統(tǒng)BI只要掌握核心的SQL技術(shù)就可以從事BI的工作,而大數(shù)據(jù)的數(shù)據(jù)處理,涉及太多新的技術(shù),不同的應(yīng)用場景需要不同的大數(shù)據(jù)處理方法了,而且不再有人機(jī)交互那么好的客戶端了,至少要懂流處理、HADOOP、列式或分布式鍵值數(shù)據(jù)庫吧,還需要能在SPARK上開發(fā)算法程序,對于用戶畫像、產(chǎn)品標(biāo)簽化、推薦系統(tǒng)、排序算法都應(yīng)有所理解。
因此,大數(shù)據(jù)相對于傳統(tǒng)BI,不是簡單的PLUS的關(guān)系,它涉及了思想、工具和人員深層次的變革,BI工作人員應(yīng)該盡快順應(yīng)大勢,更新自己,奮起直追,重裝上陣。