五大尷尬掣肘大數(shù)據(jù)
云計算是大數(shù)據(jù)的運行平臺,非結構化數(shù)據(jù)爆發(fā)式成長,大數(shù)據(jù)的智能分析和決策被粉飾的神乎其神,不過針對應用領域,還有四個要素將影響大數(shù)據(jù)發(fā)展:
1.預測后不敢用
如果把大數(shù)據(jù)比作算命顯然有點欺負了這位IT新寵,但從目前的大數(shù)據(jù)分析領域看,在很多行業(yè)應用上還存在敢測不敢用的尷尬,預測結果更多是印證而不是代替決策,除了大數(shù)據(jù)本身預測準確率以外,系統(tǒng)性風險帶來的決策失誤很可能最終讓大數(shù)據(jù)背鍋,信息部門以及咨詢機構憑空擔了責任,想想就覺得冤枉。
2.信息不對稱
大數(shù)據(jù)體現(xiàn)在一個大字上,是一個公司的數(shù)據(jù)還是一個行業(yè)的數(shù)據(jù)還是合縱連橫參考多個維度數(shù)據(jù)來做的最終分析?實際上各個“大數(shù)據(jù)庫”如一個個信息孤島,彼此缺乏聯(lián)動,而單一通過某個孤島來決策自然生態(tài)顯然是盲人摸象,不準也就不足為奇了。
3.非結構化難解人性
結構化數(shù)據(jù)的***特點是基于考量數(shù)據(jù)做推演,總結過去做預測,可當前大數(shù)據(jù)面臨太多的非結構化數(shù)據(jù),這里包含了龐雜的社會信息和干擾信息,如果我們按照結構化數(shù)據(jù)的方式來看,從過去10年情況來預測今年的走勢,也許會得到一個波動不太大的結果,但如果我們發(fā)現(xiàn)某位用戶衣服買了綠色,褲子買了綠色,襯衫買了綠色,然后系統(tǒng)認為用戶在服飾選擇上偏愛綠色的話,那有一天用戶想買頂帽子時,系統(tǒng)推薦的商品也許會激怒用戶。
這應該是大數(shù)據(jù)面臨最尷尬的一點,如果說大數(shù)據(jù)是基礎,深度學習和人工智能才是關鍵,因為這兩項必須依靠大數(shù)據(jù)作為基石,會讓決策準確度實現(xiàn)指數(shù)級提升,當這兩項技術水平得到了解放,大數(shù)據(jù)才完整體現(xiàn)了價值。
4.使用過期數(shù)據(jù)
數(shù)據(jù)的新鮮程度將極大影響***的分析結果,不同的行業(yè)的數(shù)據(jù)保鮮時間也會有很大差別,例如服裝業(yè)的潮流變化速度明顯快于其他行業(yè),很多大數(shù)據(jù)最終結果偏差都是由于數(shù)據(jù)更新的不及時性導致,因此如何確保數(shù)據(jù)不斷隨時更新對于大數(shù)據(jù)來言是一個很大的挑戰(zhàn)。
5.走不出安全隱私困局
安全是一個***話題,數(shù)據(jù)越多,泄露后帶來的風險和損失越大,“大數(shù)據(jù)庫”越大,一鍋端后看著越辣眼睛。