大數(shù)據(jù)十大核心問題
大數(shù)據(jù)來了,受益于便宜的硬件存儲、強大的計算機技術(shù)和云計算技術(shù),企業(yè)手中獲取了越來越多的數(shù)據(jù)。對大多數(shù)企業(yè)來說,數(shù)據(jù)分析不是可有可無,而是一個生存問題。但是面對大數(shù)據(jù),我們有什么問題呢?本文作者賽仕軟件研究開發(fā)(北京)有限公司總經(jīng)理@劉政-SAS,在微博上分享的大數(shù)據(jù)的10個核心問題,中國統(tǒng)計網(wǎng)做個整理匯總,希望大家一起來交流討論。
大數(shù)據(jù)十大核心問題:
1、大數(shù)據(jù)的分析模式
大數(shù)據(jù)分析與傳統(tǒng)分析的區(qū)別,特點是什么?
2、分析速度
分析速度是否能夠跟上數(shù)據(jù)量和數(shù)據(jù)格式變化的速度,是否能達到實時分析?
3、多種格式數(shù)據(jù)的分析技術(shù)
聲頻、視頻、圖片、文本等等格式,如何混合分析?
4、存儲問題,存儲和分析成本
無條件存儲,還是有選擇性存儲?如何進行選擇性存儲?投入產(chǎn)出比。隨著數(shù)據(jù)量的不斷增加,存儲技術(shù)要不斷創(chuàng)新。
5、法律條款的更新
個人隱私,國家機密保護等。數(shù)據(jù)的歸屬權(quán)問題。我通過開放的數(shù)據(jù),分析出了國家機密,是不是違規(guī)、犯罪?
6、數(shù)據(jù)安全和真實性
數(shù)據(jù)是否會被竊取,篡改,偽造等,如何保護?
7、數(shù)據(jù)流分析
給進數(shù)據(jù),輸出分析結(jié)果,實時改變,是物聯(lián)網(wǎng)實用化的基礎。如何實現(xiàn)?
8、數(shù)據(jù)關(guān)聯(lián)性
如何提取關(guān)聯(lián)性數(shù)據(jù)和有用數(shù)據(jù)?看起來簡單,其實在浩瀚的數(shù)據(jù)中查找關(guān)聯(lián)性是挺難的。
9、大數(shù)據(jù)能否引申出科學***?
例如,骰硬幣可以引出概率論。
10、大數(shù)據(jù)對其他學科的影響
對大數(shù)據(jù)的分析僅僅是得到分析結(jié)果嗎?應該說世界上所有的東西都可以歸結(jié)到數(shù)據(jù)里。那么我們能由此對世界有更深的了解嗎?有了基因數(shù)據(jù),人體數(shù)據(jù)能繪出人體機能嗎?