自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

誰會真的在乎如何定義大數(shù)據(jù)?

大數(shù)據(jù)
看著那么多人在爭論如何定義大數(shù)據(jù),感覺非常有意思??偸菚腥颂岢霾煌慕ㄗh,即便只是存在細微的差別。在任何規(guī)則的背后也都會有潛在的例外。因此,從商業(yè)角度,而不是單純的學術(shù)研究方面來講,我認為在這樣的爭論上花很多精力并沒有太大的實際價值。還是讓我們來一探究竟吧。

看著那么多人在爭論如何定義大數(shù)據(jù),感覺非常有意思??偸菚腥颂岢霾煌慕ㄗh,即便只是存在細微的差別。在任何規(guī)則的背后也都會有潛在的例外。因此,從商業(yè)角度,而不是單純的學術(shù)研究方面來講,我認為在這樣的爭論上花很多精力并沒有太大的實際價值。還是讓我們來一探究竟吧。

誰會真的在乎如何定義大數(shù)據(jù)?

數(shù)據(jù)分析的目的是為了利用數(shù)據(jù)去做出更好的商業(yè)決策。這一切都在于它的商業(yè)價值。判定數(shù)據(jù)本身究竟是“大”與否并沒有增加任何的商業(yè)價值。業(yè)界需要關(guān)心的問題其實很簡單:是否存在一些其本身具有很高的潛在價值,但目前仍未被收集的數(shù)據(jù)源?如果答案是肯定的,那么它就需要被收集并分析。這便是一個商業(yè)人士應該關(guān)心的核心問題。他們并不需要去在意數(shù)據(jù)本身的大還是小,或者介于兩者之間。

讓我們來想象一個應用場景,一群商業(yè)以及IT人士聚集在一個大型會議室,討論一項新的數(shù)據(jù)源。作為座談的一部分,他們達成一致協(xié)議,認為這項新的數(shù)據(jù)源應當(或不應當)被認定為大數(shù)據(jù)。這份結(jié)論對推動會議進程起到了任何作用嗎?什么也沒有。真正推動會議進程的,是這只商業(yè)團隊認可這項新的數(shù)據(jù)資源是有用的并且值得分析;是這只IT團隊決定如何基于數(shù)據(jù)本身的特點以***的方式使得數(shù)據(jù)可用。只有當致力于使數(shù)據(jù)付諸于工作而不僅僅停留在語義的定奪上,才會有真正的進展。

如上所說,一旦決定某項數(shù)據(jù)源是重要的,那么數(shù)據(jù)本身的特點會影響我們?nèi)绾潍@取它以及如何將其應用于分析過程。舉例來說,如果這項數(shù)據(jù)通常是大數(shù)據(jù)并且/或者是松散的,我們可能會需要利用某些與大數(shù)據(jù)相關(guān)的技術(shù)。但是,這僅僅是出于一種技術(shù)實現(xiàn)方面的考慮。而關(guān)于這項數(shù)據(jù),做出是否具有足夠價值去收集的重大決定,與我們將其置于怎樣的語言定義范疇,沒有任何的關(guān)系。

另一個通常性的錯誤是將大數(shù)據(jù)等同于具體工具或技術(shù)的運用。但是,工具和技術(shù)的應用是廣泛的,并不僅僅局限于大數(shù)據(jù)。舉例來說,如果我想為一家全球性組織做一項關(guān)于情緒與所有社會媒體評論的分析,我可能有大量的數(shù)據(jù)需要處理。我還需要某些復雜的文字分析工具和情感計算法則。現(xiàn)在讓我們來假設我想要做一項關(guān)于情緒與10條對我的評論的分析。猜猜會怎樣呢?我需要完全相同的文本分析工具和情感計算法則。我只是不需要用相同的標準去衡量他們。

通過以上觀點可以看到,更多與“大數(shù)據(jù)”相關(guān)的其實是一個“不同數(shù)據(jù)類型”的組合。文本數(shù)據(jù)需要不同的工具和技術(shù)。半結(jié)構(gòu)化數(shù)據(jù)比起傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù)需要更多不同的處理。但是,這些數(shù)據(jù)類型對于無論是大型還是小型數(shù)據(jù)而言都需要不同的處理方式。

對于負責大數(shù)據(jù)技術(shù)實現(xiàn)的人群,還是有必要去練習理解各類數(shù)據(jù)的不同,以及他們是被如何定義的。我并不是說在這個領域里的所有努力都是浪費時間。如果你連數(shù)據(jù)本身所包含的內(nèi)容都不理解,那你如何去開發(fā)處理數(shù)據(jù)的工具以及技術(shù)呢。我僅僅是認為,我們過多的強調(diào)了涉及客戶的主題,例如那些實際上并不用去擔心的商業(yè)客戶。

下一次當有人再向你詢問如何定義大數(shù)據(jù),或者某一項數(shù)據(jù)來源是否應當被認定為大數(shù)據(jù)的時候,考慮下你將如何回答。你們真的需要這樣的討論嗎?或許你們是否需要換個角度,更多的去研討這項數(shù)據(jù)可能會具有怎樣的價值以及應當怎樣予以分析?我相信,如果選擇了后者,你們將會取得更大的進展,獲取更大的價值。

 
 
責任編輯:王雪燕 來源: 中關(guān)村大數(shù)據(jù)產(chǎn)業(yè)聯(lián)盟
相關(guān)推薦

2019-01-10 17:08:09

華為

2017-08-08 09:18:03

數(shù)據(jù)大數(shù)據(jù)云計算

2018-07-17 16:26:17

大數(shù)據(jù)營銷消費者

2013-10-09 09:39:34

大數(shù)據(jù)

2015-08-06 09:15:22

2022-03-14 22:51:25

大數(shù)據(jù)IT企業(yè)

2016-09-21 12:44:15

大數(shù)據(jù)TalkingData

2013-05-15 09:33:45

大數(shù)據(jù)小數(shù)據(jù)

2018-08-14 08:36:29

數(shù)據(jù)中心馬化騰數(shù)據(jù)

2020-09-02 10:35:19

大數(shù)據(jù)法律大數(shù)據(jù)應用

2011-12-01 11:06:30

軟件定義網(wǎng)絡

2013-10-25 09:58:54

開發(fā)者操作系統(tǒng)

2021-03-09 16:33:54

大數(shù)據(jù)互聯(lián)網(wǎng)安全

2013-02-28 11:58:42

2018-07-04 14:28:02

2019-11-04 14:25:54

大數(shù)據(jù)Hadoop大數(shù)據(jù)時代

2015-10-28 10:55:36

2017-10-26 13:05:42

大數(shù)據(jù)云計算ODPiUAB

2013-03-20 10:31:14

大數(shù)據(jù)數(shù)據(jù)云服務

2015-08-11 09:22:20

點贊
收藏

51CTO技術(shù)棧公眾號