自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

避免大數(shù)據(jù)分析的“思維陷阱”

云計(jì)算
大數(shù)據(jù)分析可以追溯到30年前,那時(shí)在數(shù)據(jù)分析界,人們認(rèn)為數(shù)據(jù)分析的工具和算法已經(jīng)可以深度分析出任何東西,所欠缺的就是數(shù)據(jù)量。數(shù)據(jù)分析師們的說(shuō)法就是,如果你能夠讓我測(cè)量一切數(shù)據(jù),追蹤一切數(shù)據(jù),從微觀的精確到分鐘的銷售,精確到每個(gè)人的資源消耗,到宏觀的變量如利率的變化等,我就能夠告訴你想知道的一切,這些變量之間的相關(guān)性,它們的變化趨勢(shì)等等一切的一切。

 [[59284]]

 

在大數(shù)據(jù)時(shí)代, 即便是小公司也可能輕易擁有海量的數(shù)據(jù)。 然而, 在進(jìn)行大數(shù)據(jù)分析時(shí), 人們很容易就會(huì)掉入大數(shù)據(jù)帶來(lái)的認(rèn)知陷阱。 弗吉尼亞大學(xué)達(dá)頓商學(xué)院的教授Robert Carraway在最近的一篇文章里, 介紹了如何通過“小實(shí)驗(yàn)”來(lái)避免這樣的思維陷阱。

大數(shù)據(jù)分析可以追溯到30年前, 那時(shí)在數(shù)據(jù)分析界, 人們認(rèn)為數(shù)據(jù)分析的工具和算法已經(jīng)可以深度分析出任何東西, 所欠缺的就是數(shù)據(jù)量。 數(shù)據(jù)分析師們的說(shuō)法就是, 如果你能夠讓我測(cè)量一切數(shù)據(jù), 追蹤一切數(shù)據(jù), 從微觀的精確到分鐘的銷售, 精確到每個(gè)人的資源消耗,到宏觀的變量如利率的變化等, 我就能夠告訴你想知道的一切, 這些變量之間的相關(guān)性, 它們的變化趨勢(shì)等等一切的一切。

這種說(shuō)法一直是主流數(shù)據(jù)分析界的看法。 到了今天, 數(shù)據(jù)量已經(jīng)不成問題了。 互聯(lián)網(wǎng)的幾乎能夠找到你需要的任何數(shù)據(jù)。 想要知道賓夕法尼亞州的工業(yè)清洗設(shè)備的銷售與該州的鋼鐵廠的設(shè)備使用的關(guān)系? 沒問題, 想要提高用戶滿意度? 可以把用戶投訴數(shù)據(jù)采用聚類算法進(jìn)行聚類。 你動(dòng)動(dòng)鼠標(biāo), 很多數(shù)據(jù)就能夠找到了。

大數(shù)據(jù)的“羅生門”

好了, 現(xiàn)在的問題, 已經(jīng)不是數(shù)據(jù)不夠的問題了。 分析師不能再說(shuō)“我的分析方法沒問題, 只要有足夠的數(shù)據(jù)。 ”如今, 數(shù)據(jù)的豐富程度已經(jīng)足以滿足任何分析方法的需要。 相反, 分析師需要考慮的是“什么樣的分析方法最合適”以及“這些數(shù)據(jù)到底能告訴我們什么”。

這很自然地帶來(lái)了另一個(gè)問題, 這個(gè)問題可能是大數(shù)據(jù)帶來(lái)的真正問題。 那就是:

現(xiàn)有的數(shù)據(jù), 多的可以讓你想要分析出什么結(jié)果, 就能分析出什么結(jié)果。

有一句話叫做:“這個(gè)世界上有兩種謊言, 第一種叫謊言, 第二種叫統(tǒng)計(jì)”。 我們的大腦有一種無(wú)與倫比的能力, 那就是發(fā)現(xiàn)規(guī)律的能力(即便是其實(shí)沒有規(guī)律)。

達(dá)頓商學(xué)院的教授曾經(jīng)在班上做過這樣一個(gè)實(shí)驗(yàn):他找了兩個(gè)學(xué)生, 其中一個(gè)學(xué)生, 用隨機(jī)數(shù)生成器 生成一個(gè)數(shù)列, 數(shù)列里的每個(gè)數(shù), 都是1 到10 之間的一個(gè)隨機(jī)整數(shù)。 另一個(gè)學(xué)生, 則寫同樣長(zhǎng)度的一個(gè)數(shù)列, 數(shù)列中的每個(gè)數(shù), 這個(gè)學(xué)生可以隨機(jī)地寫從1到10 之間的一個(gè)整數(shù)。 教授讓第三個(gè)學(xué)生, 把這兩個(gè)學(xué)生生成的數(shù)列給他看。 他幾乎每次都能正確地判斷出那個(gè)數(shù)列是真的隨機(jī)數(shù)列, 哪個(gè)數(shù)列是人工寫的。 那些看上去有規(guī)律, 或者常有連續(xù)重復(fù)數(shù)字的, 是隨機(jī)數(shù)列。 而人工寫成的數(shù)列, 則盡量避免出現(xiàn)規(guī)律性或者重復(fù)性。 為什么呢? 因?yàn)槲覀兛倽撘庾R(shí)里, 會(huì)認(rèn)為有規(guī)律性或者重復(fù)性的東西, 一定有它的原因, 就不可能是隨機(jī)的。 因此, 當(dāng)我們看到任何有點(diǎn)規(guī)律的模式時(shí), 我們就會(huì)認(rèn)為一定有一些非隨機(jī)的因素。

這種潛意識(shí)其實(shí)來(lái)自于我們?cè)谧匀唤绲纳姹灸堋?當(dāng)你看到草叢晃動(dòng)的時(shí)候, 你寧可認(rèn)為是有一只老虎在那邊, 也比認(rèn)為是“隨機(jī)的” 風(fēng)吹的, 而最后跳出一只老虎來(lái)強(qiáng)。#p#

用“小實(shí)驗(yàn)”來(lái)驗(yàn)證“大數(shù)據(jù)”

如何才能避免掉入這樣的認(rèn)知陷阱呢? 可以采用達(dá)頓商學(xué)院教授Jeanne Liedtka所提倡的“小規(guī)模實(shí)驗(yàn)”的方式。 “小規(guī)模實(shí)驗(yàn)”與“大數(shù)據(jù)挖掘”的區(qū)別在于, “小規(guī)模實(shí)驗(yàn)”是特別設(shè)計(jì)來(lái)驗(yàn)證那些憑借分析工具(或者在分析工具幫助下的想象力)所“發(fā)現(xiàn)”的規(guī)律的正確性。 設(shè)計(jì)小規(guī)模試驗(yàn)的關(guān)鍵, 就是用實(shí)例去驗(yàn)證你發(fā)現(xiàn)的規(guī)律。 如果驗(yàn)證結(jié)果是正確的話, 那么規(guī)律或模式的可信度就提高了。

為什么要“小規(guī)模”呢?因?yàn)椋?在海量數(shù)據(jù)加上分析工具, 可以讓我們?nèi)グl(fā)現(xiàn)無(wú)數(shù)的規(guī)律和模式, 而對(duì)每個(gè)規(guī)律或模式去驗(yàn)證會(huì)投入資源(時(shí)間以及金錢)。 通過把實(shí)驗(yàn)數(shù)據(jù)量的規(guī)模減小, 我們就可以更快更有效地驗(yàn)證更多的可能性。 這樣也就能夠加快企業(yè)的創(chuàng)新過程。

如何進(jìn)行“小規(guī)模實(shí)驗(yàn)”, 要根據(jù)具體情況看(編者注: 本站文章解密奧巴馬的大數(shù)據(jù)精準(zhǔn)營(yíng)銷戰(zhàn)里提到了奧巴馬的競(jìng)選團(tuán)隊(duì)進(jìn)行的實(shí)驗(yàn)性數(shù)據(jù)分析, 讀者可以參考)。 一般來(lái)說(shuō), 實(shí)驗(yàn)會(huì)采用大數(shù)據(jù)分析所用的數(shù)據(jù)集。 從中取出一部分子集進(jìn)行分析, 發(fā)現(xiàn)的規(guī)律, 通過另一部分?jǐn)?shù)據(jù)子集進(jìn)行驗(yàn)證, 如果規(guī)律在驗(yàn)證數(shù)據(jù)子集中也存在的話, 再利用大數(shù)據(jù)數(shù)據(jù)集采集的方式采集新的數(shù)據(jù), 進(jìn)一步進(jìn)行驗(yàn)證。

保險(xiǎn)公司Progressive Insurance以及信用卡公司Capital One是兩個(gè)利用數(shù)據(jù)分析成功取得競(jìng)爭(zhēng)優(yōu)勢(shì)的公司。 在他們的實(shí)踐中, 他們就很好地采用了這樣的“大數(shù)據(jù), 小實(shí)驗(yàn)”的方式, 他們意識(shí)到我們天生的那種發(fā)現(xiàn)“并不存在的”規(guī)律的能力的危險(xiǎn)性, 因此,他們利用小規(guī)模試驗(yàn)的方式, 從而使得他們能夠快速有效地進(jìn)行數(shù)據(jù)挖掘。

海量數(shù)據(jù)加上分析工具, 使得數(shù)據(jù)分析現(xiàn)在是一個(gè)很熱的話題。 很多企業(yè)認(rèn)為數(shù)據(jù)分析師能夠“點(diǎn)石成金”。 但是,常言道: “人們看到的是他們想要看到的東西。” 今天, 我們有了海量數(shù)據(jù)和能“發(fā)現(xiàn)任何規(guī)律”的分析工具后, 還是不能忘記那個(gè)最古老的辦法——用小規(guī)模的實(shí)驗(yàn)去驗(yàn)證。 否則的話, 幾百萬(wàn)上千萬(wàn)美元的大數(shù)據(jù)投資, 可能發(fā)現(xiàn)的只是我們想象出來(lái)的“規(guī)律”。

原文鏈接:http://www.ctocio.com/ccnews/10685.html

責(zé)任編輯:王程程 來(lái)源: IT經(jīng)理網(wǎng)
相關(guān)推薦

2017-12-20 15:25:51

數(shù)據(jù)分析大數(shù)據(jù)企業(yè)

2022-02-16 10:37:41

數(shù)據(jù)分析思維數(shù)據(jù)分析

2017-09-14 12:03:30

大數(shù)據(jù)數(shù)據(jù)分析語(yǔ)言

2019-09-24 14:36:38

數(shù)據(jù)分析思維大數(shù)據(jù)

2017-01-16 15:44:38

數(shù)據(jù)分析大數(shù)據(jù)指標(biāo)體系

2015-08-14 10:28:09

大數(shù)據(jù)

2014-06-26 09:41:13

數(shù)據(jù)分析

2021-04-22 11:22:12

云計(jì)算數(shù)據(jù)遷移混合云

2017-07-22 00:41:27

大數(shù)據(jù)數(shù)據(jù)存儲(chǔ)

2022-10-14 09:52:26

數(shù)據(jù)分析

2021-08-06 11:01:23

大數(shù)據(jù)數(shù)據(jù)分析技術(shù)

2019-07-31 14:16:35

大數(shù)據(jù)人工智能算法

2021-10-12 15:25:08

大數(shù)據(jù)數(shù)據(jù)分析

2022-03-29 14:49:14

大數(shù)據(jù)數(shù)據(jù)分析

2015-08-11 15:52:52

大數(shù)據(jù)數(shù)據(jù)分析

2015-07-23 09:34:57

大數(shù)據(jù)數(shù)據(jù)分析

2013-04-09 09:28:20

大數(shù)據(jù)大數(shù)據(jù)全球技術(shù)峰會(huì)

2019-01-16 18:39:24

數(shù)據(jù)開發(fā)模型

2017-01-23 16:30:46

數(shù)據(jù)分析大數(shù)據(jù)

2021-11-11 11:27:55

大數(shù)據(jù)分析系統(tǒng)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)