奧巴馬競(jìng)選幕后CTO:大數(shù)據(jù)就是胡扯!
Harper Reed曾是在幕后助力奧巴馬在2012年競(jìng)選連任的首席技術(shù)官,日前他在澳大利亞悉尼舉行的CeBIT大會(huì)上稱(chēng)大數(shù)據(jù)就是“胡扯”!
他說(shuō),他最早在2007年接觸到“大數(shù)據(jù)”這個(gè)詞,當(dāng)時(shí)是指一種存儲(chǔ)方面的難題。“我們?cè)?007年使用這個(gè)詞,當(dāng)時(shí)是指數(shù)據(jù)難以保存。當(dāng)時(shí)做大數(shù)據(jù)的人做得很好。”但是并非每個(gè)人都做得很好,知道如何做,或者有這么做的工具。6年之后,像Hadoop和Hbase意味著保存和準(zhǔn)備大量的數(shù)據(jù)用于分析,這些不再是復(fù)雜的難題,但是“大數(shù)據(jù)”這個(gè)詞依然存在。
Reed更希望“大數(shù)據(jù)”這個(gè)詞沒(méi)有得到如此廣泛的使用,因?yàn)樗J(rèn)為很多考慮對(duì)大數(shù)據(jù)進(jìn)行投資的人,可能并沒(méi)有足夠多的數(shù)據(jù)能稱(chēng)得上大數(shù)據(jù)。
作為奧巴馬2012年競(jìng)選的首席數(shù)據(jù)科學(xué)家,Rayid Ghani表示認(rèn)同Reed的觀點(diǎn)。他透露說(shuō),他個(gè)人在國(guó)內(nèi)存儲(chǔ)的數(shù)據(jù)比競(jìng)選中使用的數(shù)據(jù)更多。
所以Reed認(rèn)為,這次CeBIT大會(huì)的參會(huì)者中,少有人的數(shù)據(jù)量可以真正稱(chēng)之為“大”。
他說(shuō):“你可能會(huì)中等量的數(shù)據(jù)。”他認(rèn)為大數(shù)據(jù)這個(gè)詞現(xiàn)在更多地代表著分析工具,而非數(shù)據(jù)本身。
即使是“大”數(shù)據(jù)或者“中量”的數(shù)據(jù)包含的個(gè)人信息,Ghani表示,分析過(guò)程也可能并沒(méi)有用之來(lái)得出有價(jià)值的東西。
他說(shuō):“比如,你開(kāi)什么樣的車(chē),這種數(shù)據(jù)信息在競(jìng)選中是沒(méi)什么用處的。我們并不使用這種私人數(shù)據(jù)。”他表示,比較有用處的是簡(jiǎn)單的數(shù)據(jù)點(diǎn),例如對(duì)“你支持總統(tǒng)嗎?”這種問(wèn)題的回答。對(duì)問(wèn)題的回答,以及個(gè)人是否曾經(jīng)參加過(guò)競(jìng)選,奧巴馬的團(tuán)隊(duì)利用這些信息可以識(shí)別出哪些人是值得他們關(guān)注的。
Reed還提醒25歲以上的人們不要對(duì)隱私問(wèn)題感到恐慌。年齡稍大一些的人會(huì)對(duì)像Facebook挖掘用戶(hù)信息這樣的事耿耿于懷,而年輕人則對(duì)使用服務(wù)的隱私控制比較了解。他說(shuō),年齡稍大的人并不會(huì)費(fèi)心去了解關(guān)于隱私控制的事情,因此他們對(duì)自己隱私的擔(dān)憂是普遍存在的。“不要將我們自己的恐懼投射給別人。”