奧巴馬競選幕后CTO詮釋真正的大數(shù)據(jù)
他說,他最早在2007年接觸到“大數(shù)據(jù)”這個詞,當時是指一種存儲方面的難題。“我們在2007年使用這個詞,當時是指數(shù)據(jù)難以保存。當時做大數(shù)據(jù)的人做得很好。”但是并非每個人都做得很好,知道如何做,或者有這么做的工具。6年之后,像Hadoop和Hbase意味著保存和準備大量的數(shù)據(jù)用于分析,這些不再是復雜的難題,但是“大數(shù)據(jù)”這個詞依然存在。
Reed更希望“大數(shù)據(jù)”這個詞沒有得到如此廣泛的使用,因為他認為很多考慮對大數(shù)據(jù)進行投資的人,可能并沒有足夠多的數(shù)據(jù)能稱得上大數(shù)據(jù)。
作為奧巴馬2012年競選的***數(shù)據(jù)科學家,Rayid Ghani表示認同Reed的觀點。他透露說,他個人在國內存儲的數(shù)據(jù)比競選中使用的數(shù)據(jù)更多。
所以Reed認為,這次CeBIT大會的參會者中,少有人的數(shù)據(jù)量可以真正稱之為“大”。
他說:“你可能會中等量的數(shù)據(jù)。”他認為大數(shù)據(jù)這個詞現(xiàn)在更多地代表著分析工具,而非數(shù)據(jù)本身。
即使是“大”數(shù)據(jù)或者“中量”的數(shù)據(jù)包含的個人信息,Ghani表示,分析過程也可能并沒有用之來得出有價值的東西。
他說:“比如,你開什么樣的車,這種數(shù)據(jù)信息在競選中是沒什么用處的。我們并不使用這種私人數(shù)據(jù)。”他表示,比較有用處的是簡單的數(shù)據(jù)點,例如對 “你支持總統(tǒng)嗎?”這種問題的回答。對問題的回答,以及個人是否曾經參加過競選,奧巴馬的團隊利用這些信息可以識別出哪些人是值得他們關注的。
Reed還提醒25歲以上的人們不要對隱私問題感到恐慌。年齡稍大一些的人會對像Facebook挖掘用戶信息這樣的事耿耿于懷,而年輕人則對使用服務的隱私控制比較了解。他說,年齡稍大的人并不會費心去了解關于隱私控制的事情,因此他們對自己隱私的擔憂是普遍存在的。“不要將我們自己的恐懼投射給別人。”