劍橋大學(xué)專家觀點(diǎn):大數(shù)據(jù),大責(zé)任
大數(shù)據(jù)如今已成為媒體大肆炒作的對(duì)象。以超快速度處理大量信息的能力,正在顛覆全球各地的商業(yè)模式。但大數(shù)據(jù)與一切技術(shù)一樣,也會(huì)帶來風(fēng)險(xiǎn)。所有的技術(shù)使用者都應(yīng)注意:大數(shù)據(jù)意味著大責(zé)任。
近期我與他人聯(lián)合主持的一項(xiàng)研究得出結(jié)論:僅僅使用公開的Facebook“贊”(Like)信息,也能瞬時(shí)生成極為詳盡的用戶心理-人口特征資料,包括種族、性格、智商分?jǐn)?shù)、幸福感、藥物使用、性取向、政治觀點(diǎn)和宗教信仰等有效的個(gè)人統(tǒng)計(jì)信息。
一旦掌握了數(shù)據(jù),便不難建立起能夠自動(dòng)更新的模型。我們抽取了5.8萬個(gè)Facebook資料的“贊”和個(gè)人屬性信息,并通過自己的調(diào)查表加以衡量——我們沒有理由認(rèn)為研究結(jié)果不具有代表性。
推測(cè)的依據(jù)不是那些規(guī)模不大、一眼便可看出聯(lián)系的“贊”數(shù)據(jù)集。對(duì)科學(xué)感興趣與智力水平高存在聯(lián)系,但喜歡炸薯圈或鐘愛摩根?弗里曼(Morgan Freeman)的嗓音也同樣具有信息量。將成千上萬類似數(shù)據(jù)聚合在一起,就能有效地推斷出個(gè)人特征。
Facebook只是開始。“贊”是一類可用于推測(cè)的數(shù)字記錄,而其他種類的數(shù)字記錄還包括Twitter消息、電子郵件、網(wǎng)絡(luò)搜索、瀏覽記錄、信用卡交易和線上/線下的購物信息。
與任何偉大的技術(shù)一樣,這種推測(cè)功能既可以為善,也可以作惡。
快速、自動(dòng)化的心理評(píng)估可能對(duì)招聘產(chǎn)生革命性的影響。何不先對(duì)數(shù)百萬名應(yīng)聘者進(jìn)行評(píng)估(在征得他們同意的情況下),再邀請(qǐng)最適合的一小部分人參加面試?這對(duì)招聘方和應(yīng)聘者都是省時(shí)省錢的方法。何不根據(jù)個(gè)人特征自動(dòng)調(diào)整產(chǎn)品和服務(wù)?試想一下,英國(guó)《金融時(shí)報(bào)》能夠根據(jù)個(gè)人性格和情緒針對(duì)性地推薦在線文章。再試想一下,開放、外向的人和保守、內(nèi)向的人搜索“倫敦過夜”時(shí),可以得到不同的結(jié)果。
當(dāng)然,這也有不利的一面。個(gè)性化的廣告或許會(huì)被認(rèn)為對(duì)用戶和廣告商都有好處,但如果力量的天平向廣告商傾斜,可能會(huì)把顧客玩弄于股掌之中。一位情緒不穩(wěn)定的用戶可能會(huì)因?yàn)槠湫睦硖卣鞫徽T導(dǎo)購買不必要的保險(xiǎn)。推測(cè)某些特征的能力甚至?xí)?duì)人帶來危險(xiǎn)。目前已經(jīng)可能推斷出用戶的性取向或宗教信仰,這會(huì)令他們的安全受到危害——這種情況不僅僅發(fā)生在不太自由的國(guó)家。
由于意識(shí)到播放列表、購物記錄和“贊”能夠泄露如此多的信息,許多人可能對(duì)在線技術(shù)望而卻步。在我看來,這種“數(shù)字排斥”對(duì)個(gè)人和經(jīng)濟(jì)而言都不是好事。推測(cè)個(gè)人特征和喜好的潛力是巨大的。我不是政策制定者,但我相信,我們應(yīng)當(dāng)設(shè)計(jì)出盡量降低相關(guān)風(fēng)險(xiǎn)的政策和工具。我們應(yīng)當(dāng)遵循兩項(xiàng)原則:透明度和控制權(quán)。
首先,我們需要幫助用戶了解,他們的哪些個(gè)人數(shù)據(jù)是公開的,這些數(shù)據(jù)目前和潛在的用途是什么。其次,我們需要讓用戶完全控制住自己的數(shù)據(jù),自行決定數(shù)據(jù)將如何得到使用。這兩方面可能已出現(xiàn)了技術(shù)解決方案,但還需要培養(yǎng)用戶意識(shí),并建立合適的法律框架。
對(duì)可用于推斷的數(shù)據(jù),用戶應(yīng)享有完全的控制權(quán)。由公司和政府等第三方存儲(chǔ)并管理個(gè)人數(shù)據(jù),已經(jīng)成為通行做法。但一定要這樣做嗎?試想“贊”或購買記錄并不存儲(chǔ)在社交網(wǎng)絡(luò)或網(wǎng)店中,而是安全地保存在你的電腦或個(gè)人云帳戶中。推測(cè)仍然可以進(jìn)行,但會(huì)受到用戶的控制,讓用戶能夠?qū)徍藢?duì)個(gè)人特征的推斷結(jié)果。
我愛Facebook。它是將人們聯(lián)系在一起的偉大技術(shù)。我希望助一臂之力,確保我們?cè)谥纻€(gè)人信息安全情況下繼續(xù)利用這一技術(shù)。
本文作者為英國(guó)劍橋大學(xué)心理測(cè)量學(xué)中心(Cambridge University's Psychometrics Centre)研究員。他與心理測(cè)量學(xué)中心的同事大衛(wèi)?史迪威(David Stillwell)和微軟研究院(Microsoft Research)的托雷?格雷佩爾(Thore Graepel)合著了這項(xiàng)有關(guān)個(gè)人特征的研究報(bào)告。