Twitter將向科學家開放全部數(shù)據(jù)
新浪科技訊 北京時間5月27日上午消息,每天有5億條Twitter消息發(fā)布,內(nèi)容涉及人們生活的方方面面,而現(xiàn)在,這家社交網(wǎng)絡決定將這一巨大的數(shù)據(jù)寶庫向科學家開放,幫助他們研究人類的行為模式、預判健康風險并追蹤傳染病的傳播情況。
例如,微軟研究人員通過對Twitter上的懷孕婦女透露出的情緒,開發(fā)了一種新的算法來預測產(chǎn)后抑郁癥的風險。美國地質(zhì)調(diào)查局則可以使用Twitter追蹤地震發(fā)生地。
直到目前,多數(shù)對相關(guān)問題感興趣的科學家都只能使用有限的Twitter消息。盡管多數(shù)Twitter消息都對外公開,但科學家卻希望能夠隨意搜索這些內(nèi)容,他們目前只能通過Twitter的API(應用編程接口)實現(xiàn)這項功能,但卻只能訪問1%的數(shù)據(jù)。
不過,這種情況很快就將改變:Twitter今年2月宣布,將把2006年以來的所有數(shù)據(jù)免費提供給研究人員,有望使得Twitter成為一項廣受歡迎的研究工具。借助如此龐大的數(shù)據(jù),科學家可以展開更加復雜的研究,回答更具體的問題。
Twitter的這一計劃令人興奮,但也引發(fā)了一些問題。Twitter能否對相關(guān)科研結(jié)果享有任何權(quán)益?由于用戶未必想將自己的內(nèi)容貢獻給研究人員,因此Twitter的這一工具是否有違道德?
為了解決這個問題,弗吉尼亞理工大學計算機流行病學家凱特琳·里夫斯(Caitlin Rivers)和布萊恩·劉易斯(Bryan Lewis)今年2月針對Twitter數(shù)據(jù)的使用方式發(fā)布了道德規(guī)范。他們建議科學家不要披露相關(guān)用戶的名稱,也不要公布研究目的。
例如,盡管從公共空間搜集信息并不違反道德,而Twitter也的確是一個公共空間,但在未經(jīng)他人許可的情況下分享其身份信息卻有違道德。里夫斯和劉易斯認為,科學家需要將保護用戶隱私列為Twitter研究項目的基本原則——數(shù)據(jù)越大,責任越大。