Google Cloud 發(fā)布 COVID-19 數(shù)據(jù)集,可構(gòu)建 AI 模型來對抗疫情
本文轉(zhuǎn)自雷鋒網(wǎng),如需轉(zhuǎn)載請至雷鋒網(wǎng)官網(wǎng)申請授權(quán)。
3 月 31 日,Google 正式宣布啟動一項名為新型冠狀病毒公共數(shù)據(jù)集(COVID-19 Public Datasets)的項目,該項目將托管一個與疫情相關(guān)的公共數(shù)據(jù)資料庫,并將它們開放,以便外界自由訪問和分析。
Google 方面表示,這樣做的目的是消除障礙,并為研究人員提供快速,便捷的關(guān)鍵信息訪問途徑,而無需搜索和攜帶大型數(shù)據(jù)文件。
雷鋒網(wǎng)(公眾號:雷鋒網(wǎng))了解到,在這個所謂的公共數(shù)據(jù)集項目中,其數(shù)據(jù)包括約翰·霍普金斯大學(xué)系統(tǒng)科學(xué)與工程中心(JHU CSSE)數(shù)據(jù)集、來自世界銀行的全球健康數(shù)據(jù)和 OpenStreetMap 數(shù)據(jù),所有這些都將免費存儲在 Google Cloud 上——Google 也表示將與這些數(shù)據(jù)集背后的的組織提前接觸。
按照 Google 的安排,這些數(shù)據(jù)集將帶有 “ COVID-19” 標簽,一個說明和幾個示例查詢,可以從 Google Cloud Console Market 和 BigQuery 用戶界面中進行索索,其中在 BigQuery 中被標記為 “freebqcovid”。
值得一提的是,研究人員可以使用 Google 的 BigQuery ML 服務(wù),該服務(wù)使用戶可以使用 SQL 查詢在 BigQuery(完全托管的數(shù)據(jù)倉庫)中創(chuàng)建和執(zhí)行機器學(xué)習(xí)模型,從而在 COVID-19 數(shù)據(jù)集上訓(xùn)練機器學(xué)習(xí)模型。
基于這個項目的公共屬性,用戶在查詢時是完全免費的,并且查詢免費政策一直持續(xù)到直到 9 月 15 日。但是 Google 指出,如果將任何數(shù)據(jù)集與非 COVID-19 數(shù)據(jù)集結(jié)合在一起,則處理的字節(jié)將計入 BigQuery Sandbox 中,每月有 10GB 的存儲空間和 1TB 的查詢限制——然后然后按量收費,以防止濫用。
Google BigQuery 產(chǎn)品經(jīng)理兼GIS負責(zé)人Chad W. Jennings 和開發(fā)者倡導(dǎo)者 Shane Glass 在博客中表示:
這些數(shù)據(jù)集的內(nèi)容僅嚴格出于教育和研究目的而向公眾提供,Google Cloud 小組衷心希望COVID-19 公共數(shù)據(jù)集項目將能夠更好、更快地賦能研究,以阻止疾病的蔓延。
雷鋒網(wǎng)了解到,除了 COVID-19公共數(shù)據(jù)集計劃,Google 也進行了許多其他對抗新型冠狀病毒的努力。
比如說,Google 向與該病毒作斗爭的組織捐贈了 8 億美元的廣告和貸款,添加了新型冠狀病毒提示 Google Assistant 快捷方式,并與 Microsoft 和 Palantir 合作,為英國國家衛(wèi)生局(National Health Service)建立了信息發(fā)布臺。
另外,Google 還推出了專門的頁面和搜索門戶來整理有關(guān) COVID-19 的資源,這家科技巨頭的母公司 Alphabet 也加大了灣區(qū)疾病篩查計劃的力度,