自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

27歲華裔小伙一戰(zhàn)成名!打造最準(zhǔn)新冠預(yù)測模型,干翻專業(yè)機構(gòu)

新聞
憑一己之力,僅用一周時間打造的新冠預(yù)測模型,準(zhǔn)確度方面碾壓那些數(shù)十億美元、數(shù)十年經(jīng)驗加持的專業(yè)機構(gòu)。

 本文經(jīng)AI新媒體量子位(公眾號ID:QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請聯(lián)系出處。

年僅27歲的他,被彭博評價為“新冠病毒數(shù)據(jù)超級明星”

為什么?

一己之力,僅用一周時間打造的新冠預(yù)測模型,準(zhǔn)確度方面碾壓那些數(shù)十億美元、數(shù)十年經(jīng)驗加持的專業(yè)機構(gòu)。

27歲華裔小伙一戰(zhàn)成名!打造最準(zhǔn)新冠預(yù)測模型,干翻專業(yè)機構(gòu)

他就是Youyang Gu,擁有 MIT 電氣工程和計算機科學(xué)碩士學(xué)位,以及數(shù)學(xué)學(xué)位。

但值得注意的是,他在醫(yī)學(xué)和流行病學(xué)等方面卻是一個小白

他的模型,甚至被著名數(shù)據(jù)科學(xué)家、fast.ai創(chuàng)始人Jeremy Howard高度評價道:

唯一看起來合理的模型。

他是唯一一個真正查看數(shù)據(jù),并且做得正確的人。

不僅如此,他的模型還被美國疾控中心采用。

到底是個怎樣的預(yù)測模型?

時間點要追溯到去年年初。

當(dāng)時疫情已然在全球蔓延開來,于是公眾試圖用建模的方式,來預(yù)測接下來疫情會帶來的影響。

大多數(shù)的目光都將希望投向了2家專業(yè)機構(gòu)打造的預(yù)測系統(tǒng)——倫敦帝國理工學(xué)院、總部位于西雅圖的健康指標(biāo)與評估研究所(IHME)。

但2家機構(gòu)給出的預(yù)測結(jié)果卻是天差地別

  • 倫敦帝國理工學(xué)院:到夏天,美國因新冠病毒而死亡的人數(shù)將達到200萬。
  • IHME:預(yù)計到8月,死亡人數(shù)將達到6萬。

(后來的事實證明,死亡人數(shù)是16萬。)

2家專業(yè)機構(gòu)給出的預(yù)測數(shù)據(jù),差距為何能夠如此之大?

這就讓當(dāng)時年僅26歲的Youyang Gu引起了注意。

[[382972]]

△ Youyang Gu

雖然他沒有任何醫(yī)學(xué)或流行病方面的經(jīng)驗,但他堅信,數(shù)據(jù)預(yù)測在此時會派上大用場。

于是,大約在4月中旬,Youyang Gu便在家里僅花了一周時間,打造出了自己的預(yù)測器,以及一個可以顯示相關(guān)信息的網(wǎng)站

27歲華裔小伙一戰(zhàn)成名!打造最準(zhǔn)新冠預(yù)測模型,干翻專業(yè)機構(gòu)

△Youyang Gu創(chuàng)建的網(wǎng)站

但Gu在這個過程中所用到的方法,并不是說有多么的高級,相反,恰恰是比較簡單的那種。

他首先考慮的是新冠病毒檢測數(shù)、住院人數(shù)和其他因素之間的關(guān)系,但在這個過程中,Gu卻發(fā)現(xiàn)各個州和聯(lián)邦政府所提供的數(shù)據(jù)是存在不一致的現(xiàn)象。

此時,問題就來了——什么樣的數(shù)據(jù)才是靠譜的?

Gu認(rèn)為,最靠譜的數(shù)據(jù),似乎就是每天的死亡人數(shù)

其他的模型用到了很多數(shù)據(jù)源,但我決定用過去的死亡人數(shù),來預(yù)測未來的死亡人數(shù)。

至于這樣做的原因,Gu給出的解釋是“將它作為唯一的輸入,有助于在噪音中過濾信號”。

那么,預(yù)測結(jié)果如何?

可以說是相當(dāng)?shù)木珳?zhǔn)了。

在模型剛剛完成時,他預(yù)測在5月9日,美國將有8萬人死亡,當(dāng)天的實際死亡人數(shù)為79926。

而同樣來自IHME的預(yù)測數(shù)據(jù)卻是“2020年一整年的死亡人數(shù)將不超過8萬”。

Gu還預(yù)測在5月18日,死亡人數(shù)將達到9萬;5月27日,死亡人數(shù)將達到10萬。

事實證明,他的這兩次預(yù)測再次“押中”

除了精準(zhǔn)數(shù)字的預(yù)測外,Gu基于許多州從封鎖狀態(tài)逐步轉(zhuǎn)變開放狀態(tài),預(yù)測將出現(xiàn)第二波大規(guī)模感染和死亡。

而在Gu發(fā)出這樣的預(yù)測當(dāng)天,特朗普所發(fā)表的言論卻是“IHME所預(yù)測的6萬死亡人數(shù)表明,疫情很快將結(jié)束”……

或許正是因為Gu的模型預(yù)測之精準(zhǔn),越來越多人開始關(guān)注他的作品。

在Twitter上,Gu不僅@了各路記者,還給流行病學(xué)專家發(fā)郵件,讓他們核實自己的數(shù)據(jù)。

27歲華裔小伙一戰(zhàn)成名!打造最準(zhǔn)新冠預(yù)測模型,干翻專業(yè)機構(gòu)

去年4月底,華盛頓大學(xué)著名生物學(xué)家Carl Bergstrom便在Twitter上發(fā)布了Gu的模型。

27歲華裔小伙一戰(zhàn)成名!打造最準(zhǔn)新冠預(yù)測模型,干翻專業(yè)機構(gòu)

不久之后,美國疾病控制和預(yù)防中心,也在其新冠預(yù)測網(wǎng)站上發(fā)布了Gu的數(shù)據(jù)。

不僅如此,隨著疫情的發(fā)展,身為中國移民的Gu,還參與了由美國專家團隊組織的定期會議,每個人都想更好的改善他的模型。

他的網(wǎng)站訪問量也呈現(xiàn)出爆炸式增長,每天都有數(shù)百萬人來看他的數(shù)據(jù)。

通常情況下,Gu的模型所預(yù)測的數(shù)據(jù),基本在幾周后便會達到,與實際的死亡人數(shù)非常接近。

隨著類似的預(yù)測模型逐漸增多,阿默斯特馬薩諸塞大學(xué)生物統(tǒng)計學(xué)和流行病學(xué)系的副教授Nicholas Reich,便統(tǒng)計了50個這樣的模型:

Gu的模型一直位居前列。

但到了去年11月,Gu卻做出了令人意外的一個決定——結(jié)束他的預(yù)測任務(wù)。

對此,Reich這樣評價道:

Youyang Gu是一個非常謙卑的人,他看到其他人的模型也做得很好,便覺得自己的工作已經(jīng)完成了。

而在Gu決定停止項目的前一個月,他預(yù)測11月1日死亡人數(shù)將達到231000人,而實際人數(shù)為230995人。

但IHME的Chris Murray認(rèn)為:

Gu使用的機器學(xué)習(xí)方法,在短期預(yù)測方面的效果比較良好,但不太理解“大局中發(fā)生了什么”。

對此,Gu沒有針對模型的評價做出回應(yīng),相反,他這樣表態(tài):

我非常感謝 Chris Murray 醫(yī)生和他的團隊所做的工作;沒有他們,我就不會有今天的成就。

在休息了一段時間之后,Gu重新投入到了這份事業(yè)當(dāng)中。

27歲華裔小伙一戰(zhàn)成名!打造最準(zhǔn)新冠預(yù)測模型,干翻專業(yè)機構(gòu)

這一次,他要做的預(yù)測是“美國有多少人感染了新冠病毒”、“疫苗推出的速度有多快”、“美國可能何時(如果可能的話)達到群體免疫”等。

他的預(yù)測表明,到今年6月,大約61%的美國人口應(yīng)該獲得某種形式的免疫力——無論是疫苗還是因過去的感染。

……

Gu一直希望能夠找到一份能對社會產(chǎn)生巨大影響的工作,同時避免政治、偏見以及大型機構(gòu)有時會帶來的負(fù)擔(dān)。他認(rèn)為:

在這個領(lǐng)域,有很多缺點可以通過我這種背景的人來改善。

誰是Youyang Gu?

Youyang Gu出身于美國華裔移民家庭,在伊利諾伊州和加州長大。

Gu從小喜歡數(shù)學(xué)和科學(xué),直到高中畢業(yè)時,才真正接觸計算機科學(xué)。而他能夠進入這個行業(yè)得益于他的父親,因為他的父親是一名計算機從業(yè)者。

[[382973]]

△正在做化學(xué)實驗的Gu Youyang(圖片來自2010年克拉克獎學(xué)金項目)

Gu本科和碩士都在MIT就讀,在那里他獲得了計算機科學(xué)與數(shù)學(xué)雙學(xué)士學(xué)位,以及計算機科學(xué)的碩士學(xué)位。

畢業(yè)后他繼續(xù)在MIT著名的CSAIL實驗室的NLP組進行了一年的研究,同年在EMNLP 2016上發(fā)表了論文。

27歲華裔小伙一戰(zhàn)成名!打造最準(zhǔn)新冠預(yù)測模型,干翻專業(yè)機構(gòu)

這也是他第一次接觸大數(shù)據(jù),并由此建立統(tǒng)計模型對數(shù)據(jù)進行預(yù)測。

不過他沒有因此繼續(xù)學(xué)術(shù)研究,而是進入產(chǎn)業(yè)界。從MIT離開后,他加入了金融行業(yè),為高頻交易系統(tǒng)編寫算法。

在那里,他的數(shù)據(jù)建模能力得到了進一步磨練,因為在金融交易中,數(shù)據(jù)必須非常定量并盡可能地準(zhǔn)確。

之后,他又進入了體育界,繼續(xù)進行大數(shù)據(jù)方面的研究。這也為他提供了豐富的跨學(xué)科經(jīng)驗,使他能夠成功應(yīng)對新地領(lǐng)域,懂得如何更加準(zhǔn)確地建模。

[[382974]]

用他自己的話來說,他的專長是使用機器學(xué)習(xí)來理解數(shù)據(jù),將信號與噪聲分離并做出準(zhǔn)確的預(yù)測。

在建立新冠死亡模型時,他起初考慮了確診數(shù)量、住院數(shù)量和其他因素之間的關(guān)系。然后他發(fā)現(xiàn)各州和聯(lián)邦政府報告的數(shù)據(jù)不一致,最可靠的數(shù)字是每天的死亡人數(shù)。

Gu認(rèn)為,如果輸入數(shù)據(jù)質(zhì)量很低,那么數(shù)據(jù)越多,輸出的性能就越差。

在一周的時間里,他就根據(jù)死亡數(shù)據(jù)便建立了一個簡單模型,并將預(yù)測網(wǎng)站上線。

從去年4月以來,Gu已經(jīng)自愿在這個項目中投入了幾千個小時,而且是無償?shù)摹?/p>

在接受醫(yī)學(xué)網(wǎng)站Medscape主編Eric Topol采訪時,Gu表示自己現(xiàn)在全職投入到新冠預(yù)測網(wǎng)站上,沒有兼職、沒有收入,他靠著過去的積蓄生活。

[[382975]]

△ Gu Youyang接受Medscape主編Eric Topol視頻采訪

然而就是這樣一個公益的項目卻遭到了一些Twitter網(wǎng)友非議,但是他還是堅持了下來。

從12月開始,covid19-projections.com接受網(wǎng)友的捐贈幫助,現(xiàn)在已經(jīng)完成了5萬美元的籌款目標(biāo)。

27歲華裔小伙一戰(zhàn)成名!打造最準(zhǔn)新冠預(yù)測模型,干翻專業(yè)機構(gòu)

除了感染人數(shù)外,Gu的新冠網(wǎng)站又有了一個新的功能。從去年12月起,covid19-projections.com開始跟蹤和模擬疫苗接種情況以及群體免疫的途徑。

這個月,Gu又將“群體免疫”改成了“恢復(fù)常態(tài)”,因為他的模型預(yù)測表明,美國不太可能在2021年達到理論上的群體免疫。

27歲華裔小伙一戰(zhàn)成名!打造最準(zhǔn)新冠預(yù)測模型,干翻專業(yè)機構(gòu)

未來的路怎么走?疫情結(jié)束后,Gu的職業(yè)規(guī)劃如何?

他說現(xiàn)在還為時過早,雖然他現(xiàn)在的工作是預(yù)測疫情發(fā)展,但是他很難預(yù)測自己3個月或1年后要做什么。

因為這項工作,世界各地的高校和企業(yè)已經(jīng)向他拋出了橄欖枝。

 

責(zé)任編輯:張燕妮 來源: 量子位
相關(guān)推薦

2025-01-14 14:06:11

2021-04-25 15:28:31

黑客安全網(wǎng)絡(luò)

2011-06-29 15:50:58

Watson危險邊緣Power7

2020-05-11 13:40:48

編程新冠App

2021-10-12 16:46:59

ArrayList接口LinkedList

2024-01-26 12:48:49

AI數(shù)據(jù)

2017-12-04 23:00:24

Windows開發(fā)者軟件

2015-05-18 10:53:33

2023-11-28 14:00:00

模型數(shù)據(jù)

2014-08-25 15:19:11

MIUI 6

2020-05-15 10:52:41

大數(shù)據(jù)人工智能技術(shù)

2024-06-20 07:38:44

2023-02-07 19:46:35

NIOCQ內(nèi)核

2022-03-12 15:03:59

存儲閃存硬盤數(shù)據(jù)中心

2015-09-28 17:20:12

智慧

2019-12-30 09:14:54

張一鳴互聯(lián)網(wǎng)高管

2012-02-27 10:17:25

2023-11-16 15:10:39

RustJavaZig

2024-09-25 15:02:47

2020-09-03 10:35:55

新冠肺炎技術(shù)科技變革
點贊
收藏

51CTO技術(shù)棧公眾號