吳恩達(dá)新動作:建立新ML資源站,「以數(shù)據(jù)為中心的AI」大本營
本文經(jīng)AI新媒體量子位(公眾號ID:QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請聯(lián)系出處。
很高興給大家介紹我們建立的一個新資源站Data-centric AI,這里有許多專家的文章和NeurIPS DCAI研討會的交流談話,來看看吧~
這個DCAI是什么來頭?
它代表了最近AI從“以模型為中心”到“以數(shù)據(jù)為中心”的轉(zhuǎn)變。
在過去幾十年間,大多數(shù)的AI研究都集中在“code”上面,也就是提升模型或者算法。
不過目前在很多應(yīng)用上,“code”已經(jīng)基本上能夠解決問題了,花時間改善一下數(shù)據(jù)往往會更有用。
然而現(xiàn)在構(gòu)建、使用數(shù)據(jù)集這部分工作通常還是人工來做,費時費力,成本高昂,缺少高效的數(shù)據(jù)工具。
DCAI的出現(xiàn)就是為了解決這個問題。
這個新的資源站匯總了在數(shù)據(jù)這塊最新的進(jìn)展和最好的實踐,目前共包含兩大塊內(nèi)容:交流話題和NeurIPS研討會資源。
其中交流話題現(xiàn)在共有3個:Labeling and Crowdsourcing(眾包數(shù)據(jù)標(biāo)注)、Data Augmentation(數(shù)據(jù)增強)、Data in Deployment(數(shù)據(jù)部署)。
分別由斯坦福計算機科學(xué)副教授Michael Bernstein、加州理工教授Anima Anandkumar和Google Brain研究負(fù)責(zé)人D. Sculley主導(dǎo)討論。
在每個話題下面都會有教授進(jìn)行介紹、舉例、提出解決方法。
例如在數(shù)據(jù)增強這個話題下,Anima教授就從數(shù)據(jù)增強要解決的問題開始,給出解決方法,并介紹最新的研究成果:
在訓(xùn)練數(shù)據(jù)中僅使用邊框標(biāo)簽來訓(xùn)練模型進(jìn)行實例分割:
并在最后給出相關(guān)的資源以供參考。
DCAI包含的第二部分內(nèi)容就是NeurIPS研討會資源。
這里有各路大神在去年NeurIPS研討會上的發(fā)言和談話。
每個視頻還都配有同步的PPT:
除了這兩部分資源之外,你還可以成為DCAI社區(qū)的貢獻(xiàn)者,在這里分享DCAI的研究項目、工具或者提議等內(nèi)容:
自吳教授推文發(fā)布后,很快就收到了網(wǎng)友的熱情回應(yīng)。大伙紛紛希望加入社區(qū),還有人表示會很快分享自己的成果:
如果有同學(xué)對“以數(shù)據(jù)為中心”的AI內(nèi)容感興趣,就趕快用起來吧~
DCAI地址:
https://datacentricai.org/