2019年Reddit機(jī)器學(xué)習(xí)板塊17個(gè)熱門項(xiàng)目:最新代碼、資源應(yīng)有盡有
本文經(jīng)AI新媒體量子位(公眾號(hào)ID:QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請(qǐng)聯(lián)系出處。
2019年即將過去。國(guó)外最熱論壇Reddit的機(jī)器學(xué)習(xí)板塊,也為大家提供了一個(gè)優(yōu)秀的學(xué)習(xí)討論場(chǎng)所。
那么,在過去的一年Reddit上關(guān)注度最高的帖子有哪些呢?
一位來自非洲的數(shù)據(jù)分析師,總結(jié)了機(jī)器學(xué)習(xí)板塊上點(diǎn)贊數(shù)最高的17篇項(xiàng)目、論文和Demo,希望你能從這些帖子中獲得啟發(fā)。
無(wú)監(jiān)督圖到圖的轉(zhuǎn)換(913贊)
這是來自英偉達(dá)的研究,它讓AI也可以像人類一樣,只需少量的樣本,即可實(shí)現(xiàn)從圖像到圖像的轉(zhuǎn)換。
相關(guān)報(bào)道:
《雷布斯變貓布斯,皮卡丘變狗卡丘:英偉達(dá)最新AI開源,萬(wàn)物換臉只憑一張圖 | Demo》
該模型通過結(jié)合對(duì)抗訓(xùn)練方案和新穎的網(wǎng)絡(luò)設(shè)計(jì)來實(shí)現(xiàn)這種快速生成能力。
比如,我們有了一張小狗的動(dòng)圖,和其他不同動(dòng)物的靜態(tài)圖像,F(xiàn)UNIT就能得到動(dòng)作與之同步的各種動(dòng)圖。
GitHub地址:
https://github.com/NVlabs/FUNIT
生成自定義二次元妹子(521贊)
作者提出了一種能夠繪制動(dòng)漫的神經(jīng)網(wǎng)絡(luò)Waifu自動(dòng)販賣機(jī),其特點(diǎn)是可以讓你更具需求生成自己喜歡的二次元妹子,并在此基礎(chǔ)上生成你喜歡的動(dòng)漫。
網(wǎng)站地址:
https://waifulabs.com/
最大數(shù)據(jù)集資源列表(499贊)
作者匯總了一系列機(jī)器學(xué)習(xí)數(shù)據(jù)集,減少大家在線查找數(shù)據(jù)集的時(shí)間。數(shù)據(jù)集按各種任務(wù)或領(lǐng)域進(jìn)行細(xì)分,包括:NLP、自動(dòng)駕駛、質(zhì)量檢查、音頻和醫(yī)療等等。

網(wǎng)站地址:
https://www.datasetlist.com/
48萬(wàn)條用于NLP的影評(píng)(464贊)
這是作者在電影評(píng)論網(wǎng)站“爛番茄”上收集的48萬(wàn)條評(píng)論,對(duì)NLP任務(wù)非常有用。
GitHub地址:
https://github.com/nicolas-gervais/6-607-Algorithms-for-Big-Data-Analysis/blob/master/scraping%20all%20critic%20reviews%20from%20rotten%20tomatoes
你也可以到Google云盤上直接下載:
https://drive.google.com/file/d/1N8WCMci_jpDHwCVgSED-B9yts-q9_Bb5/view
自動(dòng)貓門(464贊)
這是一個(gè)給貓奴們的福利。如果貓的嘴里叼著東西,貓們將自動(dòng)鎖定15分鐘,防止貓將死老鼠等東西帶進(jìn)房屋。
這個(gè)裝置將攝像頭連接到貓的門上,然后應(yīng)用機(jī)器學(xué)習(xí)來檢查貓的嘴里是否有東西,來做到這一點(diǎn)。
視頻地址:
https://www.youtube.com/watch?v=1A-Nf3QIJjM
基于點(diǎn)云生成3D場(chǎng)景圖(415贊)
作者提出了一種基于點(diǎn)的新方法來對(duì)復(fù)雜場(chǎng)景進(jìn)行建模,它使用原始點(diǎn)云作為場(chǎng)景的幾何表示。
然后,該方法使用可以學(xué)習(xí)的神經(jīng)描述編碼擴(kuò)充每個(gè)點(diǎn),神經(jīng)描述對(duì)局部幾何形狀和外觀進(jìn)行編碼。通過將點(diǎn)云的柵格化從新視角傳遞到深度渲染網(wǎng)絡(luò)中,可以獲得新的場(chǎng)景視圖。
論文地址:
https://arxiv.org/abs/1906.08240
AdaBound優(yōu)化器(402贊)
這是兩個(gè)中國(guó)本科生提出的一種新的優(yōu)化器,他們分別來自北大和浙大。這篇文章已經(jīng)被ICLR 2019收錄,并且讓領(lǐng)域主席贊不絕口。
相關(guān)報(bào)道:
《中國(guó)學(xué)霸本科生提出AI新算法:速度比肩Adam,性能媲美SGD,ICLR領(lǐng)域主席贊不絕口》

AdaBound兼顧了模型訓(xùn)練中的速度和性能。
在模型訓(xùn)練開始時(shí),AdaBound的行為類似于Adam,速度很快,并在結(jié)束時(shí)轉(zhuǎn)換為SGD,保證模型收斂到損失更低的最優(yōu)解上。
論文介紹:
https://www.luolc.com/publications/adabound/
代碼實(shí)現(xiàn):
https://github.com/Luolc/AdaBound
AI在德州撲克中擊敗人類(390贊)
由Facebook提出的Pluribus,是第一個(gè)能夠在六人無(wú)限注德州撲克中打敗人類專家的AI機(jī)器人。這也是AI第一次在超過兩個(gè)或兩個(gè)團(tuán)隊(duì)的復(fù)雜游戲中擊敗頂級(jí)人類玩家。
相關(guān)報(bào)道:
《AI賭神超進(jìn)化:德?lián)淞司謸魸⑹澜绻谲?,詐唬如神,每小時(shí)能贏1千刀 | Science》

Pluribus之所以成功,是因?yàn)樗梢苑浅S行У靥幚韮擅陨贤婕业牟煌昝佬畔⒉┺奶魬?zhàn)。它使用自我對(duì)戰(zhàn)來教自己如何取勝,沒有任何示范或策略指導(dǎo)。
官方介紹:
https://ai.facebook.com/blog/pluribus-first-ai-to-beat-pros-in-6-player-poker/
各種ML模型的NumPy實(shí)現(xiàn)(388贊)
numpy-ml是機(jī)器學(xué)習(xí)模型、算法和工具的集合。這些模型、算法和工具專門用NumPy和Python 標(biāo)準(zhǔn)庫(kù)編寫。
GitHub地址:
https://github.com/ddbourgin/numpy-ml
17種Deep RL算法的PyTorch實(shí)現(xiàn)(388贊)
作者給出了17種深度強(qiáng)化學(xué)習(xí)算法的PyTorch實(shí)現(xiàn)。包括的某些實(shí)現(xiàn)包括DQN,DQN-HER,Double DQN,REINFORCE,DDPG,DDPG-HER,PPO,SAC,離散SAC,A3C,A2C等等。
GitHub地址:
https://github.com/p-christ/Deep-Reinforcement-Learning-Algorithms-with-PyTorch
100萬(wàn)張AI生成的假臉(373贊)
作者使用英偉達(dá)的StyleGAN生成了100萬(wàn)張假臉,這些假臉和真人對(duì)比起來幾乎無(wú)異。
下載地址:
https://archive.org/details/1mFakeFaces
賽道周圍的神經(jīng)網(wǎng)絡(luò)賽車(358贊)
作者設(shè)計(jì)了一個(gè)小游戲,教神經(jīng)網(wǎng)絡(luò)駕駛汽車。
這是一個(gè)簡(jiǎn)單的網(wǎng)絡(luò),具有固定數(shù)量的隱藏節(jié)點(diǎn)(沒有NEAT),并且沒有偏差。然而經(jīng)過短短幾代的訓(xùn)練后,它已經(jīng)能成功讓汽車快速安全地行駛。

視頻地址:
https://www.youtube.com/watch?v=wL7tSgUpy8w
將ML模型轉(zhuǎn)化成本地代碼(345贊)
一些邊緣設(shè)備硬件很簡(jiǎn)單,比如只有單片機(jī),無(wú)法安裝深度學(xué)習(xí)軟件庫(kù),怎么辦?
m2cgen提供了解決辦法,它是一個(gè)輕量級(jí)的庫(kù)。m2cgen提供了一種簡(jiǎn)便的方法將經(jīng)過訓(xùn)練的ML模型轉(zhuǎn)換為本地代碼,支持Python,C,Java,Go,JavaScript,Visual Basic,C#等語(yǔ)言。
相關(guān)報(bào)道:
《沒有依賴庫(kù)也能跑機(jī)器學(xué)習(xí)模型!推薦一個(gè)強(qiáng)大工具m2cgen》
m2cgen當(dāng)前支持的模型如下:
圖片: https://uploader.shimo.im/f/65ReHnCspdoAC8gV.png
GitHub地址:
https://github.com/BayesWitnesses/m2cgen/
探索神經(jīng)網(wǎng)絡(luò)的損失情況(339贊)
這篇帖子是關(guān)于在神經(jīng)網(wǎng)絡(luò)的損失曲面中找到不同的圖案。通常,圍繞最小值的地圖看起來像是一個(gè)坑,周圍是隨機(jī)的丘陵和山脈,但也存在更有意義的坑,如下圖所示:

作者發(fā)現(xiàn)我們幾乎可以找到自己喜歡的任何奇怪地圖的最小值。有趣的是,找到的地圖即使對(duì)于測(cè)試集也仍然有效,因此它很有可能對(duì)于整個(gè)數(shù)據(jù)分布仍然有效。
論文地址:
https://arxiv.org/abs/1910.03867
源代碼:
https://github.com/universome/loss-patterns
基于GPT-2的Reddit回帖機(jī)器人(343贊)
作者構(gòu)建了一個(gè)基于GPT-2的Reddit回帖機(jī)器人??梢酝ㄟ^回復(fù)任何帶有“ gpt-2 finish this”的評(píng)論來使用這個(gè)回帖機(jī)器人。
源代碼:
https://github.com/shevisjohnson/gpt-2_bot
將任何視頻插值成慢動(dòng)作(332贊)
這是由英偉達(dá)提出的一種算法,可以將30幀視頻變成240幀的慢動(dòng)作視頻,有人用PyTorch實(shí)現(xiàn)了這個(gè)算法。
相關(guān)報(bào)道:
《腦補(bǔ)慢動(dòng)作的AI源代碼來了:有了它,普通視頻也能平滑補(bǔ)幀》

論文地址:
https://people.cs.umass.edu/~hzjiang/projects/superslomo/
源代碼:
https://github.com/avinashpaliwal/Super-SloMo
NLP的預(yù)訓(xùn)練模型庫(kù)(306贊)
這是來自創(chuàng)業(yè)公司Hugging Face的匯總,最近這家公司剛獲得1500萬(wàn)美元融資。
該項(xiàng)目匯總了基于Transformer的各種最新的NLP模型,包括BERT、GPT-2、RoBERTa、XLM、DistilBert、XLNet等32中預(yù)訓(xùn)練模型,覆蓋了超過100種語(yǔ)言。
相關(guān)報(bào)道:
《GitHub萬(wàn)星NLP資源大升級(jí):實(shí)現(xiàn)Pytorch和TF深度互操作,集成32個(gè)最新預(yù)訓(xùn)練模型》
而且這個(gè)庫(kù)里的模型數(shù)量仍在持續(xù)增加中。
GitHub地址:
https://github.com/huggingface/transformers
這就是2019年Reddit機(jī)器學(xué)習(xí)板塊最受歡迎的項(xiàng)目,不知道你最喜歡哪一篇,覺得哪一篇對(duì)你幫助最大呢?