我們對比了GitHub上8800個開源機(jī)器學(xué)習(xí)項(xiàng)目,并選出了其中的Top30
2017年是機(jī)器學(xué)習(xí)應(yīng)用全面開花的一年,驚為天人的想法和項(xiàng)目層出不窮。我們對比了過去一年中近8800個開源機(jī)器學(xué)習(xí)項(xiàng)目,并挑選了其中較好的30個(Top 0.3%)列舉于此。
這是一份***競爭性的列表,它精挑細(xì)選了發(fā)表于2017年1月-12月份的機(jī)器學(xué)習(xí)庫、數(shù)據(jù)集和應(yīng)用類的優(yōu)質(zhì)項(xiàng)目。我們通過流行度、參與度和時(shí)近性來對其質(zhì)量進(jìn)行評級。有一項(xiàng)數(shù)據(jù)可以讓你對表單質(zhì)量有一個直觀印象:這些項(xiàng)目的GitHub平均stars數(shù)是3558。
開源項(xiàng)目對于數(shù)據(jù)科學(xué)家而言是很有意義的。你可以通過閱讀源代碼,在前人的基礎(chǔ)上構(gòu)建更加強(qiáng)大的項(xiàng)目。你可以盡情嘗試一下這些可能在去年與你失之交臂的機(jī)器學(xué)習(xí)項(xiàng)目。
No.1 - FastText:快速文本表示/分類庫
GitHub stars數(shù): 11786個
來源:Facebook研究
鏈接:https://github.com/facebookresearch/fastText
以及[Muse:基于FastText的多語言無監(jiān)督/監(jiān)督詞嵌入(GitHub stars數(shù):695個)https://github.com/facebookresearch/MUSE]
No.2- Deep-photo-styletransfer:康奈爾大學(xué) Fujun Luan 論文《Deep Photo Style Transfer》的代碼與數(shù)據(jù)
GitHub stars數(shù):9747個
鏈接:https://github.com/luanfujun/deep-photo-styletransfer
No.3 - face recognition:世界上最簡單的適用于Pyhthon的面部識別api以及命令行
GitHub stars數(shù):8672個
來源:Adam Geitgey
鏈接:https://github.com/ageitgey/face_recognition
No.4 - Magenta:機(jī)器智能音樂與藝術(shù)生成器
GitHub stars數(shù):8113
鏈接:https://github.com/tensorflow/magenta
No.5 - Sonnet:基于 TensorFlow 的神經(jīng)網(wǎng)絡(luò)庫
GitHub stars數(shù):5731個
來源:DeepMind 成員 Malcolm Reynolds
鏈接:https://github.com/deepmind/sonnet
No.6 - deeplearn.js:網(wǎng)頁端硬件加速機(jī)器學(xué)習(xí)庫
GitHub stars數(shù):5462個
來源:Google Brain 團(tuán)隊(duì) Nikhil Thorat
鏈接:https://github.com/PAIR-code/deeplearnjs
No.7 - Fast Style Transfer:TensorFlow 快速風(fēng)格轉(zhuǎn)換
GitHub stars數(shù):4843個
來源:MIT的Logan Engstrom
鏈接:https://github.com/lengstrom/fast-style-transfer
No.8 - Pysc2:星際爭霸II 學(xué)習(xí)環(huán)境
GitHub stars數(shù):3683個
來源:DeepMind Timo Ewalds 等人
鏈接:https://github.com/deepmind/pysc2
No.9 - AirSim:微軟AI和研究院出品的基于虛幻引擎的開源自動駕駛模擬器
GitHub stars數(shù):3681個
來源:微軟的Shital Shah
鏈接:https://github.com/Microsoft/AirSim
No.10 - Facets:機(jī)器學(xué)習(xí)數(shù)據(jù)集可視化工具
GitHub stars數(shù):3371個
來源:Google Brain
鏈接:https://github.com/PAIR-code/facets
No.11 - Style2Paints:AI漫畫線稿上色工具
GitHub stars數(shù): 3310個
鏈接:https://github.com/lllyasviel/style2paints
No.12 - Tensor2Tensor:用于廣義序列-序列模型的工具庫
GitHub stars數(shù)目: 3087個
來源:Google Brain 的Ryan Sepassi
鏈接:https://github.com/tensorflow/tensor2tensor
No.13- 基于 PyTorch 的圖像對圖像轉(zhuǎn)換工具 (如horse2zebra, edges2cats,等)
GitHub stars數(shù):2847個
來源:UC Berkeley 朱俊彥博士
鏈接:https://github.com/junyanz/pytorch-CycleGAN-and-pix2pix
No.14 - Faiss:用密集向量高效相似性檢索與聚類的工具庫
GitHub stars數(shù):2629個
來源:Facebook
鏈接:https://github.com/facebookresearch/faiss
No.15 Fashion-mnist:一個類似于 MNIST 的時(shí)尚產(chǎn)品數(shù)據(jù)集
GitHub stars數(shù):2780個
來源:Zalando Tech 的 Han Xiao
鏈接:https://github.com/zalandoresearch/fashion-mnist
No.16 - ParlAI:適用于在各類公開的對話數(shù)據(jù)集上訓(xùn)練與評估AI模型的一個框架
GitHub stars數(shù): 2578個
來源:Facebook Research的 Alexander Miller
鏈接:https://github.com/facebookresearch/ParlAI
No.17 Fairseq:序列到序列工具包
GitHub stars數(shù): 2571個
來源:FAIR
鏈接:https://github.com/facebookresearch/fairseq
No.18 Pyro:使用 Python 和 PyTorch 進(jìn)行深度通用概率編程
GitHub stars數(shù): 2387個
來源:Uber AI Labs
鏈接:https://github.com/uber/pyro
No.19 iGAN:基于 GAN 的交互圖像生成器
GitHub stars數(shù): 2369個
鏈接:https://github.com/junyanz/iGAN
No.20 Deep-image-prior:使用神經(jīng)網(wǎng)絡(luò)進(jìn)行圖像恢復(fù),然而無需學(xué)習(xí)過程
GitHub stars數(shù): 2188個
來源:Skoltech 的 Dmitry Ulyanov博士
鏈接:https://github.com/DmitryUlyanov/deep-image-prior
No.21 Face_classification:基于 Keras CNN 模型與 OpenCV 的實(shí)時(shí)面部檢測和表情/性別分類,訓(xùn)練與 fer2013/imdb 數(shù)據(jù)集
GitHub stars數(shù): 1967個
鏈接:https://github.com/oarriaga/face_classification
No.22 Speech to Text WaveNet:使用 DeepMind 的 WaveNet 和 TensorFlow 構(gòu)成的端到端句級英語語音識別
GitHub stars數(shù): 1961個
來源: Kakao Brain 的 Namju Kim
鏈接:https://github.com/buriburisuri/speech-to-text-wavenet
No.23 StarGAN:用于多領(lǐng)域圖像-圖像轉(zhuǎn)換的統(tǒng)一生成對抗網(wǎng)絡(luò)
GitHub stars數(shù): 1954個
來源:韓國大學(xué)的Yunjey Choi
鏈接:https://github.com/yunjey/StarGAN
No.24 MI-agents:Unity 機(jī)器學(xué)習(xí)智能體
GitHub stars數(shù): 1658個
來源:深度學(xué)習(xí) Unity3D 的Arthur Juliani
鏈接:https://github.com/Unity-Technologies/ml-agents
No.25 Deep Video Analytics:分布式可視化搜索和可視化數(shù)據(jù)分析平臺
GitHub stars數(shù): 1494個
來源:康奈爾大學(xué)的Akshay Bhat
No.26 OpenNMT:Torch 上的開源神經(jīng)機(jī)器翻譯
GitHub stars數(shù):1490個
鏈接:https://github.com/OpenNMT/OpenNMT
No.27 Pix2PixHD:使用條件 GAN 合成和處理 2048×1024 分辨率的圖像
GitHub stars數(shù):1283個
來源:英偉達(dá) AI 科學(xué)家 Ming-Yu Liu
鏈接:https://github.com/NVIDIA/pix2pixHD
No.28 Horovod:分布式 TensorFlow 訓(xùn)練框架
GitHub stars數(shù):1188 個
來源:Uber 工程團(tuán)隊(duì)
鏈接:https://github.com/uber/horovod
No.29 AI-Blocks:強(qiáng)大而直觀的 WYSIWYG 界面,可讓任何人創(chuàng)建機(jī)器學(xué)習(xí)模型
GitHub stars數(shù):899 個
鏈接:https://github.com/MrNothing/AI-Blocks
No.30 Voice Conversion with Non-Parallel Data:基于 TensorFlow 的深度神經(jīng)網(wǎng)絡(luò)語音轉(zhuǎn)換(語音風(fēng)格轉(zhuǎn)換)
GitHub stars數(shù):845個
來源:Kakao Brain人工智能研究團(tuán)隊(duì)的Dabi Ahn
鏈接:https://github.com/andabi/deep-voice-conversion
來源:
https://medium.mybridge.co/30-amazing-machine-learning-projects-for-the-past-year-v-2018-b853b8621ac7
【本文是51CTO專欄機(jī)構(gòu)大數(shù)據(jù)文摘的原創(chuàng)譯文,微信公眾號“大數(shù)據(jù)文摘( id: BigDataDigest)”】