20名Python人工智能和機(jī)器學(xué)習(xí)開源項(xiàng)目
本文用Python更新了頂級的AI和機(jī)器學(xué)習(xí)項(xiàng)目。Tensorflow已經(jīng)成為了貢獻(xiàn)者的三位數(shù)增長的第一位。 Scikit-learn下降到第二位,但仍有非常大的貢獻(xiàn)者群體。
進(jìn)入機(jī)器學(xué)習(xí)和人工智能并非易事??紤]到今天可用的大量資源,許多有抱負(fù)的專業(yè)人員和愛好者發(fā)現(xiàn)難以在該領(lǐng)域建立正確的路徑。這個(gè)領(lǐng)域正在不斷發(fā)展,我們必須跟上飛速發(fā)展的步伐。
經(jīng)過信息的更新、檢查,本文用Python更新了頂級的AI和機(jī)器學(xué)習(xí)項(xiàng)目。Tensorflow已經(jīng)成為了貢獻(xiàn)者的三位數(shù)增長的第一位。 Scikit-learn下降到第二位,但仍有非常大的貢獻(xiàn)者群體。
與2016年相比,貢獻(xiàn)者人數(shù)增長最快的項(xiàng)目是:
1.TensorFlow增長169%,從493個(gè)增加到1324個(gè)貢獻(xiàn)者
2.Deap,增長86%,從21到39個(gè)貢獻(xiàn)者
3.Chainer,增長83%,從84到154個(gè)貢獻(xiàn)者
4.Gensim,增長81%,從145到262個(gè)貢獻(xiàn)者
5.Neon,增長66%,從47到78個(gè)貢獻(xiàn)者
6.Nilearn提高了50%,從46個(gè)到69個(gè)貢獻(xiàn)者
2018年的更新:
1.Keras,629名貢獻(xiàn)者
2.PyTorch,399名貢獻(xiàn)者
Github上的前20名Python人工智能和機(jī)器學(xué)習(xí)項(xiàng)目
大小與貢獻(xiàn)者的數(shù)量成正比,顏色代表貢獻(xiàn)者數(shù)量的變化,紅色更高,藍(lán)色更低。雪花形狀適用于深度學(xué)習(xí)項(xiàng)目,否則適用于其他項(xiàng)目。
我們看到像TensorFlow、Theano和Caffe這樣的深度學(xué)習(xí)項(xiàng)目是最受歡迎的項(xiàng)目之一。
下面的列表是根據(jù)Github上貢獻(xiàn)者的數(shù)量以降序給出的項(xiàng)目。貢獻(xiàn)者人數(shù)的變化是相對于2016年發(fā)布的前20名Python機(jī)器學(xué)習(xí)的開源項(xiàng)目。
1.TensorFlow最初是由谷歌機(jī)器智能研究機(jī)構(gòu)的Google Brain Team的研究人員和工程師開發(fā)的。該系統(tǒng)的設(shè)計(jì)是為了便于機(jī)器學(xué)習(xí)的研究,并使其快速、容易地從研究原型過渡到生產(chǎn)系統(tǒng)。
貢獻(xiàn)者:1324(168%),Github 網(wǎng)址:https://github.com/tensorflow/tensorflow
2.Scikit-learn是用于數(shù)據(jù)挖掘和數(shù)據(jù)分析的簡單而高效的工具,可供所有人訪問,并且可在各種環(huán)境中重用,基于NumPy、SciPy和matplotlib、開源、商業(yè)可用,BSD許可證。
貢獻(xiàn)者:1019(39%上),Github網(wǎng)址: https://github.com/scikit-learn/scikit-learn
3.Keras是一種高級神經(jīng)網(wǎng)絡(luò)API,用Python編寫,能夠在TensorFlow、CNTK或Theano上運(yùn)行。
貢獻(xiàn)者:629(新),Github網(wǎng)址: https://github.com/keras-team/keras
4.Python中的PyTorch,張量和動態(tài)神經(jīng)網(wǎng)絡(luò)以及強(qiáng)勁的GPU加速。
貢獻(xiàn)者:399(新),Github網(wǎng)址:https://github.com/pytorch/pytorch
5.Theano允許你高效地定義、優(yōu)化和評估涉及多維數(shù)組的數(shù)學(xué)表達(dá)式。
貢獻(xiàn)者:327(24%上),Github網(wǎng)址: https://github.com/Theano/Theano
6.Gensim是一個(gè)免費(fèi)的Python庫,它具有可擴(kuò)展的統(tǒng)計(jì)語義,分析用于語義結(jié)構(gòu)的純文本文檔,檢索語義相似的文檔。
貢獻(xiàn)者:262(81%上升),Github網(wǎng)址: https://github.com/RaRe-Technologies/gensim
7.Caffe是一個(gè)深思熟慮的表達(dá),速度和模塊化的深度學(xué)習(xí)框架。它由伯克利視覺和學(xué)習(xí)中心(BVLC)和社區(qū)貢獻(xiàn)者開發(fā)。
貢獻(xiàn)者:260(提高21%),Github網(wǎng)址: https://github.com/RaRe-Technologies/gensim
8.Chainer是一個(gè)基于Python的深度學(xué)習(xí)模型的獨(dú)立開源框架。 Chainer提供靈活、直觀和高性能的手段來實(shí)施全面的深度學(xué)習(xí)模型,其中包括最新的模型,如遞歸神經(jīng)網(wǎng)絡(luò)和變分自動編碼器。
貢獻(xiàn)者:154(上升84%),Github網(wǎng)址: https://github.com/chainer/chainer
9.Statsmodels是一個(gè)Python模塊,允許用戶探索數(shù)據(jù),估計(jì)統(tǒng)計(jì)模型并執(zhí)行統(tǒng)計(jì)測試。描述統(tǒng)計(jì)、統(tǒng)計(jì)測、繪圖功能和結(jié)果統(tǒng)計(jì)的廣泛列表適用于不同類型的數(shù)據(jù)和每個(gè)估算器。
貢獻(xiàn)者:144(上升33%),Github網(wǎng)址: https://github.com/statsmodels/statsmodels/
10.Shogun是機(jī)器學(xué)習(xí)工具箱,它提供了廣泛的統(tǒng)一和高效的機(jī)器學(xué)習(xí)(ML)方法。該工具箱無縫地允許組合多個(gè)數(shù)據(jù)表示、算法類和通用工具。
貢獻(xiàn)者:139(上升32%),Github網(wǎng)址: https://github.com/shogun-toolbox/shogun
11.Pylearn2是一個(gè)機(jī)器學(xué)習(xí)庫。其大部分功能都建立在Theano之上。這意味著你可以使用數(shù)學(xué)表達(dá)式編寫Pylearn2插件(新模型,算法等),Theano將為你優(yōu)化和穩(wěn)定這些表達(dá)式,并將它們編譯為你選擇的后端(CPU或GPU)。
貢獻(xiàn)者:119(3.5%上),Github網(wǎng)址: https://github.com/lisa-lab/pylearn2
12.NuPIC是一個(gè)開源項(xiàng)目,它基于稱為分層時(shí)間存儲器(HTM)的新大腦皮層理論。部分HTM理論已經(jīng)在應(yīng)用中實(shí)施、測試和使用,HTM理論的其他部分仍在開發(fā)中。
貢獻(xiàn)者:85(提高12%),Github網(wǎng)址: https://github.com/numenta/nupic
13.Neon是Nervana基于Python的深度學(xué)習(xí)庫。它提供易用性,同時(shí)提供最高的性能。
貢獻(xiàn)者:78(66%上),Github網(wǎng)址: https://github.com/NervanaSystems/neon
14.Nilearn是一個(gè)Python模塊,用于在NeuroImaging數(shù)據(jù)上進(jìn)行快速簡單的統(tǒng)計(jì)學(xué)習(xí)。它利用scikit-learn Python工具箱進(jìn)行多變量統(tǒng)計(jì),并提供預(yù)測建模、分類、解碼或連接分析等應(yīng)用。
貢獻(xiàn)者:69(上升50%),Github網(wǎng)址: https://github.com/nilearn/nilearn/branches
15.Orange3是開源機(jī)器學(xué)習(xí)和數(shù)據(jù)可視化新手,同時(shí)也是專家。使用大型工具箱交互式數(shù)據(jù)分析工作流程。
貢獻(xiàn)者:53(上升33%),Github網(wǎng)址: https://github.com/biolab/orange3
16.Pymc是一個(gè)python模塊,實(shí)現(xiàn)貝葉斯統(tǒng)計(jì)模型和擬合算法,包括馬爾可夫鏈蒙特卡羅。其靈活性和可擴(kuò)展性使其適用于大量問題。
貢獻(xiàn)者:39(上升5.4%),Github網(wǎng)址: https://github.com/pymc-devs/pymc
17.Deap是用于快速原型設(shè)計(jì)和測試思想的新型演化計(jì)算框架。它試圖使算法明確、數(shù)據(jù)結(jié)構(gòu)透明。它與多處理和SCOOP等并行機(jī)制完美協(xié)調(diào)。
貢獻(xiàn)者:39(86%上),Github網(wǎng)址: https://github.com/deap/deap
18.Annoy(近似最近鄰居Oh Yeah)是一個(gè)C ++庫,它使用Python綁定來搜索接近給定查詢點(diǎn)的空間點(diǎn)。它還創(chuàng)建映射到內(nèi)存的大型只讀基于文件的數(shù)據(jù)結(jié)構(gòu),以便許多進(jìn)程可以共享相同的數(shù)據(jù)。
貢獻(xiàn)者:35(46%上),Github網(wǎng)址: https://github.com/spotify/annoy
19.PyBrain是Python的模塊化機(jī)器學(xué)習(xí)庫。其目標(biāo)是為機(jī)器學(xué)習(xí)任務(wù)提供靈活、易于使用但仍然強(qiáng)大的算法,以及各種預(yù)定義環(huán)境來測試和比較的算法。
貢獻(xiàn)者:32(3%上),Github網(wǎng)址: https://github.com/pybrain/pybrain
20.Fuel是一個(gè)數(shù)據(jù)管道框架,它為你的機(jī)器學(xué)習(xí)模型提供他們需要的數(shù)據(jù)。計(jì)劃由Blocks和Pylearn2神經(jīng)網(wǎng)絡(luò)庫使用。
貢獻(xiàn)者:32(10%上),Github網(wǎng)址:https://github.com/mila-udem/fuel
(貢獻(xiàn)者在2018年2月錄得。)