面向Python語(yǔ)言的三大頂級(jí)機(jī)器學(xué)習(xí)庫(kù)
譯文【51CTO.com快譯】事實(shí)證明,無(wú)需掌握艱深的數(shù)據(jù)科學(xué),我們同樣能夠在機(jī)器學(xué)習(xí)的世界中徜徉。當(dāng)然,這段旅程不可避免地需要借助各類大數(shù)據(jù)、人工智能、深度學(xué)習(xí)與規(guī)模化統(tǒng)計(jì)與分析工具的幫助。
在今天的文章中,我們將共同了解三款***人氣的Python機(jī)器學(xué)習(xí)庫(kù),相信能夠幫助大家?guī)?lái)更為順利的數(shù)據(jù)科學(xué)探索體驗(yàn)。
1.Theano
約十年前誕生的機(jī)器學(xué)習(xí)方案Theano,是目前機(jī)器學(xué)習(xí)領(lǐng)域使用范圍最廣的CPU與GPU數(shù)學(xué)編譯器之一。
在《Theano:用于快速實(shí)現(xiàn)數(shù)學(xué)表達(dá)計(jì)算的Python框架》這篇論文當(dāng)中,作者對(duì)這套庫(kù)進(jìn)行了全面的概述。“Theano包含多款軟件包,用以強(qiáng)化自身功能。能提供高水平用戶界面,足以處理多種特定目標(biāo),”論文解釋稱:“其中的Lasagne與Keras能夠有效簡(jiǎn)化深度學(xué)習(xí)模型以及作為數(shù)學(xué)表達(dá)式的訓(xùn)練算法的架構(gòu)表達(dá)。事實(shí)上,概率編程框架PyMC3就在利用Theano以自動(dòng)生成表達(dá)式并快速執(zhí)行所生成的C代碼。(Keras與Lasagne同時(shí)運(yùn)行在TensorFLow與Theano之上。)。”
Theano目前在GitHub上擁有超過(guò)2萬(wàn)5千項(xiàng)提交成果以及近300名貢獻(xiàn)者,fork次數(shù)將接近2千次。
2.TensorFlow
TensorFlow是一套利用數(shù)據(jù)流圖形進(jìn)行數(shù)值計(jì)算的開源庫(kù)。盡管只是開源領(lǐng)域的一名新兵,但這一由谷歌公司牽頭的項(xiàng)目已經(jīng)擁有近1萬(wàn)5千條提交成果以及超過(guò)600名GitHub貢獻(xiàn)者,模型庫(kù)的星評(píng)更是逼近1萬(wàn)2千顆。
在***份《開源年鑒》當(dāng)中,TensorFlow被選為2016年最值得fork項(xiàng)目。而在***的《開源年鑒》內(nèi),TensorFlow同樣多次亮相?;赥ensorFlow的Magenta項(xiàng)目甚至在嘗試將機(jī)器智能同藝術(shù)領(lǐng)域加以聯(lián)系,探索如何利用它來(lái)實(shí)現(xiàn)音樂(lè)與藝術(shù)創(chuàng)作,并由此建立起以藝術(shù)家、程序員以及機(jī)器學(xué)習(xí)研究者的混合型社區(qū)。另外,Tensorflow支持多種前端語(yǔ)言,但對(duì)Python的支持是***的,Python還被列入2017年熱門編程趨勢(shì)排行。
TensorFlow 1.0于今年2月中旬推出。谷歌在其開發(fā)者博客中寫道:“盡管剛剛誕生一年,但TensorFlow已經(jīng)切實(shí)幫助研究人員、工程師、藝術(shù)家、學(xué)生以及其他各類用戶完成各類工作,它范疇涵蓋語(yǔ)言翻譯、皮膚癌早期診斷乃至糖尿病患者并發(fā)性失明預(yù)防等領(lǐng)域等”。
3.scikit-learn
這套方案立足于NumPy、SciPy以及Matplotlib,并被Spotfiy公司的工程師們用于進(jìn)行音樂(lè)推薦。而在OkCupid公司,是負(fù)責(zé)對(duì)匹配系統(tǒng)進(jìn)行評(píng)估與改進(jìn)。在Birchbox公司,工作人員正在摸索如何利用scikit-learn支持新產(chǎn)品的開發(fā)。
Scikit-learn目前在GitHub上擁有近2萬(wàn)2千條提交成果與800名貢獻(xiàn)者。
【51CTO譯稿,合作站點(diǎn)轉(zhuǎn)載請(qǐng)注明原文譯者和出處為51CTO.com】