2018年哪些開(kāi)源AI項(xiàng)目將一路領(lǐng)跑?
譯文【51CTO.com快譯】如今很難躲過(guò)人工智能(AI)和機(jī)器學(xué)習(xí)方面的炒作新聞。據(jù)IDC公司在2017年9月份的預(yù)測(cè),2017年全球認(rèn)知和AI解決方案支出在120億美元左右。這個(gè)數(shù)字可能會(huì)以50.1%的年復(fù)合增長(zhǎng)率(CAGR)增長(zhǎng),一直持續(xù)到2021年,到時(shí)市場(chǎng)規(guī)模會(huì)達(dá)到驚人的576億美元。
弗雷斯特研究公司在2018年預(yù)測(cè)中預(yù)測(cè),今年,“AI將重塑數(shù)據(jù)分析和企業(yè)創(chuàng)新”,“AI將幫20%的公司做出決定、提供實(shí)時(shí)指導(dǎo)。”不過(guò)該公司也提醒,“CIO們會(huì)在2018年認(rèn)識(shí)到AI等新技術(shù)需要付出艱辛的工作。”
對(duì)許多企業(yè)組織來(lái)說(shuō),這艱辛的工作大部分需要先了解機(jī)器學(xué)習(xí)和人工智能框架。據(jù)Gartner聲稱,“59%的企業(yè)組織仍在收集信息以制定AI戰(zhàn)略。”
這種信息收集大部分可能會(huì)緊緊圍繞開(kāi)源解決方案。市面上有許多領(lǐng)先的AI工具采用開(kāi)源許可證,最前沿的研發(fā)大多數(shù)出現(xiàn)在這些開(kāi)源項(xiàng)目上。
那么企業(yè)的IT經(jīng)理應(yīng)調(diào)查研究哪些開(kāi)源AI解決方案?本文著重介紹了已變得極其流行的十大開(kāi)源AI和機(jī)器學(xué)習(xí)工具。
1. TensorFlow
谷歌開(kāi)發(fā)的TensorFlow已成為如今使用最廣泛的機(jī)器學(xué)習(xí)框架之一。該項(xiàng)目的GitHub頁(yè)面上有87700多顆星,分支次數(shù)超過(guò)了42700次。2017年GitHub Octoverse報(bào)告將這個(gè)開(kāi)源AI工具列為分支最多的頭號(hào)項(xiàng)目、貢獻(xiàn)者數(shù)量方面的第五大項(xiàng)目和評(píng)論人數(shù)方面的第十大項(xiàng)目。
它尤其廣泛用于基于云的應(yīng)用,比如亞馬遜網(wǎng)絡(luò)服務(wù)、微軟Azure和谷歌云平臺(tái)都提供支持及/或與TensorFlow兼容的服務(wù)。據(jù)項(xiàng)目官網(wǎng)介紹,使用它的公司包括Airbnb、英偉達(dá)、優(yōu)步、SAP、Dropbox、eBay、谷歌、英特爾、可口可樂(lè)、Twitter及其他許多公司。
相關(guān)鏈接:https://www.tensorflow.org/
2. Scikit-Learn
Scikit-learn 基于另外三個(gè)開(kāi)源項(xiàng)目:NumPy、SciPy和matplotlibe,它是一種基于Python的機(jī)器學(xué)習(xí)工具,側(cè)重?cái)?shù)據(jù)挖掘和數(shù)據(jù)分析。它提供諸多算法:分類、遞歸、聚類、降維、模型選擇和預(yù)處理。用戶包括Spotify、Evernote、OKCupid、Change.org及其他許多公司。它開(kāi)始是谷歌的Summer of Code項(xiàng)目,后續(xù)開(kāi)發(fā)得到了幾家組織的資助,包括法國(guó)國(guó)家信息與自動(dòng)化研究所(INRIA)、巴黎-薩克雷數(shù)據(jù)科學(xué)中心、紐約大學(xué)、巴黎高等電信學(xué)院、哥倫比亞大學(xué)、Alfred P. Sloan基金會(huì)和悉尼大學(xué)。在GitHub上,它有25300多顆星和12900多個(gè)分支。
相關(guān)鏈接:http://scikit-learn.org/stable/
3. Caffe
Caffe是賈揚(yáng)清的杰作,他在加州大學(xué)伯克利分校攻讀博士學(xué)位期間開(kāi)發(fā)了這個(gè)項(xiàng)目。伯克利人工智能研究中心(BAIR)現(xiàn)在處理日常開(kāi)發(fā)工作。項(xiàng)目官網(wǎng)聲稱這是一種“開(kāi)發(fā)當(dāng)初著眼于表達(dá)式、速度和模塊化的深度學(xué)習(xí)框架。”主要功能包括:表達(dá)式架構(gòu)、可擴(kuò)展代碼、高速性能以及學(xué)術(shù)用戶和行業(yè)用戶組成的龐大社區(qū)。在GitHub上,該項(xiàng)目有22600多顆星和13800多個(gè)分支。
相關(guān)鏈接:http://caffe.berkeleyvision.org/
4. 微軟認(rèn)知工具包
微軟認(rèn)知工具包(之前名為CNTK)自稱是“一種免費(fèi)、易于使用、開(kāi)源、商業(yè)級(jí)的工具包,可以訓(xùn)練深度學(xué)習(xí)算法,像人腦那樣來(lái)學(xué)習(xí)”。這款A(yù)I解決方案是在微軟內(nèi)部開(kāi)發(fā)出來(lái)的,微軟在2016年發(fā)布了開(kāi)源版。
這款工具的主要功能包括:支持Python、C++和BrainScript;強(qiáng)化學(xué)習(xí)、生成式對(duì)抗網(wǎng)絡(luò)以及監(jiān)督學(xué)習(xí)和無(wú)監(jiān)督學(xué)習(xí);高效使用資源;與NumPy協(xié)同運(yùn)行;并與微軟Azure集成。它在GitHub上有13700多顆星和3600多個(gè)分支。
相關(guān)鏈接:https://www.microsoft.com/en-us/cognitive-toolkit/
5. PredictionIO
Apache項(xiàng)目 PredictionIO是一種開(kāi)源機(jī)器學(xué)習(xí)服務(wù)器系統(tǒng),它充分利用了其他許多Apache大數(shù)據(jù)工具,比如Hadoop、HBase和Spark。企業(yè)組織常常用它來(lái)實(shí)施lambda架構(gòu),官網(wǎng)將它作為包括Apache Spark、MLlib、HBase、Spray和Elasticsearch的整個(gè)機(jī)器學(xué)習(xí)堆棧的一部分來(lái)提供。該項(xiàng)目的目的是幫助數(shù)據(jù)科學(xué)家和開(kāi)發(fā)人員迅速創(chuàng)建可以作為一項(xiàng)Web服務(wù)來(lái)部署的預(yù)測(cè)引擎。GitHub頁(yè)面顯示有10900多顆星和1777多個(gè)分支。
相關(guān)鏈接:http://predictionio.incubator.apache.org/index.html
6. Deeplearn.js
顧名思義,deeplearn.js是一種面向深度學(xué)習(xí)的JavaScript庫(kù)。它讓用戶可以在瀏覽器中訓(xùn)練神經(jīng)網(wǎng)絡(luò)。與本文介紹的另外幾個(gè)開(kāi)源AI項(xiàng)目一樣,它同樣源于谷歌Brain團(tuán)隊(duì),谷歌繼續(xù)在支持該項(xiàng)目。Deeplearn.js包括兩套獨(dú)立的API:類似NumPy的直接執(zhí)行模型和更像TensorFlow的延遲執(zhí)行模型。在GitHub上,它有6000多顆星和550多個(gè)分支。
相關(guān)鏈接:https://deeplearnjs.org/
7. Pattern
Pattern由安特衛(wèi)普大學(xué)的計(jì)算語(yǔ)言學(xué)和語(yǔ)言心理學(xué)(CLiPS)研究中心開(kāi)發(fā)。它提供諸多人工智能功能,包括數(shù)據(jù)挖掘、自然語(yǔ)言處理、機(jī)器學(xué)習(xí)、網(wǎng)絡(luò)分析和可視化。它基于Python,隨帶50多個(gè)示例和350多個(gè)單元測(cè)試。GitHub用戶對(duì)它標(biāo)星了6000多次,分支了1100多次。
相關(guān)鏈接:https://www.clips.uantwerpen.be/pages/pattern
8. Turi Create
Turi Create旨在讓不是專家的人不必編寫大量代碼,也能構(gòu)建自己的機(jī)器學(xué)習(xí)模型。它適用于創(chuàng)建推薦引擎、圖像分析工具和文本分類引擎,它包括眾多方面的算法:分類、遞歸、圖形分析、聚類、近鄰、主題模型及更多。蘋果最近(2017年12月)才在GitHub上發(fā)布了該工具,但已經(jīng)備受關(guān)注,積聚了5700多顆星和490多個(gè)分支。
相關(guān)鏈接:https://github.com/apple/turicreate
9. Aerosolve
Aerosolve由Airbnb開(kāi)發(fā),這款人工智能工具尤其擅長(zhǎng)處理地理數(shù)據(jù)。賴以成名的地方是,它是為“對(duì)人類友好”而設(shè)計(jì)的。主要功能包括:基于Thrift(Thrift 是Apache開(kāi)發(fā)的多語(yǔ)言協(xié)作平臺(tái))的特征表示、特征轉(zhuǎn)換語(yǔ)言、可調(diào)試模型、支持Java和Scala,還包括圖像內(nèi)容分析代碼。在GitHub頁(yè)面上,它有4200多顆星和550多個(gè)分支。
相關(guān)鏈接:http://airbnb.io/aerosolve/
10. DSSTNE
DSSTNE的全稱是“深度可擴(kuò)展稀疏張量網(wǎng)絡(luò)引擎”,它由亞馬遜開(kāi)發(fā)。這家網(wǎng)上購(gòu)物巨頭用DSSTNE來(lái)構(gòu)建自己的推薦引擎,該AI工具引起了其他零售商和網(wǎng)上企業(yè)的濃厚興趣。其開(kāi)發(fā)人員表示,它特別適合機(jī)器學(xué)習(xí)訓(xùn)練數(shù)據(jù)***的使用場(chǎng)合。在GitHub上,它有4000多顆星和660多個(gè)分支。
相關(guān)鏈接:https://github.com/amzn/amazon-dsstne
原文標(biāo)題:Top 10 Open Source AI Projects in 2018,作者:Cynthia Harvey
【51CTO譯稿,合作站點(diǎn)轉(zhuǎn)載請(qǐng)注明原文譯者和出處為51CTO.com】