流行的十四個機(jī)器學(xué)習(xí)編程語言框架和工具
譯文【51CTO.com快譯】如果你想知道哪些不斷壯大的編程語言庫和工具是實(shí)現(xiàn)機(jī)器學(xué)習(xí)模型的不錯選擇,那么隨時可以獲得幫助。
O'Reilly的一項(xiàng)新調(diào)查發(fā)現(xiàn),主要從事技術(shù)、金融和醫(yī)療保健行業(yè)的1300多人透露了他們在公司使用的機(jī)器學(xué)習(xí)技術(shù)。
本文介紹了面向數(shù)據(jù)科學(xué)界寵兒Python的軟件框架和庫、大數(shù)據(jù)平臺以及處理機(jī)器學(xué)習(xí)管道每個階段的基于云的服務(wù)。
說到使用機(jī)器學(xué)習(xí)或報告所稱的AI,大多數(shù)公司仍處于評估階段,實(shí)施的最常用工具是用于“模型可視化”和“自動模型搜索和超參數(shù)調(diào)整”的工具。
不出所料,一種最常見的機(jī)器學(xué)習(xí)是監(jiān)督學(xué)習(xí),即使用大量的標(biāo)記數(shù)據(jù)來訓(xùn)練機(jī)器學(xué)習(xí)模型。比如說,負(fù)責(zé)找出視頻中人員的計算機(jī)視覺模型可以拿注釋的圖像加以訓(xùn)練,以表明圖像中有沒有人。
圖片來源:O'Reilly
以下是公司企業(yè)聲稱用于機(jī)器學(xué)習(xí)的庫、框架、大數(shù)據(jù)平臺和云服務(wù)。
軟件庫和框架
1.TensorFlow
谷歌廣泛使用的機(jī)器學(xué)習(xí)框架,旨在處理訓(xùn)練機(jī)器學(xué)習(xí)模型時所需要的數(shù)值計算,能夠在CPU、GPU和專用芯片(比如谷歌的張量處理單元即TPU)之間劃分計算任務(wù)。
2.scikit-learn
用于數(shù)據(jù)挖掘和數(shù)據(jù)分析的一種流行Python庫,使用了眾多機(jī)器學(xué)習(xí)算法。
3.Pytorch
一種開源深度學(xué)習(xí)框架,學(xué)起來比TensorFlow等與之競爭的框架更容易,旨在用于機(jī)器學(xué)習(xí)管道的每個階段。
4.Keras
這種深度學(xué)習(xí)框架用于處理神經(jīng)網(wǎng)絡(luò)(支持深度學(xué)習(xí)的受大腦啟發(fā)的數(shù)學(xué)模型),旨在比與之競爭的框架更易于使用。
Keras用Python編寫,它能夠在TensorFlow、微軟認(rèn)知工具包(CNTK)和Python庫Theano上運(yùn)行。
云套件
5.微軟Azure ML Studio
這套服務(wù)旨在幫助公司在微軟的Azure云上以及靠近網(wǎng)絡(luò)邊緣的計算設(shè)備上構(gòu)建、訓(xùn)練和部署機(jī)器學(xué)習(xí)模型。工具有助于使識別和調(diào)整適當(dāng)?shù)臋C(jī)器學(xué)習(xí)模型這個過程實(shí)現(xiàn)自動化,并有助于擴(kuò)展底層計算以滿足需求。
6.谷歌云機(jī)器學(xué)習(xí)引擎
與Azure ML Studio相似,谷歌云機(jī)器學(xué)習(xí)引擎也提供了用于訓(xùn)練、評估、調(diào)整和部署機(jī)器學(xué)習(xí)模型的工具。
7.亞馬遜SageMaker
亞馬遜SageMaker同樣提供了用于構(gòu)建、訓(xùn)練和部署機(jī)器學(xué)習(xí)模型的服務(wù),以便能夠以更低的成本更快地將模型部署到生產(chǎn)環(huán)境。
大數(shù)據(jù)平臺工具
8.H20
這是一種開源內(nèi)存中平臺,可以跨分布式系統(tǒng)擴(kuò)展機(jī)器學(xué)習(xí)工作負(fù)載。
該平臺旨在支持使用最廣泛的統(tǒng)計和機(jī)器學(xué)習(xí)算法,并提供一定程度的自動化,以幫助數(shù)據(jù)科學(xué)家識別和調(diào)整適當(dāng)?shù)臋C(jī)器學(xué)習(xí)模型。
9.Prodigy
Prodigy旨在簡化訓(xùn)練和評估機(jī)器學(xué)習(xí)模型的過程,這種工具可幫助數(shù)據(jù)科學(xué)家適當(dāng)?shù)貥?biāo)注訓(xùn)練數(shù)據(jù)集。
10.Spark NLP
Spark NLP提供了一個自然語言處理(NLP)庫,旨在處理運(yùn)行內(nèi)存中大數(shù)據(jù)平臺Apache Spark的分布式系統(tǒng)。
11.OpenAI Gym
這種工具包用于開發(fā)和比較強(qiáng)化學(xué)習(xí)算法,強(qiáng)化學(xué)習(xí)是一種機(jī)器學(xué)習(xí),其中軟件代理通過因?qū)е缕谕Y(jié)果的動作而受到獎勵來學(xué)習(xí)如何執(zhí)行任務(wù)。
12.Analytics Zoo
Analytics Zoo將一系列大數(shù)據(jù)和機(jī)器學(xué)習(xí)技術(shù)整合到它所說的統(tǒng)一分析和AI平臺中。
該平臺整合了Spark、TensorFlow、Keras和深度學(xué)習(xí)庫BigDL,可以跨分布式Hadoop和Spark集群擴(kuò)展機(jī)器學(xué)習(xí)模型,用于訓(xùn)練和推理。
13.AllenNLP
旨在簡化設(shè)計和評估解決自然語言處理問題的新深度學(xué)習(xí)模型這個過程。
該庫包括面向核心NLP問題和NLP應(yīng)用的高質(zhì)量模型的參考實(shí)現(xiàn)。
14.Rise Lab Ray
這種框架用于跨分布式系統(tǒng)運(yùn)行機(jī)器學(xué)習(xí)模型,提供高性能和容錯性,同時仍具有可擴(kuò)展性。
原文標(biāo)題:Most popular programming language frameworks and tools for machine learning,作者:Nick Heath
【51CTO譯稿,合作站點(diǎn)轉(zhuǎn)載請注明原文譯者和出處為51CTO.com】