專家們最常用的15個(gè)機(jī)器學(xué)習(xí)工具
圖源:unsplash
機(jī)器學(xué)習(xí)是一項(xiàng)令人驚嘆的技術(shù),而發(fā)揮其潛能的關(guān)鍵在于,你得掌握正確的使用方法。精通機(jī)器學(xué)習(xí)工具有利于處理數(shù)據(jù)、訓(xùn)練模型、發(fā)現(xiàn)新方法以及創(chuàng)建自己的算法。
如今,大量的機(jī)器學(xué)習(xí)工具、平臺(tái)和軟件不斷涌現(xiàn)。而實(shí)際上你只需要選擇一種進(jìn)行深耕,亂花漸欲迷人眼,面對(duì)紛繁復(fù)雜的工具,難免會(huì)挑花了眼。本文將介紹專家們最常用的15個(gè)機(jī)器學(xué)習(xí)工具,不如來(lái)get專家同款工具吧!
Accord.net
Accord.net是一個(gè)計(jì)算機(jī)器學(xué)習(xí)框架,配有圖像和音頻包。這樣的軟件包有助于訓(xùn)練模型和創(chuàng)建交互式應(yīng)用程序,例如試聽、計(jì)算機(jī)視覺等。由于工具名中包含.net,因此該框架的基礎(chǔ)庫(kù)是C#語(yǔ)言。
圖源:accord-framework
Accord庫(kù)在測(cè)試和處理音頻文件中非常有用。
RapidMiner
對(duì)于于非程序員用戶而言,RapidMiner算是福音,它是一個(gè)數(shù)據(jù)科學(xué)平臺(tái),具有非常出色的界面。RapidMiner獨(dú)立于平臺(tái),可以在跨平臺(tái)操作系統(tǒng)上工作。
借助該工具,人們可以使用自己的數(shù)據(jù)測(cè)試自己的模型。
此外,RapidMiner的界面也非常人性化。用戶只需要拖放即可。這也是它對(duì)非程序員非常友好的主要原因。
圖源:pinterest
Scikit-Learn
Scikit-Learn是一個(gè)開放源代碼的機(jī)器學(xué)習(xí)包。它是一個(gè)多用途集成平臺(tái),可以用來(lái)進(jìn)行回歸、聚類、分類、降維和預(yù)處理。Scikit-Learn創(chuàng)建于三個(gè)主要的Python庫(kù)之上,即NumPy、Matplotlib和SciPy。除此之外,它還有助于測(cè)試以及模型訓(xùn)練。
TensorFlow
TensorFlow是一個(gè)開源框架,適用于大規(guī)模及數(shù)值機(jī)器學(xué)習(xí)。它是機(jī)器學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)模型的集合,也是Python的好朋友,它最大的特點(diǎn)是可以在CPU和GPU上運(yùn)行。
TensorFlow常用于自然語(yǔ)言處理和圖像分類。
Weka
Weka也是開源軟件,用戶可以通過(guò)圖形用戶界面訪問Weka。該軟件非常人性化,也常被應(yīng)用于研究和教學(xué)中。此外,Weka還允許用戶訪問其他機(jī)器學(xué)習(xí)工具,例如:R、Scikit-Learn等。
Knime
圖源:milearning
Knime是一個(gè)基于圖形用戶界面(Graphical UserInterface,GUI)的開源機(jī)器學(xué)習(xí)工具。即使沒有任何編程知識(shí),你仍然可以利用Knime提供的工具。Knime通常用于與數(shù)據(jù)相關(guān)的目的,比如數(shù)據(jù)操縱、數(shù)據(jù)挖掘等。
Knime通過(guò)創(chuàng)建并執(zhí)行不同的工作流程來(lái)處理數(shù)據(jù),它的存儲(chǔ)庫(kù)帶有很多不同節(jié)點(diǎn),將這些節(jié)點(diǎn)帶入Knime門戶就能創(chuàng)建并執(zhí)行節(jié)點(diǎn)的工作流程。
Pytorch
Pytorch是一個(gè)深度學(xué)習(xí)框架,既快速又靈活,這是因?yàn)镻ytorch可以很好地命令GPU。它是機(jī)器學(xué)習(xí)最重要的工具之一,因?yàn)樗挥糜跈C(jī)器學(xué)習(xí)最重要的方面,包括構(gòu)建深度神經(jīng)網(wǎng)絡(luò)和張量計(jì)算。
Pytorch完全基于Python。除此之外,它還是NumPy的最佳替代工具。
Google Cloud AutoML
Google Cloud AutoML的目標(biāo)是使所有人都能使用人工智能。Google Cloud AutoML為用戶提供了預(yù)訓(xùn)練模型,以便創(chuàng)建各種服務(wù),例如文本識(shí)別、語(yǔ)音識(shí)別等。
Google Cloud AutoML在公司中非常受歡迎。公司希望將人工智能應(yīng)用于行業(yè)的各個(gè)領(lǐng)域,但由于市場(chǎng)上成熟的AI人才,因此它的企業(yè)應(yīng)用一直面臨著困難。
Jupyter Notebook
Jupyter notebook是使用最廣泛的機(jī)器學(xué)習(xí)工具之一,是一個(gè)非常快速的處理工具,也是一個(gè)高效的平臺(tái)。它支持三種語(yǔ)言:Julia、R、Python。
Jupyter的名稱也是由這三種編程語(yǔ)言組合而成。Jupyter Notebook允許用戶以筆記本的形式存儲(chǔ)和共享動(dòng)態(tài)代碼,也可以通過(guò)GUI訪問它,例如winpythonnavigator和anacondanavigator等。
Azure Machine Learning studio
Azure機(jī)器學(xué)習(xí)工作室由Microsoft發(fā)布,就像Google的Cloud AutoML一樣,這是Microsoft的產(chǎn)品,可為用戶提供機(jī)器學(xué)習(xí)服務(wù)。
Azure機(jī)器學(xué)習(xí)工作室是建立模塊和數(shù)據(jù)集連接的一種非常簡(jiǎn)單的方法。,Azure還旨在為用戶提供AI功能。與TensorFlow一樣,它也可以在CPU和GPU上運(yùn)行。
Orange3
圖源:orange
Orange3是一款數(shù)據(jù)挖掘軟件,它是Orange軟件的最新版本。Orange3協(xié)助預(yù)處理、數(shù)據(jù)可視化以及其他與數(shù)據(jù)相關(guān)的工作。用戶可以通過(guò)AnacondaNavigator訪問Orange3。在Python編程中,這確實(shí)很有幫助。此外,它還可以充當(dāng)一個(gè)不錯(cuò)的用戶界面。
MLLIB
與Mahout一樣,MLLIB也是Apache Spark的產(chǎn)品。它用于回歸、特征提取、分類、過(guò)濾等。通常也稱之為Spark MLLIB,它具有非常好的速度和效率。
IBM Watson
IBM Watson是IBM提供的使用Watson的網(wǎng)頁(yè)界面,Watson是基于自然語(yǔ)言處理的人機(jī)交互問答系統(tǒng)。Watson應(yīng)用于各個(gè)領(lǐng)域,例如自動(dòng)學(xué)習(xí)、信息提取等。
圖源:9-medium
IBM Watson通常用于研究和測(cè)試,其目的是為用戶提供類似人的體驗(yàn)。
Apache Mahout
Mahout由基于Hadoop的開源平臺(tái)Apache啟動(dòng),通常用于機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘,它使諸如回歸、分類和聚類之類的技術(shù)成為可能。它還利用了基于數(shù)學(xué)的函數(shù),如向量等。
Pylearn2
Pylearn2是建立在Theano之上的機(jī)器學(xué)習(xí)庫(kù),它們之間有許多相似的功能。它還可以執(zhí)行數(shù)學(xué)計(jì)算。Pylearn2也能夠在CPU和GPU上運(yùn)行。需要注意的是,在進(jìn)入Pylearn2之前,用戶必須熟悉Theano。
圖源:unsplash
本文介紹的是一些最流行和廣泛使用的機(jī)器學(xué)習(xí)工具,所有這些工具都使用不同的編程語(yǔ)言運(yùn)行,其中一些工具在Python上運(yùn)行,一些在C ++上運(yùn)行,而另一些在Java上運(yùn)行。
選擇適合你的試試吧,只碼不看可不是好習(xí)慣~