專家們常用的15個機器學(xué)習(xí)工具
本文轉(zhuǎn)載自公眾號“讀芯術(shù)”(ID:AI_Discovery)
機器學(xué)習(xí)是一項令人驚嘆的技術(shù),而發(fā)揮其潛能的關(guān)鍵在于,你得掌握正確的使用方法。精通機器學(xué)習(xí)工具有利于處理數(shù)據(jù)、訓(xùn)練模型、發(fā)現(xiàn)新方法以及創(chuàng)建自己的算法。
如今,大量的機器學(xué)習(xí)工具、平臺和軟件不斷涌現(xiàn)。而實際上你只需要選擇一種進行深耕,亂花漸欲迷人眼,面對紛繁復(fù)雜的工具,難免會挑花了眼。本文將介紹專家們最常用的15個機器學(xué)習(xí)工具,不如來get專家同款工具吧!
Accord.net
Accord.net是一個計算機器學(xué)習(xí)框架,配有圖像和音頻包。這樣的軟件包有助于訓(xùn)練模型和創(chuàng)建交互式應(yīng)用程序,例如試聽、計算機視覺等。由于工具名中包含.net,因此該框架的基礎(chǔ)庫是C#語言。

圖源:accord-framework
Accord庫在測試和處理音頻文件中非常有用。
RapidMiner
對于于非程序員用戶而言,RapidMiner算是福音,它是一個數(shù)據(jù)科學(xué)平臺,具有非常出色的界面。RapidMiner獨立于平臺,可以在跨平臺操作系統(tǒng)上工作。
借助該工具,人們可以使用自己的數(shù)據(jù)測試自己的模型。
此外,RapidMiner的界面也非常人性化。用戶只需要拖放即可。這也是它對非程序員非常友好的主要原因。
Scikit-Learn
Scikit-Learn是一個開放源代碼的機器學(xué)習(xí)包。它是一個多用途集成平臺,可以用來進行回歸、聚類、分類、降維和預(yù)處理。Scikit-Learn創(chuàng)建于三個主要的Python庫之上,即NumPy、Matplotlib和SciPy。除此之外,它還有助于測試以及模型訓(xùn)練。
TensorFlow
TensorFlow是一個開源框架,適用于大規(guī)模及數(shù)值機器學(xué)習(xí)。它是機器學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)模型的集合,也是Python的好朋友,它比較大的特點是可以在CPU和GPU上運行。
TensorFlow常用于自然語言處理和圖像分類。
Weka
Weka也是開源軟件,用戶可以通過圖形用戶界面訪問Weka。該軟件非常人性化,也常被應(yīng)用于研究和教學(xué)中。此外,Weka還允許用戶訪問其他機器學(xué)習(xí)工具,例如:R、Scikit-Learn等。
Knime
Knime是一個基于圖形用戶界面(Graphical UserInterface,GUI)的開源機器學(xué)習(xí)工具。即使沒有任何編程知識,你仍然可以利用Knime提供的工具。Knime通常用于與數(shù)據(jù)相關(guān)的目的,比如數(shù)據(jù)操縱、數(shù)據(jù)挖掘等。
Knime通過創(chuàng)建并執(zhí)行不同的工作流程來處理數(shù)據(jù),它的存儲庫帶有很多不同節(jié)點,將這些節(jié)點帶入Knime門戶就能創(chuàng)建并執(zhí)行節(jié)點的工作流程。
Pytorch
Pytorch是一個深度學(xué)習(xí)框架,既快速又靈活,這是因為Pytorch可以很好地命令GPU。它是機器學(xué)習(xí)最重要的工具之一,因為它被用于機器學(xué)習(xí)最重要的方面,包括構(gòu)建深度神經(jīng)網(wǎng)絡(luò)和張量計算。
Pytorch完全基于Python。除此之外,它還是NumPy的優(yōu)秀替代工具。
Google Cloud AutoML
Google Cloud AutoML的目標(biāo)是使所有人都能使用人工智能。Google Cloud AutoML為用戶提供了預(yù)訓(xùn)練模型,以便創(chuàng)建各種服務(wù),例如文本識別、語音識別等。
Google Cloud AutoML在公司中非常受歡迎。公司希望將人工智能應(yīng)用于行業(yè)的各個領(lǐng)域,但由于市場上成熟的AI人才,因此它的企業(yè)應(yīng)用一直面臨著困難。
Jupyter Notebook
Jupyter notebook是使用比較廣泛的機器學(xué)習(xí)工具之一,是一個非??焖俚奶幚砉ぞ撸彩且粋€高效的平臺。它支持三種語言:Julia、R、Python。
Jupyter的名稱也是由這三種編程語言組合而成。Jupyter Notebook允許用戶以筆記本的形式存儲和共享動態(tài)代碼,也可以通過GUI訪問它,例如winpythonnavigator和anacondanavigator等。
Azure Machine Learning studio
Azure機器學(xué)習(xí)工作室由Microsoft發(fā)布,就像Google的Cloud AutoML一樣,這是Microsoft的產(chǎn)品,可為用戶提供機器學(xué)習(xí)服務(wù)。
Azure機器學(xué)習(xí)工作室是建立模塊和數(shù)據(jù)集連接的一種非常簡單的方法。,Azure還旨在為用戶提供AI功能。與TensorFlow一樣,它也可以在CPU和GPU上運行。
Orange3
Orange3是一款數(shù)據(jù)挖掘軟件,它是Orange軟件的新版本。Orange3協(xié)助預(yù)處理、數(shù)據(jù)可視化以及其他與數(shù)據(jù)相關(guān)的工作。用戶可以通過AnacondaNavigator訪問Orange3。在Python編程中,這確實很有幫助。此外,它還可以充當(dāng)一個不錯的用戶界面。
MLLIB
與Mahout一樣,MLLIB也是Apache Spark的產(chǎn)品。它用于回歸、特征提取、分類、過濾等。通常也稱之為Spark MLLIB,它具有非常好的速度和效率。
IBM Watson
IBM Watson是IBM提供的使用Watson的網(wǎng)頁界面,Watson是基于自然語言處理的人機交互問答系統(tǒng)。Watson應(yīng)用于各個領(lǐng)域,例如自動學(xué)習(xí)、信息提取等。
IBM Watson通常用于研究和測試,其目的是為用戶提供類似人的體驗。
Apache Mahout
Mahout由基于Hadoop的開源平臺Apache啟動,通常用于機器學(xué)習(xí)和數(shù)據(jù)挖掘,它使諸如回歸、分類和聚類之類的技術(shù)成為可能。它還利用了基于數(shù)學(xué)的函數(shù),如向量等。
Pylearn2
Pylearn2是建立在Theano之上的機器學(xué)習(xí)庫,它們之間有許多相似的功能。它還可以執(zhí)行數(shù)學(xué)計算。Pylearn2也能夠在CPU和GPU上運行。需要注意的是,在進入Pylearn2之前,用戶必須熟悉Theano。
本文介紹的是一些比較流行和廣泛使用的機器學(xué)習(xí)工具,所有這些工具都使用不同的編程語言運行,其中一些工具在Python上運行,一些在C ++上運行,而另一些在Java上運行。
選擇適合你的試試吧,只碼不看可不是好習(xí)慣~