五個(gè)免費(fèi)開源的數(shù)據(jù)挖掘工具推薦
本文介紹了五個(gè)免費(fèi)開源的數(shù)據(jù)挖掘工具。所謂數(shù)據(jù)挖掘工具包括兩類,針對(duì)特定領(lǐng)域的數(shù)據(jù)挖掘工具以及通用的數(shù)據(jù)挖掘工具,本文介紹的五種工具均有所覆蓋。
Orange
Orange 是一個(gè)基于組件的數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)軟件套裝,它的功能即友好,又很強(qiáng)大,快速而又多功能的可視化編程前端,以便瀏覽數(shù)據(jù)分析和可視化,基綁定了Python以進(jìn)行腳本開發(fā)。它包含了完整的一系列的組件以進(jìn)行數(shù)據(jù)預(yù)處理,并提供了數(shù)據(jù)帳目,過渡,建模,模式評(píng)估和勘探的功能。其由C++ 和 Python開發(fā),它的圖形庫(kù)是由跨平臺(tái)的Qt框架開發(fā)。
RapidMiner
RapidMiner, 以前叫 YALE (Yet Another Learning Environment), 其是一個(gè)給機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘和分析的試驗(yàn)環(huán)境,同時(shí)用于研究了真實(shí)世界數(shù)據(jù)挖掘。它提供的實(shí)驗(yàn)由大量的算子組成,而這些算子由詳細(xì)的XML 文件記錄,并被RapidMiner圖形化的用戶接口表現(xiàn)出來(lái)。RapidMiner為主要的機(jī)器學(xué)習(xí)過程提供了超過500算子,并且,其結(jié)合了學(xué)習(xí)方案和Weka學(xué)習(xí)環(huán)境的屬性評(píng)估器。它是一個(gè)獨(dú)立的工具可以用來(lái)做數(shù)據(jù)分析,同樣也是一個(gè)數(shù)據(jù)挖掘引擎可以用來(lái)集成到你的產(chǎn)品中。
Weka
由Java開發(fā)的 Weka (Waikato Environment for Knowledge Analysis) 是一個(gè)知名機(jī)器學(xué)機(jī)軟件,其支持幾種經(jīng)典的數(shù)據(jù)挖掘任務(wù),顯著的數(shù)據(jù)預(yù)處理,集群,分類,回歸,虛擬化,以及功能選擇。其技術(shù)基于假設(shè)數(shù)據(jù)是以一種單個(gè)文件或關(guān)聯(lián)的,在那里,每個(gè)數(shù)據(jù)點(diǎn)都被許多屬性標(biāo)注。 Weka 使用Java的數(shù)據(jù)庫(kù)鏈接能力可以訪問SQL數(shù)據(jù)庫(kù),并可以處理一個(gè)數(shù)據(jù)庫(kù)的查詢結(jié)果。它主要的用戶接品是Explorer,也同樣支持相同功能的命令行,或是一種基于組件的知識(shí)流接口。
JHepWork
為科學(xué)家,工程師和學(xué)生所設(shè)計(jì)的 jHepWork 是一個(gè)免費(fèi)的開源數(shù)據(jù)分析框架,其主要是用開源庫(kù)來(lái)創(chuàng)建 一個(gè)數(shù)據(jù)分析環(huán)境,并提供了豐富的用戶接口,以此來(lái)和那些收費(fèi)的的軟件競(jìng)爭(zhēng)。它主要是為了科學(xué)計(jì)算用的二維和三維的制圖,并包含了用Java實(shí)現(xiàn)的數(shù)學(xué)科學(xué)庫(kù),隨機(jī)數(shù),和其它的數(shù)據(jù)挖掘算法。 jHepWork 是基于一個(gè)高級(jí)的編程語(yǔ)言 Jython,當(dāng)然,Java代碼同樣可以用來(lái)調(diào)用 jHepWork 的數(shù)學(xué)和圖形庫(kù)。
KNIME
KNIME (Konstanz Information Miner) 是一個(gè)用戶友好,智能的,并有豐演的開源的數(shù)據(jù)集成,數(shù)據(jù)處理,數(shù)據(jù)分析和數(shù)據(jù)勘探平臺(tái)。它給了用戶有能力以可視化的方式創(chuàng)建數(shù)據(jù)流或數(shù)據(jù)通道,可選擇性地運(yùn)行一些或全部的分析步驟,并以后面研究結(jié)果,模型 以及 可交互的視圖。 KNIME 由Java寫成,其基于 Eclipse 并通過插件的方式來(lái)提供更多的功能。通過以插件的文件,用戶可以為文件,圖片,和時(shí)間序列加入處理模塊,并可以集成到其它各種各樣的開源項(xiàng)目中,比如:R語(yǔ)言,Weka, Chemistry Development Kit, 和 LibSVM.
源文:http://www.junauza.com/2010/11/free-data-mining-software.html
譯文:http://coolshell.cn/articles/3356.html
【編輯推薦】