2018年7款最佳免費數(shù)據(jù)分析工具
譯文【51CTO.com快譯】數(shù)據(jù)分析對期望發(fā)掘隱藏在海量數(shù)據(jù)中的洞察力的公司來說越來越重要。企業(yè)可以使用旨在面對眾多數(shù)據(jù)源,組織、分類和推導統(tǒng)計結論的工具,獲得極其寶貴的洞察力,以便了解客戶和業(yè)務目標。
企業(yè)在評估數(shù)據(jù)分析工具時要考慮許多方面、要做出許多選擇,但是一旦找到合適的軟件,并高效地使用其功能可顯著改善業(yè)務。
我們評估了多家提供商以找到如今市面上***的免費數(shù)據(jù)分析軟件。我們在評估了它們的優(yōu)缺點,并分析了各家研究公司的評論后,選出了下列七款工具(按首字母順序排列),幫助你找到最適合自己的解決方案。
1.DataMelt
DataMelt又叫DMelt,這款計算平臺用于統(tǒng)計分析龐大數(shù)據(jù)和科學可視化。該軟件最常用于自然科學、工程以及金融市場的建模和分析。它支持許多編程語言,包括Python、 BeanShell、Groovy、Ruby、Java及其他語言。
企業(yè)組織可通過動態(tài)腳本來訪問大型庫,包括面向計算和可視化的40000多個Java類和500個Python模塊。更高級的功能需要開發(fā)者許可證或商業(yè)許可證,但是免費版DataMelt包括探索、分析和可視化數(shù)據(jù)所必要的許多關鍵功能。
DataMelt可在Windows、Linux、macOS和Android設備上運行。
2.KNIME分析平臺
KNIME分析平臺旨在幫助企業(yè)通過可視化編程來處理、分析和建模數(shù)據(jù)。該軟件包括1000多個模塊、數(shù)百個隨時可運行的示例和眾多集成工具,幫助用戶借助機器學習來發(fā)現(xiàn)隱藏在數(shù)據(jù)中的潛在洞察力,并預測未來。
KNIME讓企業(yè)能夠拖放活動之間的連接點,無需編寫代碼。該數(shù)據(jù)分析工具使用單一的可視化工作流程,支持簡單文本文件、數(shù)據(jù)庫、文檔、圖像、網(wǎng)絡和基于Hadoop的數(shù)據(jù)之間的數(shù)據(jù)融合。KNIME分析平臺是開源工具,每年發(fā)布兩個新版本。
KNIME適用于Windows、macOS和Linux設備。
鏈接:https://www.knime.com/knime-analytics-platform
3.OpenRefine
OpenRefine前身是Google OpenRefine,可幫助企業(yè)處理凌亂的數(shù)據(jù)。谷歌在2012年停止支持該項目,但該軟件并未停供,由自愿者定期更新。OpenRefine可對數(shù)據(jù)執(zhí)行眾多任務,包括清理、轉(zhuǎn)換和格式化數(shù)據(jù),讓數(shù)據(jù)更適合數(shù)據(jù)分析和探索。該工具還讓用戶能夠從外部Web服務獲取數(shù)據(jù),對來自各數(shù)據(jù)源的數(shù)據(jù)進行調(diào)和及匹配。
OpenRefine不是最適合大型數(shù)據(jù)庫的工具,但對許多企業(yè)來說仍是一種重要的、備受好評的選擇,這是由于分析員們經(jīng)常把大量的時間花在清理數(shù)據(jù)用于預測模型上。
OpenRefine可以下載到Windows、macOS和Linux上。
4.Orange
Orange是一款開源數(shù)據(jù)分析和可視化工具,在斯洛文尼亞的盧布爾雅那大學開發(fā)而成。用戶可以通過可視化編程或Python腳本在終端窗口中挖掘數(shù)據(jù);探索靜態(tài)分布、箱形圖或散點圖;以及利用決策圖、層次聚類、熱圖和線性預測,更深入地鉆研數(shù)據(jù)。
Orange的圖形用戶界面讓用戶能夠?qū)W⒂谔剿餍詳?shù)據(jù)分析,而不是編寫代碼。該工具還擁有用于機器學習的組件和擴展數(shù)據(jù)挖掘功能的附件,以執(zhí)行自然語言處理、文本挖掘、生物信息學、網(wǎng)絡分析以及相關的規(guī)則挖掘。
Orange支持Windows、macOS和Linux。
5.R
R編程語言廣泛用于統(tǒng)計方法中的研究。企業(yè)組織還能充分利用用于數(shù)據(jù)處理、計算和圖形顯示的集成軟件套件。關鍵的統(tǒng)計功能包括:線性和非線性建模、經(jīng)典統(tǒng)計測試、時間序列分析、分類和聚類。
R在Unix、Windows和macOS上運行。
6.Tableau Public
Tableau Public是一款數(shù)據(jù)分析和可視化軟件,讓用戶能夠向Web發(fā)布交互式數(shù)據(jù)。免費版Tableau僅限于1GB的數(shù)據(jù)存儲和100萬行數(shù)據(jù)。Tableau Public具有簡潔性和界面直觀的優(yōu)點,因而成為***的數(shù)據(jù)分析工具之一。
Tableau Public可挖掘來自Google Sheets、微軟Excel、CSV文件、JSON文件、靜態(tài)文件、空間文件、Web數(shù)據(jù)連接件和OData的數(shù)據(jù)。用戶可以生成在社區(qū)媒體上共享或嵌入到網(wǎng)站上供公眾訪問的交互式圖形、圖表和地圖。Tableau Public可以下載到Windows和macOS上。
鏈接:https://public.tableau.com/en-us/s/download
7.Trifacta Wrangler
Trifacta Wrangler是另一款旨在幫助數(shù)據(jù)分析員清理和準備來自諸多數(shù)據(jù)源的凌亂數(shù)據(jù)的軟件。一旦數(shù)據(jù)集導入到Trifacta Wrangler,該軟件就會自動整理數(shù)據(jù),并自動確定結構。機器學習算法可建議常見的轉(zhuǎn)換和聚合,有助于準備數(shù)據(jù)用于更詳細的分析。
Trifacta Wrangler可從微軟Excel、JSON文件和原始的CSV文件導入數(shù)據(jù)。該工具還可分析數(shù)據(jù),表明多少百分比的行存在值缺失、不匹配或不一致的情況,并按類型對數(shù)據(jù)進行直觀地分類,比如日期或時間、字符串或與每個數(shù)據(jù)點有關的IP地址。Trifacta Wrangler僅限于100MB數(shù)據(jù),可以下載到Windows和macOS設備上。
鏈接:https://www.trifacta.com/products/wrangler/
原文標題:Best free data analytics tools, 2018,作者:Matt Kapko
【51CTO譯稿,合作站點轉(zhuǎn)載請注明原文譯者和出處為51CTO.com】