2016年上半年10種最酷的大數(shù)據(jù)產(chǎn)品
譯文【51CTO.com快譯】火爆的市場和酷酷的技術(shù)
據(jù)市場研究公司IDC聲稱,去年,大數(shù)據(jù)和業(yè)務(wù)分析應(yīng)用軟件、工具和服務(wù)的銷售額達到了近1220億美元,到2019年會猛增50%以上,達到1870億美元。
所以,難怪新的大數(shù)據(jù)產(chǎn)品源源不斷地涌向市場,既有來自老牌企業(yè)的,也有來自初創(chuàng)公司的。
下面這10種大數(shù)據(jù)產(chǎn)品在2016年上半年引起了我們的注意。其中一些(但不是所有產(chǎn)品)是在3月份的Strata + Hadoop World大會或6月份的Hadoop峰會上亮相的。
AtScale Intelligence Platform 4.0
AtScale開發(fā)的軟件讓業(yè)務(wù)用戶有辦法使用已有,并且熟悉的應(yīng)用軟件和業(yè)務(wù)分析工具,包括微軟Excel、Tableau和QlikView,訪問Hadoop集群中的數(shù)據(jù)。
AtScale Intelligence Platform 4.0于3月份發(fā)布,它提供了公司所說的“混合查詢服務(wù)”,這項技術(shù)可以通過任何商業(yè)智能工具,使用MDX或SQL――這是查詢數(shù)據(jù)庫系統(tǒng)中數(shù)據(jù)的兩大語法,直接查詢Hadoop。
4.0版本還借助“真正的授權(quán)”技術(shù),解決安全和數(shù)據(jù)治理問題。該技術(shù)確保在Hadoop上執(zhí)行的查詢符合數(shù)據(jù)治理和數(shù)據(jù)訪問審計等策略。
BlueData EPIC For Cloud Deployments
由于復(fù)雜性和成本,大數(shù)據(jù)產(chǎn)品常常停留于試點階段。BlueData Software的EPIC平臺旨在讓用戶更容易部署用于開發(fā)和生產(chǎn)環(huán)境的Hadoop和Spark基礎(chǔ)設(shè)施及應(yīng)用軟件。
就在不久前,企業(yè)版的BlueData EPIC只適用于本地部署。而在6月份,該公司發(fā)布了面向云部署的BlueData EPIC,該公司稱之為“大數(shù)據(jù)即服務(wù)”。
BlueData Epic企業(yè)版現(xiàn)處于該公司所說的“針對性可用”階段――數(shù)量有限的早期采用客戶,僅限于亞馬遜網(wǎng)絡(luò)服務(wù)(AWS)平臺。今后幾個月將會推出適用于AWS以及微軟Azure、谷歌云平臺及其他公共云服務(wù)的公眾版。
Confluent Platform 3.0
處理實時流數(shù)據(jù)是大數(shù)據(jù)領(lǐng)域的最大挑戰(zhàn)之一。為處理這個問題而出現(xiàn)的一項關(guān)鍵技術(shù)就是Apache Kafka,這種開源消息代理項目為處理實時數(shù)據(jù)提供了高吞吐量、低延遲的軟件。
Confluent于2014年9月份成立,由Kafka的早期開發(fā)人員創(chuàng)辦,他們旨在利用開源軟件,幫助公司獲得流數(shù)據(jù)的價值。Confluent Platform基于Kafka而建,這種實時數(shù)據(jù)系統(tǒng)充當(dāng)容錯、高擴展性的消息傳遞系統(tǒng)。它可以從眾多來源收集數(shù)據(jù),比如用戶活動日志、設(shè)備儀器、股票行情自動收錄器系統(tǒng)及其他使用場合。
5月份,這家初創(chuàng)公司發(fā)布了Confluent Platform 3.0,這個主要版本引入了Kafka Streams,這是用于構(gòu)建分布式流處理應(yīng)用程序的Java庫。3.0版本還包括用于管理Kafka環(huán)境的Confluent Control Center,這是該公司的首款商用產(chǎn)品。
Datameer 6.0和Datameer Cloud
Datameer開發(fā)的一種大數(shù)據(jù)分析平臺為用戶提供了數(shù)據(jù)整合、準(zhǔn)備、分析和可視化等方面的自助式功能。
Datameer 6.0于5月份發(fā)布,它提供了一種新的用戶界面和下一代分析工作流程,該公司稱,這讓數(shù)據(jù)整合、準(zhǔn)備、分析和可視化等步驟成為單一的、流暢的交互式過程,同時改進了數(shù)據(jù)發(fā)現(xiàn)。
該公司還推出了Datameer Cloud,這種基于云的數(shù)據(jù)準(zhǔn)備和分析服務(wù)在微軟的Azure HDInsight上運行,由Datameer全面管理。
DataStax Enterprise 5.0、OpsCenter 6.0和Enterprise Graph
DataStax是NoSQL數(shù)據(jù)庫領(lǐng)域的領(lǐng)導(dǎo)廠商,它為云計算和數(shù)據(jù)密集型應(yīng)用提供了基于Apache Cassandra數(shù)據(jù)庫的軟件。
該公司在2016年很忙碌。6月份發(fā)布的DataStax Enterprise(DSE)5.0包含物聯(lián)網(wǎng)和零售等應(yīng)用尤其需要的高級復(fù)制功能。它還包含更新版的Apache Spark,面向高級搜索和分析領(lǐng)域。
4月份發(fā)布的DSE Graph作為DSE的一個選項來提供,它是一種可擴展的實時圖形數(shù)據(jù)庫,用于需要由許多應(yīng)用軟件來管理復(fù)雜數(shù)據(jù)集的應(yīng)用環(huán)境。
同樣在6月份,該公司發(fā)布了DataStax OpsCenter 6.0,這款面向DSE的可視化監(jiān)控和管理系統(tǒng)提供了數(shù)據(jù)庫監(jiān)控、調(diào)優(yōu)、配置、備份和安全等功能。
DGSecure 6.0
Dataguise開發(fā)的以數(shù)據(jù)為中心的安全系統(tǒng)用來識別并保護企業(yè)最敏感的結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),無論數(shù)據(jù)駐留在何處,從傳統(tǒng)關(guān)系數(shù)據(jù)庫到Hadoop等大數(shù)據(jù)存儲系統(tǒng),不一而足。
DGSecure 6.0于6月份發(fā)布,它包含面向數(shù)據(jù)治理、隱私合規(guī)和風(fēng)險緩解等任務(wù)的新功能,包括制定數(shù)據(jù)安全治理策略。軟件包含一個新的儀表板,可用于可視化顯示數(shù)據(jù)泄密風(fēng)險、確保遵從隱私政策。
Information Builders的WebFocus Business User Edition
Information Builders的WebFocus歷來是該公司的旗艦商業(yè)智能產(chǎn)品。但是企業(yè)版軟件歷來面向為經(jīng)理和工人提供商業(yè)智能報表的IT部門和開發(fā)人員。
如今業(yè)務(wù)分析領(lǐng)域的口號是“自助式”,為用戶提供用來自行發(fā)現(xiàn)、準(zhǔn)備和分析數(shù)據(jù)的大數(shù)據(jù)工具。6月份,IBI宣布推出WebFocus Business User Edition(BUE),該產(chǎn)品讓不懂技術(shù)的用戶無需IT或商業(yè)智能開發(fā)人員的幫助,就可以輕松生成和共享報表、儀表板及數(shù)據(jù)可視化工具。
WebFocus BUE軟件包括:面向不懂技術(shù)的用戶的InfoAssist+自助式分析創(chuàng)作工具,用于管理內(nèi)容和組裝分析頁面的BUE Portal,以及面向高速數(shù)據(jù)發(fā)現(xiàn)的列式存儲工具。
基于瀏覽器的軟件是為包括100個用戶的群組設(shè)計的,它在今年年初推出了限量版。
Koverse 2.0
初創(chuàng)公司Koverse提供一種“一體化數(shù)據(jù)湖”平臺,因而可以大大加快收集大數(shù)據(jù),并引入到生產(chǎn)環(huán)境的速度,而成本低于當(dāng)前的技術(shù)和方法。
總部位于西雅圖的這家公司創(chuàng)辦于2012年,該技術(shù)的早期版本已在兩年多前亮相。Koverse平臺2.0于6月21日發(fā)布,它整合了Apache Accumulo“分布式鍵/值存儲”技術(shù)和該公司的通用索引引擎(Universal Indexing Engine)。
Koverse保證,它可以在一個月內(nèi)將一家公司的大數(shù)據(jù)引入到生產(chǎn)環(huán)境――這比過去構(gòu)建數(shù)據(jù)倉庫所花的時間要短得多。
SAS Viya
Viya是一種新的分析和可視化平臺,可以在私有云或公共云環(huán)境中運行。SAS在4月份發(fā)布了下一代軟件,這是它首次真正涉足云計算,并為SAS未來的業(yè)務(wù)分析軟件提供了基礎(chǔ)。
不僅可使用SAS自己的編程語言來訪問該平臺,還可以使用包括Python、Luya和Java在內(nèi)的其他語言來訪問,使用支持性的公共REST API也可以訪問。
該軟件目前針對早期采用者,會在這個季度面向大眾發(fā)布。SAS計劃今年針對Viya平臺發(fā)布的應(yīng)用軟件包括: SAS Visual Analytics、SAS Visual Statistics、SAS Visual Investigator、 SAS Visual Data Mining以及Machine Learning。
Splice Machine RDBMS走上開源道路
Splice Machine提供的數(shù)據(jù)庫系統(tǒng)結(jié)合了傳統(tǒng)關(guān)系數(shù)據(jù)庫技術(shù)的一些方面、下一代NoSQL數(shù)據(jù)庫的可擴展性以及內(nèi)存系統(tǒng)的高性能。該數(shù)據(jù)庫整合了HBase、Hadoop和Spark等技術(shù),可以執(zhí)行事務(wù)處理和業(yè)務(wù)分析等任務(wù)。
6月份,Splice Machine邁出了大膽的一步:讓其數(shù)據(jù)庫成為一種開源技術(shù)。聯(lián)合創(chuàng)始人兼首席執(zhí)行官蒙特·茲韋本(Monte Zweben)表示,走開源道路的目的是,吸引更多的開發(fā)人員關(guān)注Splice Machine平臺,進而為該數(shù)據(jù)庫構(gòu)建更多的下一代應(yīng)用程序。
除了企業(yè)版外,Splice Machine還將提供軟件的開源社區(qū)版,到時擁有更多的功能特性,收取許可費。
【51CTO譯稿,合作站點轉(zhuǎn)載請注明原文譯者和出處為51CTO.com】