海量數(shù)據(jù)應(yīng)用!微軟Azure推開源HDInsight
近日,微軟正式發(fā)布Windows Azure HDInsight,這是微軟Azure云端的Apache Hadoop版本,針對海量數(shù)據(jù)應(yīng)用。
Hadoop為開源的軟件架構(gòu)平臺,可用來存儲與處理集群服務(wù)器上的大量數(shù)據(jù),并已成為管理海量數(shù)據(jù)的***平臺。包括Google、Yahoo、Facebook、Amazon、IBM及英特爾等業(yè)者都使用Hadoop架構(gòu)來執(zhí)行大量的分布式計算。
微軟表示,HDInsight是以Hadoop開源為基礎(chǔ)提供Azure的云端服務(wù),已公開預(yù)覽多時,獲得客戶的支持并成為微軟企業(yè)服務(wù)的一部份。
Windows Azure HDInsight平臺
Windows Azure HDInsight采用了Hadoop的數(shù)據(jù)處理平臺與相關(guān)的工具,以及知名的Hadoop版本─Hortonworks Data Platform(HDP),同時兼容微軟的各種分析工具,包括Excel與Power BI等,并支持.NET或Java等編程語言,以更好的面對使用Hadoop的客戶。
微軟指出,HDInsight為海量數(shù)據(jù)的端對端解決方案,針對用戶可從各種方面獲取的數(shù)據(jù)以供Excel使用,涵蓋SQL Server、HDInsight、Hadoop的外部叢集或是公開的數(shù)據(jù)集等,并利用Power BI中的工具來萃取數(shù)據(jù)文件。
據(jù)了解,微軟準(zhǔn)備在下個月正式發(fā)表HDP 2.0 for Windows Server版本,未來準(zhǔn)備將HDInsight更新至HDP 2.0。