自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

MapR意欲將SQL on Hadoop推向新的高度

譯文
大數(shù)據(jù) Hadoop
為了徹底擺脫管理規(guī)劃的束縛并告別在內(nèi)容探索前需要對輸入數(shù)據(jù)進行的長時間ETL(即提取、轉(zhuǎn)換與加載)任務(wù),MapR在其Hadoop發(fā)行版中引入了Apache Drill分布式ANSI SQL查詢引擎。

[[120392]] 

為了徹底擺脫管理規(guī)劃的束縛并告別在內(nèi)容探索前需要對輸入數(shù)據(jù)進行的長時間ETL(即提取、轉(zhuǎn)換與加載)任務(wù),MapR在其Hadoop發(fā)行版中引入了Apache Drill分布式ANSI SQL查詢引擎。

為了幫助用戶告別一系列強度極高的數(shù)據(jù)工程處理任務(wù),MapR日前對其Hadoop發(fā)行版進行了更新、核心內(nèi)容在于引入Apache Drill 0.5。

Drill是一款開源分布式ANSI SQL查詢引擎,旨在進行自助式數(shù)據(jù)探索——它屬于谷歌Dremel系統(tǒng)的開源版本,搜索巨頭將其作為BigQuery服務(wù)的核心組件之一實現(xiàn)內(nèi)部大型數(shù)據(jù)集的查詢工作。Apache Drill的既定目標是擁有擴展至上萬臺甚至更多服務(wù)器的強大能力,同時保證用戶可以在數(shù)秒之內(nèi)處理PB級別數(shù)據(jù)以及上萬億條記錄信息。

Drill查詢引擎擁有以下各項能力:

• =在不改變原生格式的前提下進行數(shù)據(jù)探索(包括Parquet、JSON文件以及HBase表),而且無需數(shù)據(jù)庫管理員的介入。

• 對不斷變化且來自MongoDB等NoSQL數(shù)據(jù)存儲體系以及在線REST API的半結(jié)構(gòu)化/嵌套式數(shù)據(jù)進行分析。

• 創(chuàng)建出能夠同時包含多種不同Hadoop數(shù)據(jù)源的查詢機制,例如文件、HBase表以及Hive表。

• 重復使用現(xiàn)有SQL技術(shù)集、商務(wù)智能工具以及Apache Hive部署方案。

“我們對此感到非常興奮,因為它真正開啟了SQL-on-Hadoop的發(fā)展新時代,”MapR公司***營銷官Jack Norris表示。“其關(guān)注重點在于為Hadoop帶來自助式數(shù)據(jù)探索能力,且完全無需IT部門的介入。”

這是因為Drill能夠為用戶帶來讓SQL查詢直接面向多種數(shù)據(jù)格式加以運行的能力,它可以被用于對剛剛傳輸?shù)降膶崟r數(shù)據(jù)進行探索、而不再需要相關(guān)技術(shù)人員花費數(shù)周時間籌備管理規(guī)劃或者設(shè)置ETL任務(wù)。通過這種方式,它成功地幫助使用者在處理多種數(shù)據(jù)源時擁有了即時性自助式數(shù)據(jù)探索方案。

“企業(yè)用戶希望能夠?qū)Ρ4嬖贖adoop以及NoSQL數(shù)據(jù)庫當中的數(shù)據(jù)加以訪問,并利用現(xiàn)有SQL分析技能將這種訪問能力拓展到更為廣泛的實際使用者群體當中,”451研究機構(gòu)數(shù)據(jù)平臺與分析研究主管Matt Aslett指出。“Apache Drill有能力幫助用戶訪問Hadoop當中存儲的數(shù)據(jù),而且完全無需制定任何集中式規(guī)劃。除此之外,包含嵌套與重復域等復雜數(shù)據(jù)結(jié)構(gòu)的NoSQL數(shù)據(jù)集也可以得到直接使用,這在傳統(tǒng)SQL-on-Hadoop方案當中是完全不可想象的。”

“其它任何一款SQL-on-Hadoop解決方案,無論是Hive、Tez或者其它什么產(chǎn)品,在運行當中都需要依賴于固定的規(guī)劃與模式,”Norris同時補充稱。“無論大家著眼于MapReduce、Hive或者其它任何一種SQL-on-Hadoop解決方案,都需要某種中間人機制負責處理建模、數(shù)據(jù)轉(zhuǎn)換以及分析支持等任務(wù)。Drill的亮點則正在于此——可以在無需等待的前提下實現(xiàn)數(shù)據(jù)探索,而這無疑會讓用戶擁有令人振奮的速度與敏捷性優(yōu)勢。”

MapR公司將Drill打包塞進了MapR 4.0.1版本,此版本日前剛剛閃亮登場。這款Hadoop發(fā)行版***版本對自身面向各類用例的實時處理能力進行了顯著擴展,具體用例類型包括業(yè)務(wù)應(yīng)用程序、交互式查詢以及數(shù)據(jù)流處理等。

新版本當中還包含多套批處理框架,具體有MapReduce 1.x與2.x(基于YARN)以及Spark(0.9與1.0.2版本)。它還支持五項SQL-on-Hadoop技術(shù)方案:Hive(0.11、0.12與0.13版本)、Drill(0.5版本)、SparkSQL(1.0.2版本)、Impala(1.3.1版本)并且擁有與惠普Vertica相集成的認證資質(zhì)。它新增了面向HBase(0.94.21與0.98.4版本)的支持能力以及MapR-DB NoSQL技術(shù)。此外,***的MapR還擁有三項機器學習與圖形庫方案,分別為Mahout(0.8與0.9版本)、MLLib(0.9與1.0.2版本)外加GraphX。

英文:http://www.cio.com/article/2683676/big-data/mapr-aims-to-take-sql-on-hadoop-to-next-level.html

責任編輯:林師授 來源: 51CTO
相關(guān)推薦

2011-08-17 09:57:01

JavaScript

2011-05-25 09:00:18

紅帽KVM

2020-07-03 18:01:06

邊緣計算物聯(lián)網(wǎng)技術(shù)

2022-06-01 15:14:29

智能工廠智能制造5G

2013-03-20 09:49:06

MapRHadoop融資

2019-08-08 17:33:43

大數(shù)據(jù)MapRHPE

2025-04-15 07:00:00

勒索軟件金融欺詐網(wǎng)絡(luò)安全

2022-09-02 14:09:20

物聯(lián)網(wǎng)SIM

2016-02-24 09:38:25

Hadoop集群管理大數(shù)據(jù)技術(shù)

2021-06-29 20:53:10

邊緣計算AI人工智能

2016-08-29 20:35:55

谷歌Fuchsia谷歌操作系統(tǒng)

2018-08-29 11:39:21

戴爾

2012-02-23 10:29:45

Microsoft云計算微軟

2023-04-24 10:26:08

2009-11-23 09:35:48

RedHatEnterpriseD

2013-05-27 15:12:49

Hadoop 2.0

2011-09-28 10:03:23

IntelMeeGo

2016-06-16 09:33:58

2023-02-08 15:35:44

云原生云計算OpenTeleme

2013-01-21 13:22:56

IBMdW
點贊
收藏

51CTO技術(shù)棧公眾號