Cloudera Impala
代碼托管地址: GitHub
Impala是由Cloudera開發(fā),一個開源的Massively Parallel Processing(MPP)查詢引擎 。與Hive相同的元數據、SQL語法、ODBC驅動程序和用戶接口(Hue Beeswax),可以直接在HDFS或HBase上提供快速、交互式SQL查詢。Impala是在Dremel的啟發(fā)下開發(fā)的,***個版本發(fā)布于2012年末。
Impala不再使用緩慢的Hive+MapReduce批處理,而是通過與商用并行關系數據庫中類似的分布式查詢引擎(由Query Planner、Query Coordinator和Query Exec Engine三部分組成),可以直接從HDFS或者HBase中用SELECT、JOIN和統(tǒng)計函數查詢數據,從而大大降低了延遲。