自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

Hive任務執(zhí)行很慢,但是導入數(shù)據(jù)非常的快?

大數(shù)據(jù)
Hive使用Hadoop來執(zhí)行查詢,其查詢執(zhí)行速度是很慢的,但是使用load data向Hive中導入數(shù)據(jù)卻非??欤@是因為Hive采取的是讀時模式(Schema On Read)。

讀時模式和寫時模式

Hive使用Hadoop來執(zhí)行查詢,其查詢執(zhí)行速度是很慢的,但是使用load data向Hive中導入數(shù)據(jù)卻非???,這是因為Hive采取的是讀時模式(Schema On Read)。

  • 讀時模式:讀取數(shù)據(jù)的時候,對數(shù)據(jù)的類型、格式做檢查;
  • 寫時模式:寫入數(shù)據(jù)的時候,對數(shù)據(jù)的類型、格式等規(guī)范做檢查;

將數(shù)據(jù)存到Hive的數(shù)據(jù)表時,Hive采用的是“讀時模式”,意思是針對寫操作不會做任何校驗,只是簡單的將文件復制到Hive的表對應的HDFS目錄。跟“讀時模式”相對應的是“寫時模式”,RDBMS一般采用“寫時模式”,在將數(shù)據(jù)寫入到數(shù)據(jù)表的時候會檢查每一條記錄是否合法,如果檢查不通過會直接返回失敗信息。

 

[[322621]]

由于向Hive中存入數(shù)據(jù)的只是簡單的文件復制和粘貼,所以導入數(shù)據(jù)速度非常的快。當讀取、查詢的時候,才會根據(jù)表模式來解釋數(shù)據(jù),這個時候如果遇到了不符合模式的數(shù)據(jù),Hive會直接將數(shù)據(jù)解析成NULL。

讀時模式的好處

Hive采用讀時模式帶來了以下幾個好處:

  • 向Hive表中新增數(shù)據(jù)非常的快,通常情況下對于外來數(shù)據(jù),采用的方法是直接用Hadoop命令將文件上傳到一個HDFS目錄,Hive直接讀這個目錄;
  • 一份數(shù)據(jù)可以被解析成多種模式,存儲在Hive表中的數(shù)據(jù)跟Hive本身沒有關(guān)系,數(shù)據(jù)也可以被其他工具比如Pig來處理;

導入數(shù)據(jù)

  1. hive> load data local inpath '/root/usr.data' into table usr; 

 

Hive任務執(zhí)行很慢,但是導入數(shù)據(jù)非常的快?

 

 

責任編輯:未麗燕 來源: 今日頭條
相關(guān)推薦

2020-08-19 12:40:10

代碼項目數(shù)字代碼

2010-01-10 17:56:36

Firefox 3.7Firefox

2010-01-06 09:38:12

FirefoxFirefox 3.7

2021-08-17 10:34:19

Python數(shù)據(jù)科學機器學習

2021-10-21 22:03:00

PythonNumpy函數(shù)

2018-09-18 14:43:30

HBase查詢數(shù)據(jù)

2021-07-28 07:22:40

SQL順序Hive

2023-03-07 08:34:01

2024-11-06 10:59:00

2025-04-15 08:20:00

FastAPI異步函數(shù)

2019-08-23 11:44:16

5G物聯(lián)網(wǎng)技術(shù)

2020-08-22 07:30:14

微軟瀏覽器Windows

2014-08-05 09:37:07

大數(shù)據(jù)

2010-09-07 14:18:55

Perl

2022-10-18 10:41:44

Flowable服務任務

2023-12-13 13:03:53

任務調(diào)度執(zhí)行XXLJOB

2021-09-06 07:28:31

大數(shù)據(jù) kerberos 認證

2019-05-27 22:59:39

面試SQL語句數(shù)據(jù)庫

2024-06-20 12:48:17

Rustfd

2009-09-29 10:40:12

政府應急指揮平臺
點贊
收藏

51CTO技術(shù)棧公眾號