自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<sub id="htlxr"></sub><sub id="htlxr"></sub>

<wbr id="htlxr"><sup id="htlxr"></sup></wbr>

<ruby id="htlxr"><rp id="htlxr"></rp></ruby><p id="htlxr"></p>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠(chǎng)商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線(xiàn)學(xué)習(xí)

文章資源問(wèn)答課堂專(zhuān)欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

賬號(hào)設(shè)置退出

NoSQL 之于大數(shù)據(jù)

作者：老曹 2016-12-04 16:36:18

開(kāi)發(fā) 開(kāi)發(fā)工具

關(guān)系型數(shù)據(jù)庫(kù)幾乎是許多開(kāi)發(fā)者和DBA對(duì)于傳統(tǒng)三層架構(gòu)應(yīng)用的唯一選擇。使用這一場(chǎng)景有很多原因，數(shù)據(jù)建模方法，查詢(xún)語(yǔ)言與數(shù)據(jù)交互，保證數(shù)據(jù)的一致性部署，并能夠?yàn)閺?fù)雜的應(yīng)用服務(wù)。

關(guān)系型數(shù)據(jù)庫(kù)幾乎是許多開(kāi)發(fā)者和DBA對(duì)于傳統(tǒng)三層架構(gòu)應(yīng)用的唯一選擇。使用這一場(chǎng)景有很多原因，數(shù)據(jù)建模方法，查詢(xún)語(yǔ)言與數(shù)據(jù)交互，保證數(shù)據(jù)的一致性部署，并能夠?yàn)閺?fù)雜的應(yīng)用服務(wù)。

然而，這不是解決所有數(shù)據(jù)存儲(chǔ)問(wèn)題的唯一方案，也是NoSQL 產(chǎn)生的原因。NoSQL 提供了新的方法而不是采用面向標(biāo)準(zhǔn)SQL的范式。

NoSQL 技術(shù)與高伸縮性無(wú)縫融合，很多技術(shù)同時(shí)具備了高分布性和高性能,是大數(shù)據(jù)分析的存儲(chǔ)基石。大多數(shù)時(shí)間里，它們使現(xiàn)有RDBMS 技術(shù)所實(shí)現(xiàn)的架構(gòu)更加完整，例如作為緩存服務(wù)器，搜索引擎，非結(jié)構(gòu)化存儲(chǔ)，易變信息存儲(chǔ)等。主要分為4類(lèi)：

Key/value
列存儲(chǔ)
面向文檔的存儲(chǔ)
圖存儲(chǔ)

現(xiàn)在深入到各種技術(shù)，選擇最適用于使用場(chǎng)景的技術(shù)。

Key/Value

***個(gè)也是最早的 NoSQL 數(shù)據(jù)存儲(chǔ)就是key/value. 這些數(shù)據(jù)就像字典一樣根據(jù)key來(lái)匹配value，通常使用在需要高性能的基本信息存儲(chǔ)，例如需要快速讀寫(xiě)的session信息，這些存儲(chǔ)在這樣的情景非常高效，也通常具有高伸縮性。

Key/value也經(jīng)常被用于上下文的隊(duì)列化來(lái)保證數(shù)據(jù)不丟失，例如日志架構(gòu)或搜索引擎的索引架構(gòu)。Redis 和Riak KV 是非常有名的key/value數(shù)據(jù)存儲(chǔ); Redis 使用的更加廣泛，因?yàn)樗兄粋€(gè)內(nèi)存型 K/V 存儲(chǔ)，并且持久化是可選的。Redis 經(jīng)常用于web應(yīng)用中來(lái)存儲(chǔ)session相關(guān)的數(shù)據(jù)，例如node或者-

PHP的 web應(yīng)用 ; 每秒鐘可以提取成千上萬(wàn)的session信息而沒(méi)有性能損失。另一個(gè)典型場(chǎng)景是后面要講到的序列化：Redis位于 Logstash 和 ElasticSearch 之間來(lái)存儲(chǔ)t ElasticSearch 查詢(xún)中的索引。

Column

由于要存儲(chǔ)超大量的記錄信息到達(dá)了key/value存儲(chǔ)限制的時(shí)候就需要用到列存儲(chǔ)。列存儲(chǔ)技術(shù)對(duì)于RDBMS世界的工程師可能不太容易理解，但事實(shí)上非常簡(jiǎn)單。RDBMS 中數(shù)據(jù)是按行存儲(chǔ)的，而列存儲(chǔ)中是按列的。使用列數(shù)據(jù)庫(kù)的主要好處是能高速訪(fǎng)問(wèn)海量數(shù)據(jù)。 RDBMS的一行在硬盤(pán)上是一個(gè)連續(xù)的存儲(chǔ)，多行可能存儲(chǔ)在硬盤(pán)不同的位置，使訪(fǎng)問(wèn)稍顯復(fù)雜，在列數(shù)據(jù)庫(kù)中的一列數(shù)據(jù)是連續(xù)存儲(chǔ)的。

舉個(gè)例子，考慮在RDBMS中查詢(xún)索引博客的標(biāo)題，尤其是有數(shù)百萬(wàn)數(shù)據(jù)的時(shí)候，需要大量的IO操作，而在列數(shù)據(jù)庫(kù)中，這樣的查詢(xún)只是一次訪(fǎng)問(wèn)。這樣的數(shù)據(jù)庫(kù)在從特定簇提取海量數(shù)據(jù)中非常順手，但此消彼長(zhǎng)的是缺乏靈活性。使用最多的列存儲(chǔ)數(shù)據(jù)庫(kù)是

Google Cloud Bigtable, 但開(kāi)源的列存儲(chǔ)數(shù)據(jù)庫(kù)是Apache HBase 和Cassandra.

列存儲(chǔ)數(shù)據(jù)庫(kù)的另一個(gè)好處是容易伸縮，這些列在海量存儲(chǔ)時(shí)具有高伸縮性。這就是為什么它們主要用于保存非易變且長(zhǎng)久保留信息的原因。

Document

列存儲(chǔ)數(shù)據(jù)庫(kù)對(duì)于含有比較深嵌套結(jié)構(gòu)的結(jié)構(gòu)化數(shù)據(jù)的存儲(chǔ)不是***的，這種場(chǎng)景需要使用面向文檔的數(shù)據(jù)存儲(chǔ)。數(shù)據(jù)實(shí)際上以key/value 存儲(chǔ),但是所有壓縮的數(shù)據(jù)叫做文檔。文檔依賴(lài)于一個(gè)結(jié)構(gòu)或者編碼例如XML, 但更多時(shí)候是 JSON (JavaScript Object Notation).

盡管文檔型數(shù)據(jù)庫(kù)對(duì)于數(shù)據(jù)的結(jié)構(gòu)化存儲(chǔ)和表達(dá)都非常有用，但也有其脆弱的一面，特別是與數(shù)據(jù)的交互性操作。它們基本上要遍歷整個(gè)文檔，例如當(dāng)讀取某個(gè)特定字段的時(shí)候，遍歷可能會(huì)影響性能。

當(dāng)需要存儲(chǔ)嵌套信息的時(shí)候，可以采用文檔型數(shù)據(jù)庫(kù)。例如，考慮怎樣表達(dá)應(yīng)用中的一個(gè)賬戶(hù)，大概有以下信息：

基礎(chǔ)信息:姓名，生日，照片，URL, 創(chuàng)建日期等等

復(fù)雜信息: 地址，認(rèn)證方法(password, Facebook, 等第三方認(rèn)證),興趣等等。

這也是NoSQL 文檔型數(shù)據(jù)庫(kù)經(jīng)常用到web應(yīng)用的原因: 表達(dá)嵌套對(duì)象非常容易，由于都使用JSON，還可以與前端的JavaScript技術(shù)無(wú)縫集成。

使用最多的文檔型數(shù)據(jù)庫(kù)是MongoDB, Couchbase, 和 Apache CouchDB，都非常容易安裝和啟動(dòng)，有很好的文檔說(shuō)明，而且都是可伸縮的，除此之外，它們也是開(kāi)放現(xiàn)代web應(yīng)用的明確選擇。

Graph

Graph 數(shù)據(jù)庫(kù)與其它數(shù)據(jù)庫(kù)有著本質(zhì)的區(qū)別。它使用了不同的范式來(lái)表達(dá)數(shù)據(jù)——樹(shù)結(jié)構(gòu)，節(jié)點(diǎn)和邊連接起來(lái)叫做關(guān)系。這些數(shù)據(jù)庫(kù)是隨著社交網(wǎng)絡(luò)而誕生的，例如表達(dá)用戶(hù)的好友網(wǎng)絡(luò)，他們的好友關(guān)系等等。對(duì)于其它類(lèi)型的數(shù)據(jù)存儲(chǔ)，可能把一個(gè)用戶(hù)的好友關(guān)系存儲(chǔ)在一個(gè)文檔中，但是，存儲(chǔ)好友關(guān)系還依然非常復(fù)雜;使用圖數(shù)據(jù)庫(kù)就非常簡(jiǎn)單，為每個(gè)好友創(chuàng)建節(jié)點(diǎn)，通過(guò)關(guān)系連接他們，依賴(lài)查詢(xún)的需要和范圍瀏覽圖。

***的圖數(shù)據(jù)庫(kù)是Neo4j, 象前面所說(shuō)的，主要使用場(chǎng)景是處理復(fù)雜的關(guān)系信息，例如實(shí)體間的連接，也可以用于分類(lèi)的場(chǎng)景。

Figure 2-1 展示了在圖數(shù)據(jù)庫(kù)中3個(gè)實(shí)體是如何連接的。

圖中的兩天賬戶(hù)節(jié)點(diǎn)Jane 和 John, 它們之間的每一條邊定義了他們的關(guān)系，在某天相互認(rèn)識(shí)，另一組節(jié)點(diǎn)連接的兩個(gè)賬戶(hù)展示了Jane 和 Joh在某天后都成為了足球組的成員。

使用場(chǎng)景中的NoSQL

根據(jù)使用場(chǎng)景，首先需要一個(gè)文檔型的 NoSQL數(shù)據(jù)庫(kù)，將存儲(chǔ)在關(guān)系型數(shù)據(jù)庫(kù)中的數(shù)據(jù)結(jié)構(gòu)化的一個(gè) JSON 文檔. 如前所述，傳統(tǒng)的RDBMSs 將數(shù)據(jù)存儲(chǔ)到多個(gè)有關(guān)系的表，當(dāng)?shù)玫揭粋€(gè)完整對(duì)象時(shí)變得比較復(fù)雜和低效。在Figure 2-2. 中可以看到一個(gè)賬戶(hù)被分割成多個(gè)表的例子。

如果要獲得所有的賬戶(hù)信息，基本上需要join兩到三個(gè)表?，F(xiàn)在考慮這樣的情形: 需要處理所有用戶(hù)在應(yīng)用中的每一次連接，這些連接有著不同的商業(yè)邏輯。 ***,想要賬戶(hù)自身的視圖。通過(guò)傳遞一個(gè)賬戶(hù)標(biāo)識(shí)通過(guò)API從全部用戶(hù)視圖中得到一個(gè)怎樣的文檔呢?

{    "id": "account_identifier",    "email": "account@email.com",    "firstname": "account_firstname",    "lastname": "account_lastname",    "birthdate": "account_birthdate",    "authentication": [{        "token": "authentication_token_1",        "source": "authenticaton_source_1",        "created": "16-12-12"    }, {        "token": "authentication_token_2",        "source": "authenticaton_source_2",        "created": "16-12-12"    }],    "address": [{        "street": "address_street_1",        "city": "address_city_1"        "zip": "address_zip_1"        "country": "address_country_1"        "created": "16-12-12"    }]}

好處顯而易見(jiàn): 通過(guò)保持一個(gè)實(shí)體的 JSON 表達(dá),可以更快更好的訪(fǎng)問(wèn)數(shù)據(jù)。進(jìn)一步，將這一方法通用化，從NoSQL數(shù)據(jù)庫(kù)讀取所有的讀操作，而讓所有的寫(xiě)操作 (create, update,delete) 還在RDBMS上 .但必須實(shí)現(xiàn)一個(gè)邏輯來(lái)維持 RDBMS到NoSQL 的數(shù)據(jù)同步，如果沒(méi)在緩存中的話(huà)還要?jiǎng)?chuàng)建一個(gè)關(guān)系型數(shù)據(jù)庫(kù)的對(duì)象。

在NoSQL高效可伸縮地創(chuàng)建文檔時(shí)為什么還要保持 RDBMS呢?因?yàn)檫@不是應(yīng)用的真正目的。我不想產(chǎn)生一個(gè)Big Bang 的影響. 假設(shè)RDBMS已經(jīng)準(zhǔn)備好了，但因?yàn)镽DBMS缺乏靈活性而集成了一個(gè)NoSQL存儲(chǔ)。希望充分利用兩個(gè)***的技術(shù) —— 特別是RDBMS的數(shù)據(jù)一致性和NoSQL的伸縮性。

【本文來(lái)自51CTO專(zhuān)欄作者老曹的原創(chuàng)文章，作者微信公眾號(hào)：喔家ArchiSelf,id:wrieless-com】

責(zé)任編輯：趙寧寧來(lái)源：喔家ArchiSelf

NoSQL 數(shù)據(jù)庫(kù)大數(shù)據(jù)

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開(kāi)發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)

<sub id="eseqe"><p id="eseqe"></p></sub>