自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<pre id="gsvou"></pre>

<rt id="gsvou"></rt>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

WOT技術大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設置退出

Hologres 揭秘：如何支持超高 QPS 在線服務（點查）場景

作者：周思華 2021-07-29 11:00:43

開發(fā) 后端

Hologres定位是一站式實時數(shù)倉，融合分析能力（Analytical）與在線服務(Serving)為一體，減少數(shù)據(jù)的割裂和移動。本文的內(nèi)容將會針對Hologres的服務能力（核心為點查能力），介紹Hologres到底具備哪些服務能力，以及背后的實現(xiàn)原理。

傳統(tǒng)的 OLAP 系統(tǒng)在業(yè)務中往往扮演著比較靜態(tài)的角色，以通過分析海量的數(shù)據(jù)得到業(yè)務的洞察（比如說預計算好的視圖、模型等），從這些海量數(shù)據(jù)分析到的結(jié)果再通過另外一個系統(tǒng)提供在線數(shù)據(jù)服務（比如HBase、Redis、MySQL等）。這里的服務（Serving）和分析（Analytical）是個割裂的過程。與此不同的是，實際的業(yè)務決策過程往往是一個持續(xù)優(yōu)化的在線過程。服務的過程會產(chǎn)生大量的新數(shù)據(jù)，我們需要對這些新數(shù)據(jù)進行復雜的分析。分析產(chǎn)生的洞察實時反饋到服務，讓業(yè)務的決策更實時，從而創(chuàng)造更大的商業(yè)價值。

Hologres定位是一站式實時數(shù)倉，融合分析能力（Analytical）與在線服務(Serving)為一體，減少數(shù)據(jù)的割裂和移動。本文的內(nèi)容將會針對Hologres的服務能力（核心為點查能力），介紹Hologres到底具備哪些服務能力，以及背后的實現(xiàn)原理。

通常我們所說的點查場景是指Key/Value查詢的場景，廣泛用于在線服務。由于點查場景的廣泛需求，市場上存在多種KV數(shù)據(jù)庫定位于支持高吞吐、低延時的點查場景，例如被大家廣而熟知的HBase，它通過自定義的一套API來提供點查的能力，在許多業(yè)務場景都能夠獲得較好的效果。但是HBase在實際使用中也會存在一定的缺點，這也使得很多業(yè)務從HBase遷移至Hologres，主要有以下幾點：

當數(shù)據(jù)規(guī)模大到一定程度的時候，HBase在性能方面將會有所下降，無法滿足大規(guī)模的點查計算，同時在穩(wěn)定性上也變得不如人意，需要有經(jīng)驗的運維支持
HBase提供的是自定義API，上手有一定的成本。Hologres直接通過SQL提供高吞吐、低延時的點查服務。相比于其它KV系統(tǒng)提供自定義API，SQL接口無疑更加的簡單易用。
HBase采用Schema Free設計，沒有數(shù)據(jù)類型，對于檢查數(shù)據(jù)質(zhì)量，修正數(shù)據(jù)質(zhì)量也帶來了復雜度，查錯難，修正難。Hologres具備與Postgres兼容的幾乎所有主流數(shù)據(jù)類型，可以通過Insert/Select/Update/Delete標準SQL語句對數(shù)據(jù)進行查看、更新。

在Hologres中的點查場景是指行存表基于主鍵（PK）的查詢。

--建行存表BEGIN;CREATE TABLE public.holotest ( "a" text NOT NULL, "b" text NOT NULL, "c" text NOT NULL, "d" text NOT NULL, "e" text NOT NULL,PRIMARY KEY (a,b));CALL SET_TABLE_PROPERTY('public.holotest', 'orientation', 'row');CALL SET_TABLE_PROPERTY('public.holotest', 'time_to_live_in_seconds', '3153600000');COMMIT;-- Hologres通過SQL進行點查select * from table where pk = ?; -- 一次查詢單個點select * from table where pk in (?, ?, ?, ?, ?); -- 一次查詢多個點

點查場景技術實現(xiàn)難點

正常情況下，一條SQL語句的執(zhí)行，需要經(jīng)過SQL Parser進行解析成AST（抽象語法樹），再由Query Optimizer處理生成Plan（可執(zhí)行計劃），最終通過執(zhí)行Plan拿到計算結(jié)果。而要想通過SQL做到高吞吐、低延時、穩(wěn)定的點查服務，則必須要克服如下困難：

在不破壞PostgreSQL生態(tài)的情況下，SQL接口如何做到高QPS？
如何做低甚至避免SQL解析與優(yōu)化器的開銷
一套高效的Client SDK如何與后端存儲進行交互？
如何在低消耗的情況下，做到高并發(fā)的交互
如何減少消息傳遞過程中的開銷
如何感知后端的壓力、配合做到最好的吞吐與延遲
后端存儲如何在高性能的情況下更加穩(wěn)定？
如何最大化利用cpu資源
如何減少各種內(nèi)存的分配與拷貝、避免熱點key等問題對系統(tǒng)帶來的不穩(wěn)定性
如何減少冷數(shù)據(jù)IO的影響
在克服上述3大類困難后，整體的工作方式就可以非常的簡潔：在接入層(FrontEnd)上直接通過Client SDK與后端存儲通信。

下面將會介紹Hologres是如何克服以上3大困難，從而實現(xiàn)高吞吐低延時的點查。

降低、避免SQL解析與優(yōu)化器的開銷

Query Optimizer進行Short Cut

由于點查的Query足夠簡單，Hologres的Query Optimizer進行了相應的short cut，點查Query并不會進入Opimizer的完整流程。Query進入FrontEnd后它會交由Fixed Planner進行處理，并由其生成對于的Fixed Plan（點查的物理Plan），F(xiàn)ixed Planner非常輕，無需經(jīng)過任何的等價變換、邏輯優(yōu)化、物理優(yōu)化等步驟，僅僅是基于AST樹進行了一些簡單的分析并構(gòu)建出對應的Fixed Plan，從而盡量規(guī)避掉優(yōu)化器的開銷。

Prepared Statement

盡管Query Optimizer對點查Query進行了short cut，但是Query進入到FrontEnd后的解析開銷依然存在、Query Optimizer的開銷也沒有完全避免。

Hologres兼容Postgres，Postgres的前、后端通信協(xié)議有extended協(xié)議與simple協(xié)議兩種：

simple協(xié)議：是一次性交互的協(xié)議，Client每次會直接發(fā)送待執(zhí)行的SQL給Server，Server收到SQL后直接進行解析、執(zhí)行，并將結(jié)果返回給Client。simple協(xié)議里Server無可避免的至少需要對收到的SQL進行解析才能理解其語義。
extended協(xié)議：Client與Server的交互分多階段完成，整體大致可以分成兩大階段。
第一階段：Client在Server端定義了一個帶名字的Statement，并且生成了該Statement所對應的generic plan(不與特定的參數(shù)綁定的通用plan)。

第二階段：用戶通過發(fā)送具體的參數(shù)來執(zhí)行第一階段中定義的Statement。第二階段可以重復執(zhí)行多次，每次通過帶上第一階段中所定義的Statement名字，以及執(zhí)行所需要的參數(shù)，使用第一階段生成的generic plan進行執(zhí)行。由于第二階段可以通過Statement名字和附帶的參數(shù)來反復執(zhí)行第一個階段所準備好的generic plan，因此第二個段在Frontend的開銷幾乎等同于0。
為此Hologres基于Postgres的extended協(xié)議，支持了Prepared Statement，做到了點查Query在Frontend上的開銷接近于0。

高性能的內(nèi)部通信

BHClient是Hologres實現(xiàn)的一套用于與后端存儲直接通信的高效Private Client SDK，主要有以下幾個優(yōu)勢：

1）Reactor模型、全程無鎖的異步操作

BHClient工作方式類似reactor模型，每個目標shard對應一個eventloop，以“死循環(huán)”的方式處理該shard上的請求。由于HOS對調(diào)度執(zhí)行單元的抽象，即使是shard很多的情況下，這種工作方式的基礎消耗也足夠低。

2）高效的數(shù)據(jù)交換協(xié)議binary row

通過自定義一套內(nèi)部的數(shù)據(jù)通信協(xié)議binary row來減少整個交互鏈路上的內(nèi)存的分配與拷貝。

3）反壓與湊批

BHClient可以感知后端的壓力，進行自適應的反壓與湊批，在不影響原有Latency的情況下提升系統(tǒng)吞吐。

穩(wěn)定可靠的后端存儲

1）LSM(Log Structured Merge Tree)

Hologres的行存表采取LSM進行存儲，相比于傳統(tǒng)的B+樹，LSM能夠提供更高的寫吞吐，因為它不會出現(xiàn)任何的隨機寫，Append Only的操作保證了其只會順序的寫盤。

一個行存tablet上會存在一個memtable，和多個immutable memtable。
數(shù)據(jù)更新都會寫入到memtable中，當memtable寫滿后會轉(zhuǎn)變?yōu)閕mmtable memtable，immutable memtable會Flush成Key有序的SST（Sorted String Table）文件，SST文件一旦生成則不能修改，因此不會發(fā)生隨機寫的操作。
SST文件在文件系統(tǒng)里面按層組織，除了level 0上的SST文件間無序，且存在overlap外，其它level上的SST文件間有序，且無overlap。因此查詢的時候，對于level 0上的文件需要逐個遍歷，而其它level的文件可以二分查找。底層的SST文件通過Compaction成新的SST文件去到更高層，因此低層的數(shù)據(jù)要比高層的新，所以一旦在某層上找到了滿足條件的key則無需往更高層去查詢。

2）基于C++純異步的開發(fā)

采用LSM對數(shù)據(jù)進行組織存儲的系統(tǒng)并不僅僅只有Hologres，LSM在谷歌的"BigTable"論文中被提出后，很多的系統(tǒng)都對其進行了借鑒采用，例如HBase。Hologres采用C++進行開發(fā)，相較于Java，native語言使得我們能夠追求到更極致的性能。同時基于HOS（Hologres Operation System）提供的異步接口進行純異步開發(fā)，HOS通過抽象ExecutionContext來自我管理CPU的調(diào)度執(zhí)行，能夠最大化的利用硬件資源、達到吞吐最大化。

3）IO優(yōu)化與豐富的Cache機制

Hologres實現(xiàn)了非常豐富的Cache機制row cache、block cache、iterator cache、meta cache等，來加速熱數(shù)據(jù)的查找、減少IO訪問、避免新內(nèi)存分配。當無可避免的需要發(fā)生IO時，Hologres會對并發(fā)IO進行合并、通過wait/notice機制確保只訪問一次IO，減少IO處理量。通過生成文件級別的詞典及壓縮，減少文件物理存儲成本及IO訪問。

總結(jié)

Hologres致力于一站式實時數(shù)倉，除了具備處理復雜OLAP分析場景的能力之外，還支持超高QPS在線點查服務，通過使用標準的Postgres SDK接口，就能通過SQL獲得低延時、高吞吐的在線服務能力，簡化學習成本，提升開發(fā)效率。

責任編輯：梁菲來源：阿里云云棲號

Hologres QPS 在線服務

51CTO技術棧公眾號

業(yè)務
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學堂精培企業(yè)培訓 CTO訓練營