幾款優(yōu)秀的分布式關(guān)系數(shù)據(jù)庫(kù)

作者：布加迪編譯 2019-07-10 08:00:00

這些橫向擴(kuò)展的SQL數(shù)據(jù)庫(kù)提供了橫向擴(kuò)展性和支持ACID事務(wù)的功能——一些支持全局規(guī)模。

【51CTO.com快譯】關(guān)系SQL數(shù)據(jù)庫(kù)自上世紀(jì)80年代以來(lái)就有了，以前運(yùn)行在大型機(jī)或單一服務(wù)器上。如果想讓數(shù)據(jù)庫(kù)處理更多數(shù)據(jù)、運(yùn)行得更快，只好將數(shù)據(jù)庫(kù)放在配備更多更快的CPU、內(nèi)存和磁盤的更龐大服務(wù)器上。換句話說(shuō)，你求助于縱向擴(kuò)展性即“向上擴(kuò)展”。以后，如果你需要能夠故障切換以改善可用性，可以將熱備用服務(wù)器與活動(dòng)服務(wù)器放在同一個(gè)“主動(dòng)-被動(dòng)”集群中，通常采用共享存儲(chǔ)。

需要ACID的四個(gè)屬性：原子性、一致性、隔離性和持久性，才能確保數(shù)據(jù)庫(kù)事務(wù)始終有效，即使出現(xiàn)網(wǎng)絡(luò)分區(qū)、電源故障及其他錯(cuò)誤。單一服務(wù)器上的數(shù)據(jù)庫(kù)遵循ACID的全部四個(gè)屬性比較容易，但針對(duì)分布式數(shù)據(jù)庫(kù)實(shí)施這些屬性要難一點(diǎn)。

最近市面上出現(xiàn)了幾種“橫向擴(kuò)展”的SQL數(shù)據(jù)庫(kù)。更棒的是，其中一些數(shù)據(jù)庫(kù)可以處理地理位置分散的服務(wù)器，而不犧牲一致性。由于光速帶來(lái)的限制，邊遠(yuǎn)的服務(wù)器節(jié)點(diǎn)比本地節(jié)點(diǎn)需要更長(zhǎng)的時(shí)間來(lái)更新，但幾種技術(shù)可以緩解這個(gè)問(wèn)題，包括使用共識(shí)組quora和超高速網(wǎng)絡(luò)及存儲(chǔ)。

通常，你一直使用的數(shù)據(jù)庫(kù)和想要使用的新分布式數(shù)據(jù)庫(kù)應(yīng)盡可能兼容，盡量降低模式和應(yīng)用程序轉(zhuǎn)換成本。簡(jiǎn)單的情況是，你可以遷移模式和數(shù)據(jù)，然后只需更改應(yīng)用程序中的連接字符串。復(fù)雜的情況是，你需要完成數(shù)據(jù)轉(zhuǎn)換過(guò)程，全面重寫存儲(chǔ)過(guò)程和觸發(fā)器，大范圍重寫應(yīng)用程序的數(shù)據(jù)層，包括SQL查詢。

Amazon RDS和Amazon Aurora

Amazon RDS(關(guān)系數(shù)據(jù)庫(kù)服務(wù))這種Web服務(wù)讓用戶更容易在云端安裝、操作和擴(kuò)展關(guān)系數(shù)據(jù)庫(kù)。Amazon RDS支持MySQL、MariaDB、PostgreSQL、Oracle Database和微軟SQL Server。

可以使用面向故障切換的同步輔助實(shí)例來(lái)配置Amazon RDS數(shù)據(jù)庫(kù)，以實(shí)現(xiàn)高可用性。遺憾的是，你無(wú)法從備用輔助實(shí)例中讀取?？梢允褂肕ySQL、MariaDB或PostgreSQL Read Replicas來(lái)加強(qiáng)讀取擴(kuò)展，但復(fù)制是異步的，因此副本的狀態(tài)可能落后于主實(shí)例的狀態(tài)。

Amazon Aurora是Amazon RDS中的一項(xiàng)服務(wù)，可在快速分布式存儲(chǔ)上提供高性能的MySQL和PostgreSQL數(shù)據(jù)庫(kù)集群。你可以在數(shù)據(jù)庫(kù)集群中最多創(chuàng)建15個(gè)Aurora Replicas以支持只讀查詢，可以在多個(gè)可用區(qū)(AZ)中創(chuàng)建副本，以實(shí)現(xiàn)全局分布。

據(jù)亞馬遜聲稱，Aurora可以提供最多五倍于MySQL的吞吐量，最多三倍于PostgreSQL的吞吐量，無(wú)需更改大多數(shù)現(xiàn)有應(yīng)用程序。亞馬遜還聲稱更新Aurora讀取副本的延遲時(shí)間約20毫秒，這比MySQL讀取副本快得多。

Azure SQL Database

Azure SQL Database是一種全面托管的關(guān)系云數(shù)據(jù)庫(kù)服務(wù)，提供廣泛的SQL Server引擎兼容性，讓你可以動(dòng)態(tài)增減數(shù)據(jù)庫(kù)資源。Azure SQL Database包括創(chuàng)建活動(dòng)地理副本的選項(xiàng)，這些地理副本是地理位置分散的輔助數(shù)據(jù)庫(kù)。

在相同或不同的區(qū)域支持最多四個(gè)輔助數(shù)據(jù)庫(kù)，輔助數(shù)據(jù)庫(kù)還可用于只讀查詢。如果你需要將主數(shù)據(jù)庫(kù)故障切換到其中一個(gè)輔助數(shù)據(jù)庫(kù)，可以手動(dòng)或通過(guò)API執(zhí)行此操作。

ClustrixDB

ClustrixDB現(xiàn)歸MariaDB所有，這個(gè)橫向擴(kuò)展的集群關(guān)系HTAP(混合事務(wù)/分析處理)數(shù)據(jù)庫(kù)采用無(wú)共享架構(gòu)設(shè)計(jì)。ClustrixDB主要與MySQL和MariaDB兼容。我測(cè)評(píng)ClustrixDB時(shí)，該產(chǎn)品不支持空間擴(kuò)展類型和全文搜索;上一個(gè)版本仍缺乏這兩項(xiàng)功能。

為ClustrixDB添加節(jié)點(diǎn)可以擴(kuò)展讀寫。ClustrixDB允許集群跨多個(gè)區(qū)域部署，以便在非計(jì)劃區(qū)域故障期間提供容錯(cuò)功能。在獨(dú)立實(shí)驗(yàn)室(但不是《InfoWorld》)運(yùn)行的測(cè)試)中，ClustrixDB能夠以15毫秒的延遲每秒處理4萬(wàn)個(gè)事務(wù)，其負(fù)載是90%的讀取和10%的寫入，為其提供了適用于電子商務(wù)的“網(wǎng)絡(luò)星期一”可擴(kuò)展性。

CockroachDB

CockroachDB是一種可橫向擴(kuò)展、與PostgreSQL兼容的開源分布式SQL數(shù)據(jù)庫(kù)，由熟悉Google Cloud Spanner的前谷歌員工開發(fā)。CockroachDB借鑒了Spanner的數(shù)據(jù)存儲(chǔ)系統(tǒng)設(shè)計(jì)，并使用Raft算法在其節(jié)點(diǎn)之間達(dá)成共識(shí)。CockroachDB不需要GPS和同步Spanner的原子鐘。

CockroachDB立足于事務(wù)性一致性的鍵值存儲(chǔ)系統(tǒng)RocksDB上。CockroachDB背后的主要設(shè)計(jì)目標(biāo)是支持ACID事務(wù)、橫向擴(kuò)展性和(最重要的)生存性，因此得名。CockroachDB默認(rèn)使用可序列化隔離模式，這勝過(guò)其他大多數(shù)數(shù)據(jù)庫(kù)實(shí)施的隔離機(jī)制。

我在2018年初測(cè)試CockroachDB時(shí)，其JOIN性能不是很好。從那以后，這點(diǎn)已得到解決。CockroachDB支持將集群分散在多個(gè)可用區(qū)上，還在谷歌云平臺(tái)和AWS上提供全面托管的云數(shù)據(jù)庫(kù)集群。

Google Cloud Spanner

Google Cloud Spanner是一種托管分布式數(shù)據(jù)庫(kù)，擁有NoSQL數(shù)據(jù)庫(kù)的可擴(kuò)展性，同時(shí)保留了SQL兼容性、關(guān)系模式、ACID事務(wù)和外部一致性。Spanner看起來(lái)像是顛覆了CAP定理。

Spanner是分片、全局分布、復(fù)制的，使用Paxos算法在節(jié)點(diǎn)之間達(dá)成共識(shí)。Spanner使用分兩個(gè)階段的提交以確保強(qiáng)一致性，但將Paxos組視為事務(wù)的成員。每個(gè)Paxos組只需要額定數(shù)(quorum)，而不是需要100%的成員。

在谷歌內(nèi)部使用時(shí)，Spanner的可用性超過(guò)五個(gè)9，即高于99.999%，這意味著每年停機(jī)時(shí)間不到5分鐘。這足以讓大多數(shù)程序員通常不必為編寫代碼來(lái)處理Spanner可用性故障而操心。

Spanner使用Google Common SQL，這是ANSI 2011 SQL的一種方言。Common SQL與PostgreSQL、MySQL、SQL Server或Oracle Database使用的任何SQL方言都不完全相同，數(shù)據(jù)類型略有不同，數(shù)據(jù)操縱方面大不相同。

原文標(biāo)題：The best distributed relational databases，作者：Martin Heller

【51CTO譯稿，合作站點(diǎn)轉(zhuǎn)載請(qǐng)注明原文譯者和出處為51CTO.com】

責(zé)任編輯：龐桂玉來(lái)源： 51CTO

數(shù)據(jù)庫(kù)關(guān)系數(shù)據(jù)庫(kù)分布式

自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

幾款優(yōu)秀的分布式關(guān)系數(shù)據(jù)庫(kù)