如何選擇高性能NoSQL數(shù)據(jù)庫
很多公司會選擇“NoSQL”或“Not Only SQL”新型數(shù)據(jù)庫來支撐在線和運營程序服務(wù),那么我們要如何選擇高性能NoSQL數(shù)據(jù)庫?
1. 為數(shù)據(jù)庫定義目標(biāo)
NoSQL數(shù)據(jù)庫的目標(biāo)可能是為移動設(shè)備上的數(shù)千名用戶提供個性化數(shù)字體驗,為后端支付處理應(yīng)用程序存儲數(shù)據(jù),管理有一定時間生活的短暫數(shù)據(jù),或?qū)⒊志脭?shù)據(jù)存儲為系統(tǒng)記錄。你甚至可以在特定方案的同一數(shù)據(jù)管道中涉及多種類型的數(shù)據(jù)庫。
無論用例如何,在數(shù)據(jù)管道中定義NoSQL數(shù)據(jù)庫的特定功能非常重要,包括如何收集,提取和提供數(shù)據(jù)以進行分析。
2. 確定吞吐量和延遲要求
通常,這需要你的應(yīng)用程序的響應(yīng)時間<100毫秒。否則,它將被視為緩慢,你可能會失去用戶的興趣。但是,一些應(yīng)用程序 - 例如游戲,通信和金融交易系統(tǒng) - 要求其數(shù)據(jù)庫的響應(yīng)時間低至13毫秒。
除延遲外,我們還需要確定吞吐量要求。例如,數(shù)據(jù)庫可以處理數(shù)千個同步數(shù)據(jù)流,延遲低至50毫秒或更長?
了解將對數(shù)據(jù)庫提出的要求對于確保用戶體驗的質(zhì)量非常重要。
3. 為正確的作業(yè)選擇正確的數(shù)據(jù)庫
通常,開發(fā)人員選擇NoSQL數(shù)據(jù)庫是因為它們需要半結(jié)構(gòu)化或非結(jié)構(gòu)化數(shù)據(jù),具有靈活的模式,簡單的查詢模式,高速事務(wù),大量數(shù)據(jù)以及通過分布式計算和存儲的快速且廉價的可擴展性。你可以通過CAP定理進一步縮小選擇范圍,CAP定義定義如下:
一致性:每次讀取都會收到最近的寫入或錯誤。
可用性:每個請求都會收到(非錯誤)響應(yīng) - 不保證它包含最近的寫入。
分區(qū)容差:盡管節(jié)點之間的網(wǎng)絡(luò)丟棄(或延遲)任意數(shù)量的消息,系統(tǒng)仍繼續(xù)運行。
根據(jù)CAP定理,你可以優(yōu)先考慮CA,AP或CP特征。這有助于確定哪個數(shù)據(jù)庫最適合你的應(yīng)用程序。
4. 選擇托管服務(wù)提供商和自己動手(DIY)
托管服務(wù)解決方案使用經(jīng)驗豐富的資源處理數(shù)據(jù)庫的日常管理。這使你自己的資源能夠?qū)W⒂趹?yīng)用程序所需的創(chuàng)新和效率。如果朝這個方向發(fā)展,請評估提供數(shù)據(jù)庫即服務(wù)選項的第三方選項,并選擇能夠在保證正常運行時間的同時處理吞吐量和延遲要求的提供商。
當(dāng)然,外包可能并不總是可選的,在這種情況下,應(yīng)該考慮哪些數(shù)據(jù)庫提供商提供的軟件版本支持大規(guī)模配置,調(diào)度和管理容器。請務(wù)必檢查你最期望的功能,例如可伸縮性,主動 - 主動部署,吞吐量和延遲 - 并在概念驗證試驗期間對其進行驗證。
5. 確定部署模式
理想情況下,你需要一個數(shù)據(jù)庫提供程序,它允許在選擇的任何環(huán)境(無論是公共還是私有)中運行數(shù)據(jù)庫,并完全控制你的數(shù)據(jù)和配置。數(shù)據(jù)庫軟件也應(yīng)該作為Docker鏡像提供,這將允許企業(yè)開發(fā)人員在基于Docker的微服務(wù)架構(gòu)中使用它。
如果使用私有平臺即服務(wù)(PaaS),請確保你的數(shù)據(jù)庫提供商支持私有PaaS環(huán)境中的無縫擴展和輕松高可用性。
如果選擇托管服務(wù)提供商,請確認(rèn)它們支持跨多云提供商的群集部署。