如果使用得當(dāng),MySQL也可以化身NoSQL
隨著互聯(lián)網(wǎng)和移動(dòng)互聯(lián)網(wǎng)的發(fā)展,各個(gè)機(jī)構(gòu)都需要支撐遠(yuǎn)超過(guò)以往的數(shù)據(jù)。而在這個(gè)需求的刺激下,IT領(lǐng)域出現(xiàn)了大量數(shù)據(jù)處理技術(shù),其中之一就是NoSQL。靈活的數(shù)據(jù)類型,高效的處理能力,讓NoSQL已占據(jù)數(shù)據(jù)管理系統(tǒng)的一席之地,比如人氣NoSQL數(shù)據(jù)庫(kù)MongoDB。然而在Wix工程實(shí)踐中,他們發(fā)現(xiàn),大量場(chǎng)景中其實(shí)并不需要NoSQL,反而成熟的RDBMS更具效益,比如MySQL。下面一起看Wix工程主管 Aviran Mordo的分享,由OneAPM工程師翻譯。
開發(fā)人員選擇NoSQL數(shù)據(jù)庫(kù)一般都是根據(jù)主觀臆斷,或者“關(guān)系型數(shù)據(jù)庫(kù)性能不如NoSQL數(shù)據(jù)庫(kù)”這個(gè)錯(cuò)誤的理念。此外,在做數(shù)據(jù)庫(kù)選型時(shí),開發(fā)人員往往還忽視了運(yùn)維上的開銷。實(shí)際上根據(jù)Wix的實(shí)踐發(fā)現(xiàn),大部分情況下都不必去選擇NoSQL數(shù)據(jù)庫(kù),而且如果使用得當(dāng)?shù)脑?,MySQL也可以是一個(gè)優(yōu)秀的NoSQL數(shù)據(jù)庫(kù)。
在可擴(kuò)展系統(tǒng)構(gòu)建時(shí),一個(gè)很重要的考量是使用的技術(shù)是否成熟,選擇成熟的技術(shù)意味著出錯(cuò)時(shí)能夠迅速恢復(fù)。當(dāng)然,開發(fā)者也可以在項(xiàng)目中使用***最牛的NoSQL數(shù)據(jù)庫(kù),而這個(gè)數(shù)據(jù)庫(kù)在理論上也可以良好地運(yùn)行,然而在生產(chǎn)環(huán)境中出現(xiàn)了問(wèn)題恢復(fù)需要多久?技術(shù)上已有的知識(shí)和經(jīng)驗(yàn)積累對(duì)于問(wèn)題緩解至關(guān)重要,當(dāng)然這個(gè)積累也包括了Google可以搜索到的內(nèi)容。相比之下,關(guān)系型數(shù)據(jù)庫(kù)已經(jīng)存在了超過(guò)四十年,業(yè)界對(duì)于關(guān)系型數(shù)據(jù)庫(kù)的維護(hù)也積累了大量的經(jīng)驗(yàn)。基于這些考慮,在新項(xiàng)目做技術(shù)選型時(shí)通常會(huì)選擇MySQL,而不是NoSQL數(shù)據(jù)庫(kù),除非NoSQL真的有非常非常明顯的優(yōu)勢(shì),比如數(shù)據(jù)量太大就不適合使用MySQL。
必須承認(rèn)MySQL也有自己的問(wèn)題。在大規(guī)模系統(tǒng)中使用的話可能會(huì)碰到性能上的問(wèn)題。為實(shí)現(xiàn)MySQL性能的***化,這里總結(jié)了幾條經(jīng)驗(yàn),其中之一是避免數(shù)據(jù)庫(kù)級(jí)別的事務(wù)。因?yàn)槭聞?wù)需要數(shù)據(jù)庫(kù)采用鎖來(lái)實(shí)現(xiàn),從而會(huì)影響數(shù)據(jù)庫(kù)性能。通常情況下會(huì)使用邏輯應(yīng)用程序級(jí)的鎖來(lái) 替換,從而減少負(fù)載并獲得一個(gè)更好的性能。
舉個(gè)例子,以發(fā)票結(jié)構(gòu)為例。如果某個(gè)發(fā)票有多個(gè)行項(xiàng)目,取代在單事務(wù)將所有行項(xiàng)目寫入,這里更應(yīng)該在非事務(wù)情況下逐行寫入。在所有行全部寫入數(shù)據(jù)庫(kù)后,這里還會(huì)寫入一個(gè)首記錄,它包含了指向所有行項(xiàng)目ID的指針。這樣一來(lái),如果所有行中有一行寫入失敗,那么這行的首記錄就會(huì)不存在,從而整個(gè)事務(wù)失敗。這么做雖然可能會(huì)造成一些垃圾記錄,但在存儲(chǔ)介質(zhì)如此便宜的今天這顯然不是什么大問(wèn)題,而這些垃圾記錄也可以做定期刪除。
下面也中介了一些MySQL實(shí)踐經(jīng)驗(yàn):
-
不要使用joins查詢,只做主鍵或者索引查詢。
-
不要使用自增主鍵因?yàn)闀?huì)有鎖,取而代之,使用客戶端生成鍵,比如GUIDs。同時(shí),如果你使用主主備份,自增鍵還可能會(huì)沖突,因此你需要為每個(gè)實(shí)例都定制鍵的范圍。
-
沒有索引的字段通通刪掉或者使用JSON集合成單一字段。
在Wix,MySQL經(jīng)常會(huì)被當(dāng)做鍵值存儲(chǔ),比如在一列中儲(chǔ)存JSON對(duì)象,從而在不改變數(shù)據(jù)庫(kù)模式下對(duì)數(shù)據(jù)結(jié)構(gòu)模式進(jìn)行擴(kuò)展。在MySQL中,使用主鍵讀取也很快,Wix就通過(guò)這個(gè)方式獲得了亞毫秒級(jí)的讀取速度,完全可以支撐整個(gè)使用場(chǎng)景?;谝陨线@些原因,MySQL完全可以看作一個(gè)符合ACID原則的NoSQL數(shù)據(jù)庫(kù)。至于數(shù)據(jù)庫(kù)的大小,一個(gè)MySQL實(shí)例支持幾億條數(shù)據(jù)是沒什么問(wèn)題的。
關(guān)系型數(shù)據(jù)庫(kù)的一個(gè)鮮明的優(yōu)勢(shì)是不用考慮最終一致性,而這個(gè)在NoSQL數(shù)據(jù)庫(kù)中并不是原生支持的。本文也不是貶低NoSQL,因?yàn)殛P(guān)系型數(shù)據(jù)庫(kù)已有限制也非常多:嚴(yán)格的數(shù)據(jù)結(jié)構(gòu)和大小限制。這里只是想提醒開發(fā)人員,在選擇新技術(shù)時(shí)不要忽視運(yùn)維成本。