MySQL數(shù)據(jù)庫(kù)存儲(chǔ)引擎的概念與用途
以下的文章主要講述的是MySQL數(shù)據(jù)庫(kù)中的存儲(chǔ)引擎的實(shí)際應(yīng)用以及對(duì)MySQL數(shù)據(jù)庫(kù)中的存儲(chǔ)引擎的概念的具體描述,同時(shí)本文也對(duì)如何確定有哪些存儲(chǔ)引擎可用不可用的方法與使用一個(gè)指定的存儲(chǔ)引擎的具體方案介紹。
存儲(chǔ)引擎是什么?
MySQL中的數(shù)據(jù)用各種不同的技術(shù)存儲(chǔ)在文件(或者內(nèi)存)中。這些技術(shù)中的每一種技術(shù)都使用不同的存儲(chǔ)機(jī)制、索引技巧、鎖定水平并且最終提供廣泛的不同的功能和能力。通過(guò)選擇不同的技術(shù),你能夠獲得額外的速度或者功能,從而改善你的應(yīng)用的整體功能。
例如,如果你在研究大量的臨時(shí)數(shù)據(jù),你也許需要使用內(nèi)存存儲(chǔ)引擎。內(nèi)存存儲(chǔ)引擎能夠在內(nèi)存中存儲(chǔ)所有的表格數(shù)據(jù)。又或者,你也許需要一個(gè)支持事務(wù)處理的數(shù)據(jù)庫(kù)(以確保事務(wù)處理不成功時(shí)數(shù)據(jù)的回退能力)。
這些不同的技術(shù)以及配套的相關(guān)功能在 MySQL中被稱作存儲(chǔ)引擎(也稱作表類型)。 MySQL默認(rèn)配置了許多不同的存儲(chǔ)引擎,可以預(yù)先設(shè)置或者在MySQL服務(wù)器中啟用。你可以選擇適用于服務(wù)器、數(shù)據(jù)庫(kù)和表格的存儲(chǔ)引擎,以便在選擇如何存儲(chǔ)你的信息、如何檢索這些信息以及你需要你的數(shù)據(jù)結(jié)合什么性能和功能的時(shí)候?yàn)槟闾峁┳畲蟮撵`活性。
選擇如何存儲(chǔ)和檢索你的數(shù)據(jù)的這種靈活性是MySQL為什么如此受歡迎的主要原因。其它數(shù)據(jù)庫(kù)系統(tǒng)(包括大多數(shù)商業(yè)選擇)僅支持一種類型的數(shù)據(jù)存儲(chǔ)。遺憾的是,其它類型的數(shù)據(jù)庫(kù)解決方案采取的“一個(gè)尺碼滿足一切需求”的方式意味著你要么就犧牲一些性能,要么你就用幾個(gè)小時(shí)甚至幾天的時(shí)間詳細(xì)調(diào)整你的數(shù)據(jù)庫(kù)。使用MySQL,我們僅需要修改我們使用的存儲(chǔ)引擎就可以了。
在這篇文章中,我們不準(zhǔn)備集中討論不同的存儲(chǔ)引擎的技術(shù)方面的問(wèn)題(盡管我們不可避免地要研究這些因素的某些方面),相反,我們將集中介紹這些不同的引擎分別最適應(yīng)哪種需求和如何啟用不同的存儲(chǔ)引擎。為了實(shí)現(xiàn)這個(gè)目的,在介紹每一個(gè)存儲(chǔ)引擎的具體情況之前,我們必須要了解一些基本的問(wèn)題。
如何確定有哪些存儲(chǔ)引擎可用
你可以在MySQL(假設(shè)是MySQL服務(wù)器4.1.2以上版本)中使用顯示引擎的命令得到一個(gè)可用引擎的列表。
- mysql> show engines;
- +------------+---------+----------------------------------------------------+
- | Engine | Support | Comment |
- +------------+---------+-----------------------------------------------------+
- | MyISAM | DEFAULT | Default engine as of MySQL 3.23 with great performance |
- | HEAP | YES | Alias for MEMORY |
- | MEMORY | YES | Hash based, stored in memory, useful for temporary tables |
- | MERGE | YES | Collection of identical MyISAM tables |
- | MRG_MYISAM | YES | Alias for MERGE |
- | ISAM | NO | Obsolete storage engine, now replaced by MyISAM |
- | MRG_ISAM | NO | Obsolete storage engine, now replaced by MERGE |
- | InnoDB | YES | Supports transactions, row-level locking, and foreign keys |
- | INNOBASE | YES | Alias for INNODB |
- | BDB | NO | Supports transactions and page-level locking |
- | BERKELEYDB | NO | Alias for BDB |
- | NDBCLUSTER | NO | Clustered, fault-tolerant, memory-based tables |
- | NDB | NO | Alias for NDBCLUSTER |
- | EXAMPLE | NO | Example storage engine |
- | ARCHIVE | NO | Archive storage engine |
- | CSV | NO | CSV storage engine |
- +------------+---------+-------------------------------------------------------+
16 rows in set (0.01 sec) 這個(gè)表格顯示了可用的數(shù)據(jù)庫(kù)引擎的全部名單以及在當(dāng)前的數(shù)據(jù)庫(kù)服務(wù)器中是否支持這些引擎。
對(duì)于MySQL 4.1.2以前版本,可以使用mysql> show variables like "have_%"(顯示類似“have_%”的變量):
- mysql> show variables like "have_%";
- +------------------+----------+
- | Variable_name | Value |
- +------------------+----------+
- | have_bdb | YES |
- | have_crypt | YES |
- | have_innodb | DISABLED |
- | have_isam | YES |
- | have_raid | YES |
- | have_symlink | YES |
- | have_openssl | YES |
- | have_query_cache | YES |
- +------------------+----------+
- 8 rows in set (0.01 sec)
你可以通過(guò)修改設(shè)置腳本中的選項(xiàng)來(lái)設(shè)置在MySQL安裝軟件中可用的引擎。如果你在使用一個(gè)預(yù)先包裝好的MySQL二進(jìn)制發(fā)布版軟件,那么,這個(gè)軟件就包含了常用的引擎。然而,需要指出的是,如果你要使用某些不常用的引擎,特別是CSV、 RCHIVE(存檔)和BLACKHOLE(黑洞)引擎,你就需要手工重新編譯MySQL源碼 。
使用一個(gè)指定的存儲(chǔ)引擎
你可以使用很多方法指定一個(gè)要使用的存儲(chǔ)引擎。最簡(jiǎn)單的方法是,如果你喜歡一種能滿足你的大多數(shù)數(shù)據(jù)庫(kù)需求的存儲(chǔ)引擎,你可以在MySQL設(shè)置文件中設(shè)置一個(gè)默認(rèn)的引擎類型(使用 storage_engine 選項(xiàng))或者在啟動(dòng)數(shù)據(jù)庫(kù)服務(wù)器時(shí)在命令行后面加上--default-storage-engine或--default-table-type選項(xiàng)。
更靈活的方式是在隨MySQL服務(wù)器發(fā)布同時(shí)提供的MySQL客戶端時(shí)指定使用的存儲(chǔ)引擎。最直接的方式是在創(chuàng)建表時(shí)指定存儲(chǔ)引擎的類型,向下面這樣:
CREATE TABLE mytable (id int, title char(20)) ENGINE = INNODB
你還可以改變現(xiàn)有的表使用的存儲(chǔ)引擎,用以下語(yǔ)句:
ALTER TABLE mytable ENGINE = MyISAM
然而,你在以這種方式修改表格類型的時(shí)候需要非常仔細(xì),因?yàn)閷?duì)不支持同樣的索引、字段類型或者表大小的一個(gè)類型進(jìn)行修改可能使你丟失數(shù)據(jù)。如果你指定一個(gè)在你的當(dāng)前的數(shù)據(jù)庫(kù)中不存在的一個(gè)存儲(chǔ)引擎,那么就會(huì)創(chuàng)建一個(gè)MyISAM(默認(rèn)的)類型的表。
各存儲(chǔ)引擎之間的區(qū)別
為了做出選擇哪一個(gè)存儲(chǔ)引擎的決定,我們首先需要考慮每一個(gè)存儲(chǔ)引擎提供了哪些不同的核心功能。這種功能使我們能夠把不同的存儲(chǔ)引擎區(qū)別開來(lái)。我們一般把這些核心功能分為四類:支持的字段和數(shù)據(jù)類型、鎖定類型、索引和處理。一些引擎具有能過(guò)促使你做出決定的獨(dú)特的功能,我們一會(huì)兒再仔細(xì)研究這些具體問(wèn)題。
字段和數(shù)據(jù)類型
雖然所有這些引擎都支持通用的數(shù)據(jù)類型,例如整型、實(shí)型和字符型等,但是,并不是所有的引擎都支持其它的字段類型,特別是BLOG(二進(jìn)制大對(duì)象)或者TEXT文本類型。其它引擎也許僅支持有限的字符寬度和數(shù)據(jù)大小。
這些局限性可能直接影響到你可以存儲(chǔ)的數(shù)據(jù),同時(shí)也可能會(huì)對(duì)你實(shí)施的搜索的類型或者你對(duì)那些信息創(chuàng)建的索引產(chǎn)生間接的影響。這些區(qū)別能夠影響你的應(yīng)用程序的性能和功能,因?yàn)槟惚仨氁鶕?jù)你要存儲(chǔ)的數(shù)據(jù)類型選擇對(duì)需要的存儲(chǔ)引擎的功能做出決策。
鎖定
數(shù)據(jù)庫(kù)引擎中的鎖定功能決定了如何管理信息的訪問(wèn)和更新。當(dāng)數(shù)據(jù)庫(kù)中的一個(gè)對(duì)象為信息更新鎖定了,在更新完成之前,其它處理不能修改這個(gè)數(shù)據(jù)(在某些情況下還不允許讀這種數(shù)據(jù))。
鎖定不僅影響許多不同的應(yīng)用程序如何更新數(shù)據(jù)庫(kù)中的信息,而且還影響對(duì)那個(gè)數(shù)據(jù)的查詢。這是因?yàn)椴樵兛赡芤L問(wèn)正在被修改或者更新的數(shù)據(jù)。總的來(lái)說(shuō),這種延遲是很小的。大多數(shù)鎖定機(jī)制主要是為了防止多個(gè)處理更新同一個(gè)數(shù)據(jù)。由于向數(shù)據(jù)中插入信息和更新信息這兩種情況都需要鎖定,你可以想象,多個(gè)應(yīng)用程序使用同一個(gè)數(shù)據(jù)庫(kù)可能會(huì)有很大的影響。
不同的存儲(chǔ)引擎在不同的對(duì)象級(jí)別支持鎖定,而且這些級(jí)別將影響可以同時(shí)訪問(wèn)的信息。得到支持的級(jí)別有三種:表鎖定、塊鎖定和行鎖定。支持最多的是表鎖定,這種鎖定是在MyISAM中提供的。在數(shù)據(jù)更新時(shí),它鎖定了整個(gè)表。這就防止了許多應(yīng)用程序同時(shí)更新一個(gè)具體的表。這對(duì)應(yīng)用很多的多用戶數(shù)據(jù)庫(kù)有很大的影響,因?yàn)樗舆t了更新的過(guò)程。
頁(yè)級(jí)鎖定使用Berkeley DB引擎,并且根據(jù)上載的信息頁(yè)(8KB)鎖定數(shù)據(jù)。當(dāng)在數(shù)據(jù)庫(kù)的很多地方進(jìn)行更新的時(shí)候,這種鎖定不會(huì)出現(xiàn)什么問(wèn)題。但是,由于增加幾行信息就要鎖定數(shù)據(jù)結(jié)構(gòu)的最后8KB,當(dāng)需要增加大量的行,也別是大量的小型數(shù)據(jù),就會(huì)帶來(lái)問(wèn)題。
行級(jí)鎖定提供了最佳的并行訪問(wèn)功能,一個(gè)表中只有一行數(shù)據(jù)被鎖定。這就意味著很多應(yīng)用程序能夠更新同一個(gè)表中的不同行的數(shù)據(jù),而不會(huì)引起鎖定的問(wèn)題。只有InnoDB存儲(chǔ)引擎支持行級(jí)鎖定。
建立索引
建立索引在搜索和恢復(fù)數(shù)據(jù)庫(kù)中的數(shù)據(jù)的時(shí)候能夠顯著提高性能。不同的存儲(chǔ)引擎提供不同的制作索引的技術(shù)。有些技術(shù)也許會(huì)更適合你存儲(chǔ)的數(shù)據(jù)類型。
有些存儲(chǔ)引擎根本就不支持索引,其原因可能是它們使用基本表索引(如MERGE引擎)或者是因?yàn)閿?shù)據(jù)存儲(chǔ)的方式不允許索引(例如FEDERATED或者BLACKHOLE引擎)。
事務(wù)處理
事務(wù)處理功能通過(guò)提供在向表中更新和插入信息期間的可靠性。這種可靠性是通過(guò)如下方法實(shí)現(xiàn)的,它允許你更新表中的數(shù)據(jù),但僅當(dāng)應(yīng)用的應(yīng)用程序的所有相關(guān)操作完全完成后才接受你對(duì)表的更改。例如,在會(huì)計(jì)處理中每一筆會(huì)計(jì)分錄處理將包括對(duì)借方科目和貸方科目數(shù)據(jù)的更改,你需要要使用事務(wù)處理功能保證對(duì)借方科目和貸方科目的數(shù)據(jù)更改都順利完成,才接受所做的修改。如果任一項(xiàng)操作失敗了,你都可以取消這個(gè)事務(wù)處理,這些修改就不存在了。如果這個(gè)事務(wù)處理過(guò)程完成了,我們可以通過(guò)允許這個(gè)修改來(lái)確認(rèn)這個(gè)操作。