MongoDB中索引的創(chuàng)建和使用詳解
索引通常能夠極大的提高查詢的效率。在系統(tǒng)中使用查詢時,應該考慮建立相關的索引。在MongoDB中創(chuàng)建索引相對比較容易。
MongoDB中的索引在概念上和大多數(shù)關系型數(shù)據(jù)庫如MySQL是一樣的。當你在某種情況下需要在MySQL中建立索引,這樣的情景同樣適合于MongoDB。
基本操作
索引是一種數(shù)據(jù)結構,他搜集一個集合中文檔特定字段的值。MongoDB的查詢優(yōu)化器能夠使用這種數(shù)據(jù)結構來快速的對集合(collection)中的文檔(collection)進行尋找和排序.準確來說,這些索引是通過B-Tree索引來實現(xiàn)的。
在命令行中,可以通過調用ensureIndex()函數(shù)來建立索引,該函數(shù)指定一個到多個需要索引的字段。沿用在前面的隨筆中的例子,我們再things集合中的j字段上建立索引:
- > db.things.ensureIndex({j:1})
EnsureIndex()函數(shù)自是在索引不存在的情況下才會創(chuàng)建。
一旦集合在某一個字段上建立索引后,對該字段的隨機查詢的訪問速度會很快。如果沒有索引,MongoDB會在遍歷所有的鍵值對,然后去對應檢查相關的字段。
- > db.things.find({j:2}); //在建立了索引的字段上查詢,速度快
- { "_id" : ObjectId("4e24433dcac1e3490b9033be"), "x" : 4, "j" : 2 }
- > db.things.find({x:3});//在未建立索引的字段上查詢,需要逐個字段匹配,速度慢
- { "_id" : ObjectId("4e244315cac1e3490b9033bc"), "x" : 3 }
通過在命令行中輸入getIndexs()能夠查看當前集合中的所有索引。
- > db.things.getIndexes()
- [
- {
- "name" : "_id_",
- "ns" : "things.things",
- "key" : {
- "_id" : 1
- },
- "v" : 0
- },
- {
- "_id" : ObjectId("4e244382cac1e3490b9033d0
- "ns" : "things.things",
- "key" : {
- "j" : 1
- },
- "name" : "j_1",
- "v" : 0
- }
- ]
通過db.system.indexes.find()能夠返回當前數(shù)據(jù)庫中的所有索引
- > db.system.indexes.find()
- { "name" : "_id_", "ns" : "things.things", "key" : { "_id" : 1 }, "v" : 0 }
- { "_id" : ObjectId("4e244382cac1e3490b9033d0"), "ns" : "things.things", "key" :{ "j" : 1 }, "name" : "j_1", "v" : 0 }
默認索引
對于每一個集合(除了capped集合),默認會在_id字段上創(chuàng)建索引,而且這個特別的索引不能刪除。_id字段是強制唯一的,由數(shù)據(jù)庫維護。
嵌套關鍵字
在MongoDB中,甚至能夠在一個嵌入的文檔上(embedded)建立索引.
- > db.things.ensureIndex({"address.city":1})
文檔作為索引
任何類型,包括文檔(document)都能作為索引:
- > db.factories.insert({name:"xyz",metro:{city:"New York",state:"NY"}});
- > db.factories.ensureIndex({metro:1});
- > db.factories.find({metro:{city:"New York",state:"NY"}});//能夠利用索引進行查詢
- { "_id" : ObjectId("4e244744cac1e3490b9033d2"), "name" : "xyz", "metro" : <
- { "city" : "New York", "state" : "NY" } }
- > db.factories.find({metro:{$gte:{city:"New York"}}});//能夠利用索引進行查詢
- { "_id" : ObjectId("4e244744cac1e3490b9033d2"), "name" : "xyz", "metro" : { "city" : "New York", "state" : "NY" } }
- > db.factories.find({metro:{state:"NY",city:"New York"}})//不能夠返回結果,字段的順序不對
創(chuàng)建文檔索引的一個替代方法是創(chuàng)建復合索引,例如:
- > db.factories.ensureIndex({"metro.city":1,"metro.state":1})
- > db.factories.find({"metro.city":"New York","metro.state":"NY"});
- { "_id" : ObjectId("4e244744cac1e3490b9033d2"), "name" : "xyz", "metro" : { "city" : "New York", "state" : "NY" } }
- > db.factories.find({"metro.city":"New York"});
- { "_id" : ObjectId("4e244744cac1e3490b9033d2"), "name" : "xyz", "metro" : { "city" : "New York", "state" : "NY" } }
- > db.factories.find().sort({"metro.city":1,"New York":1});
- { "_id" : ObjectId("4e244744cac1e3490b9033d2"), "name" : "xyz", "metro" : { "city" : "New York", "state" : "NY" } }
- > db.factories.find().sort({"metro.city":1});
- { "_id" : ObjectId("4e244744cac1e3490b9033d2"), "name" : "xyz", "metro" : { "city" : "New York", "state" : "NY" } }
組合關鍵字索引
除了基本的以單個關鍵字作為索引外,MongoDB也支持多個關鍵字的組合索引,和基本的索引一樣,也是用ensureIndex()函數(shù),該函數(shù)可以指定多個鍵。
- > db.things.ensureIndex({j:1,name:-1})
當創(chuàng)建索引時,鍵后面的數(shù)字表明了索引的方向,取值為1或者-1,1表示升序,-1表示降序。升序或者降序在隨機訪問的時候關系不大,當時在做排序或者范圍查詢的時候就很重要了。
如果在建立了a,b,c這樣一個復合索引,那么你可以在a,A,b和a,b,c上使用索引查詢。
#p#
稀疏索引
和稀疏矩陣類似,稀疏索引就是索引至包含被索引字段的文檔。
任何一個稀疏的缺失某一個字段的文檔將不會存儲在索引中,之所以稱之為稀疏索引就是說缺失字段的文檔的值會丟失。
稀疏索引的創(chuàng)建和完全索引的創(chuàng)建沒有什么不同。使用稀疏索引進行查詢的時候,某些由于缺失了字段的文檔記錄可能不會被返回,這是由于稀疏索引子返回被索引了的字段??赡鼙容^難以理解,不過看幾個例子就好理解了。
- > db.people.ensureIndex({title:1},{sparse:true}) //在title字段上建立稀疏索引
- > db.people.save({name:"Jim"})
- > db.people.save({name:"yang",title:"prince"})
- > db.people.find();
- { "_id" : ObjectId("4e244dc5cac1e3490b9033d7"), "name" : "Jim" }
- { "_id" : ObjectId("4e244debcac1e3490b9033d8"), "name" : "yang", "title" : "prince" }
- > db.people.find().sort({title:1})//自有包含有索引字段的記錄才被返回
- { "_id" : ObjectId("4e244debcac1e3490b9033d8"), "name" : "yang", "title" : "prince" }
- > db.people.dropIndex({title:1})//刪除稀疏索引之后,所有的記錄均顯示
- { "nIndexesWas" : 2, "ok" : 1 }
- > db.people.find().sort({title:1})
- { "_id" : ObjectId("4e244dc5cac1e3490b9033d7"), "name" : "Jim" }
- { "_id" : ObjectId("4e244debcac1e3490b9033d8"), "name" : "yang", "title" : "prince" }
唯一索引
MongoDB支持唯一索引,這使得不能插入在唯一索引項上已經(jīng)存在的記錄。例如,要保證firstname和lastname都是唯一的,命令如下
- > db.things.ensureIndex({firstname:1,lastname:1},{unique:true})
缺失的鍵
當一個文檔以唯一索引的方式保存到集合中去的時候,任何缺失的索引字段都會一null值代替,因此,不能在唯一索引上同時插入兩條缺省的記錄。如下:
- >db.things.ensureIndex({firstname: 1}, {unique: true});
- >db.things.save({lastname: "Smith"});
- >db.things.save({lastname: "Jones"});// 會產(chǎn)生錯誤,因為firstname會有兩個null.
重復值:
唯一索引不能夠創(chuàng)建在具有重復值的鍵上,如果你一定要在這樣的鍵上創(chuàng)建,那么想系統(tǒng)將保存第一條記錄,剩下的記錄會被刪除,只需要在創(chuàng)建索引的時候加上dropDups這個可選項即可
- >db.things.ensureIndex({firstname : 1}, {unique : true, dropDups : true})
- Dropping Indexes
刪除一個特定集合上的索引:
- >db.collection.dropIndexes();
刪除集合中的某一個索引:
- db.collection.dropIndex({x: 1, y: -1})
也可以直接執(zhí)行命令進性刪除
- db.runCommand({dropIndexes:'foo', index : {y:1}})//刪除集合foo中{y:1}的索引
- // remove all indexes:
- db.runCommand({dropIndexes:'foo', index : '*'})//刪除集合foo中所有的索引
重建索引:
可以所用如下命令重建索引:
- db.myCollection.reIndex()
- // same as:
- db.runCommand( { reIndex : 'myCollection' } )
通常這是不必要的,但是在集合的大小變動很大及集合在磁盤空間上占用很多空間時重建索引才有用。對于大數(shù)據(jù)量的集合來說,重建索引可能會很慢。
注:
MongoDB中索引是大小寫敏感的。
當更新對象是,只有在索引上的這些key發(fā)生變化時才會更新。著極大地提高了性能。當對象增長了或者必須移動時,所有的索引必須更新,這回很慢 。
索引信息會保存在system.indexes 集合中,運行 db.system.indexes.find() 能夠看到這些示例數(shù)據(jù)。
索引的字段的大小有最大限制,目前接近800 bytes. 可在大于這個值的字段上建立索引是可以的,但是該字段不會被索引,這種限制在以后的版本中可能被移除。
索引的性能
索引使得可以通過關鍵字段獲取數(shù)據(jù),能夠使得快速查詢和更新數(shù)據(jù)。
但是,必須注意的是,索引也會在插入和刪除的時候增加一些系統(tǒng)的負擔。往集合中插入數(shù)據(jù)的時候,索引的字段必須加入到B-Tree中去,因此,索引適合建立在讀遠多于寫的數(shù)據(jù)集上,對于寫入頻繁的集合,在某些情況下,索引反而有副作用。不過大多數(shù)集合都是讀頻繁的集合,所以集合在大多數(shù)情況下是有用的。
使用sort()而不需要索引
如果數(shù)據(jù)集合比較?。ㄍǔP∮?M),使用sort()而不需要建立索引就能夠返回數(shù)據(jù)。在這種情況下,做好聯(lián)合使用limit()和sort()。
關于MongoDB索引的創(chuàng)建和使用就介紹到這里,希望能對各位有所幫助,您的收獲將是我最大的快樂!
【編輯推薦】