通過DB2 9 XML能獲取什么?
此文章主要講述的是在實(shí)際操作中我們大家希望通過 DB2 9 XML 來獲取什么?在開發(fā) pureXML與 DB2 9 數(shù)據(jù)庫的 5 年中,IBM公司深入研究了 XML 的性質(zhì)(XML 具有強(qiáng)大的靈活性,同時(shí)也非常繁瑣),發(fā)現(xiàn)了需要改進(jìn)的五個(gè)方面。
IBM 主要關(guān)注兩個(gè)性能因素:存儲(chǔ)模型和查詢優(yōu)化。
XML 數(shù)據(jù)由一個(gè)層次化的樹結(jié)構(gòu)表示,通常包含多個(gè)層和大量節(jié)點(diǎn),因此這種格式很難優(yōu)化和編制索引。它還涉及某種形式的壓縮。因此,XML 查詢可能變得非常復(fù)雜。
存儲(chǔ) XML 數(shù)據(jù)的一種常用方法是字符大對(duì)象(CLOB)。與二進(jìn)制大對(duì)象(BLOB)一樣,CLOB 通常作為一個(gè)整體存儲(chǔ),很少為編制索引或查詢優(yōu)化進(jìn)行預(yù)處理。另一種方法是把 XML 數(shù)據(jù) “分解” 為關(guān)系數(shù)據(jù)的列;這種方法需要復(fù)雜的解析技術(shù),通常使用大量存儲(chǔ)空間。
DB2 pureXML 把 XML 數(shù)據(jù)存儲(chǔ)為經(jīng)過預(yù)先解析的層次化格式,這種格式反映數(shù)據(jù)的底層嵌套結(jié)構(gòu)。這種格式支持編制復(fù)雜的索引,并允許對(duì)物理存儲(chǔ)中的數(shù)據(jù)進(jìn)行壓縮。在執(zhí)行查詢時(shí),pureXML 把 XQuery 和 SQL/XML 查詢轉(zhuǎn)換為一種在多方面(跨語言、查詢重寫、優(yōu)化索引和成本)經(jīng)過優(yōu)化的統(tǒng)一格式。XML 壓縮、查詢優(yōu)化以及關(guān)系和 XML 處理的混合(在 DB2 9.5 中還改進(jìn)了插入和更新性能)改進(jìn)了數(shù)據(jù)庫的處理性能;IBM 的測(cè)試和真實(shí)項(xiàng)目表明,與 DB2 V8 或其他 DBMS 中的相似操作相比,速度提高了 10 到 20 倍(參見相關(guān)內(nèi)容中 “成功帶來的喜悅”部分)。
更適合 DB2 9 XML 的模型
pureXML 的性能特點(diǎn)還包括其適應(yīng)性。要點(diǎn):XML 數(shù)據(jù)并不會(huì)取代關(guān)系數(shù)據(jù)。對(duì)于標(biāo)準(zhǔn)的金融業(yè)務(wù),XML 數(shù)據(jù)很難超越關(guān)系數(shù)據(jù)庫,但是 RDBMS 很難處理出版物,比如整本書、雜志或期刊。如果應(yīng)用程序中的數(shù)據(jù)具有復(fù)雜的層次結(jié)構(gòu),或者包含大量非結(jié)構(gòu)化信息,RDBMS 也很難處理。
例如,生命科學(xué)組織正在把許多常用數(shù)據(jù)由各種專有格式轉(zhuǎn)換為 XML。在某些情況下,對(duì)于難以在傳統(tǒng) RDBMS 中存儲(chǔ)和提取的數(shù)據(jù),XML 格式提供了優(yōu)化的數(shù)據(jù)訪問路徑,這使 XML 數(shù)據(jù)庫在根本上具有顯著的性能優(yōu)勢(shì)。
XML DBMS 還有一個(gè)優(yōu)點(diǎn):它們能夠通過 Web 服務(wù)或其他方法與 DB2 9 XML 應(yīng)用程序直接通信。因?yàn)?XML 在因特網(wǎng)上使用廣泛,應(yīng)用程序之間的通信也大量采用 XML 格式,所以讓整個(gè)通信鏈(應(yīng)用程序 - 消息 - 數(shù)據(jù)庫)都采用 XML 格式是很有意義的。
IBM 的 pureXML 在技術(shù)方面有許多重要的創(chuàng)新(68 項(xiàng)新專利!),但是 IBM 關(guān)系/XML 模型真正的價(jià)值在于它在主流企業(yè)應(yīng)用程序中表現(xiàn)出的性能。
以上的相關(guān)內(nèi)容就是對(duì)通過 DB2 9 XML 獲得什么的介紹,望你能有所收獲
【編輯推薦】