解析數(shù)據(jù)庫未來的方向
本文是以采訪的Paul Grabscheid的資料作為題材,主要以問答的方式向大家解密數(shù)據(jù)庫未來的發(fā)展方向。
Paul Grabscheid是InterSystems公司戰(zhàn)略規(guī)劃部門副總裁,他一直在思考數(shù)據(jù)庫的未來方向。本文由DDJ記者對話Paul Grabscheid先生(簡稱PG),看他是怎么回答的。
記者:InterSystems同時(shí)提供了面向普通目的和醫(yī)療保健業(yè)的數(shù)據(jù)庫產(chǎn)品,醫(yī)療保健業(yè)需要什么特殊的數(shù)據(jù)庫呢?
PG:雖然InterSystems的Cache數(shù)據(jù)庫在醫(yī)療保健業(yè)得到了廣泛使用,它吸引人的特性使得在其它領(lǐng)域也受到越來多的重視,首先,臨床方面要處理大量的非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù),醫(yī)療記錄中的數(shù)據(jù)和收集數(shù)據(jù)的格式與普通數(shù)據(jù)是完全不一樣的,存儲方式也在不斷發(fā)展,所有這一切都要求對象模型要具有內(nèi)在的靈活性,既要捕捉到豐富的數(shù)據(jù),存儲也要有效地支持才行,也要使用新的數(shù)據(jù)類型,例如,目前越來越多的基因組信息被捕獲用來診斷和治療。醫(yī)療保健的另一個(gè)挑戰(zhàn)是要讓數(shù)據(jù)模型看起來更優(yōu)美。臨床數(shù)據(jù)數(shù)年后仍然有價(jià)值,而不象其它領(lǐng)域那樣可能在幾周內(nèi)或幾個(gè)月內(nèi)有價(jià)值,這就需要增加新的數(shù)據(jù)、新的數(shù)據(jù)類型和新的關(guān)系,并且不能破壞現(xiàn)有應(yīng)用程序和結(jié)構(gòu)、以及數(shù)據(jù)庫重組或卸載/重新加載周期,對象數(shù)據(jù)庫技術(shù)有助于通過模式演化,使增量“無損”更改數(shù)據(jù)庫結(jié)構(gòu)成為可能,并通過對象概念的多態(tài)性為不同的對象類型或版本提供安全的訪問。
記者:在對象/關(guān)系領(lǐng)域,總是要預(yù)防不匹配的問題。
PG:我認(rèn)為預(yù)防不匹配變得越來越重要,十多年前,對象的概念被強(qiáng)化了,但學(xué)習(xí)起來很困難,這些概念都來自于國外專注于文件和數(shù)據(jù)庫開發(fā)的開發(fā)商,相比傳統(tǒng)的方法,開發(fā)一套基于對象的應(yīng)用程序需要更多的步驟和工作,時(shí)至今日,情況正好相反:許多(甚至大多數(shù))開發(fā)商都在思考它們正在嘗試解決的問題,以及它們用來解決問題的數(shù)據(jù)模型。對象概念中的繼承、封裝和多態(tài)性已經(jīng)成為方案框架和構(gòu)建應(yīng)用的天然方式,目前,在后端使用關(guān)系來存儲反倒增加了額外的開發(fā)步驟,因?yàn)樾枰獙?shí)現(xiàn)對象--關(guān)系之間的映射。
在設(shè)計(jì)時(shí)就要完成從關(guān)系到對象數(shù)據(jù)模型的轉(zhuǎn)換,而不是在編碼或執(zhí)行時(shí)才進(jìn)行轉(zhuǎn)換,因?yàn)閼?yīng)用程序數(shù)據(jù)模型變得越來越復(fù)雜,富對象模型的優(yōu)點(diǎn)是它天生就表現(xiàn)了雙向關(guān)系、控制和分層,數(shù)據(jù)庫中的對象模型減小了開發(fā)成本,相比關(guān)系數(shù)據(jù)庫中使用多個(gè)JOIN而言,它顯著地降低了運(yùn)行時(shí)的開銷。
記者:我們通常熟悉的是“事務(wù)數(shù)據(jù)庫”,但什么是“事務(wù)位圖索引”呢?
PG:傳統(tǒng)上,用于事務(wù)處理和分析的數(shù)據(jù)往往是分開的,分析通常會建立數(shù)據(jù)倉庫,這種分離機(jī)制使業(yè)務(wù)系統(tǒng)的性能和安全性都有所提升,大多數(shù)數(shù)據(jù)倉庫主要是用于分析長期的數(shù)據(jù),并不需要最新的精確到分鐘的數(shù)據(jù)。通常,一周或一個(gè)月從業(yè)務(wù)系統(tǒng)數(shù)據(jù)庫往數(shù)據(jù)倉庫更新一次數(shù)據(jù)就已經(jīng)足夠了。位圖索引是數(shù)據(jù)倉庫最佳的方法:它為復(fù)雜查詢提供了優(yōu)秀的性能,即使在insert、update和delete操作時(shí)性能相對降低了,但也不會對事務(wù)系統(tǒng)產(chǎn)生惡劣影響,皆大歡喜。
現(xiàn)在焦點(diǎn)已經(jīng)轉(zhuǎn)向利用商務(wù)智能和其他分析技術(shù)作為應(yīng)用程序的一部分,以便支持范圍更廣的每日決策需要,為了滿足這種需求,我們已經(jīng)開始以一種新的方法運(yùn)行位圖索引,既滿足高性能查詢,又滿足高性能更新,從技術(shù)上來看,使用壓縮技術(shù)替換簡單的每行一位的存儲技術(shù),使存儲效果更有效、更理想,在數(shù)據(jù)庫引擎中以更優(yōu)秀的方法處理位圖,這種事務(wù)位圖索引技術(shù)引發(fā)了實(shí)時(shí)分析開發(fā)的新浪潮。
記者:“數(shù)據(jù)庫即服務(wù)”是一個(gè)新興主題,特別是云計(jì)算,對于開發(fā)者而言,這意味著什么?對于數(shù)據(jù)庫廠商,這又意味著什么?
PG:我不確定“數(shù)據(jù)庫即服務(wù)”會成為一個(gè)成功的商業(yè)概念,因?yàn)槟壳暗内厔菔腔ㄥX購買某種應(yīng)用程序服務(wù),我所接觸過的客戶對“架構(gòu)即服務(wù)”沒什么興趣,數(shù)據(jù)庫即服務(wù)要求系統(tǒng)管理簡單,但目前在企業(yè)級數(shù)據(jù)庫軟件上還看不到這一點(diǎn),還需要能夠透明地增加或移除系統(tǒng)功能,應(yīng)用不能中斷,在這些領(lǐng)取的改進(jìn)將有助于降低操作成本,并提升整個(gè)系統(tǒng)的可用性。
數(shù)據(jù)庫的一步步的發(fā)展大家是有目共睹的,相信數(shù)據(jù)庫的明天一定會是更加的輝煌,不會讓用戶們失望,讓我們共同期待吧。
【編輯推薦】