數(shù)據(jù)庫技術(shù)的全新概念:文檔數(shù)據(jù)庫
從1989年起,Lotus通過其群件產(chǎn)品Notes提出了數(shù)據(jù)庫技術(shù)的全新概念-"文檔數(shù)據(jù)庫",文檔數(shù)據(jù)庫區(qū)別于傳統(tǒng)的其它數(shù)據(jù)庫,它是用來管理文檔。在傳統(tǒng)的數(shù)據(jù)庫中,信息被分割成離散的數(shù)據(jù)段,而在文檔數(shù)據(jù)庫中,文檔是處理信息的基本單位。一文檔可以很長、很復(fù)雜、可以無結(jié)構(gòu),與字處理文檔類似。
文檔數(shù)據(jù)庫與五、六十年代管理數(shù)據(jù)的文件系統(tǒng)不同,文檔數(shù)據(jù)庫仍屬于數(shù)據(jù)庫范疇。首先,文件系統(tǒng)中的文件基本上對應(yīng)于某個(gè)應(yīng)用程序。當(dāng)不同的應(yīng)用程序所需要的數(shù)據(jù)有部分相同時(shí),也必須建立各自的文件,而不能共享數(shù)據(jù),而文檔數(shù)據(jù)庫可以共享相同的數(shù)據(jù)。因此,文件系統(tǒng)比文檔數(shù)據(jù)庫數(shù)據(jù)冗余度更大,更浪費(fèi)存儲空間,且更難于管理維護(hù)。其次,文件系統(tǒng)中的文件是為某一特定應(yīng)用服務(wù)的,所以,要想對現(xiàn)有的數(shù)據(jù)再增加一些新的應(yīng)用是很困難的,系統(tǒng)不容易擴(kuò)充。數(shù)據(jù)和程序缺乏獨(dú)立性。而文檔數(shù)據(jù)庫具有數(shù)據(jù)的物理獨(dú)立性和邏輯獨(dú)立性,數(shù)據(jù)和程序分離。
文檔數(shù)據(jù)庫也不同于關(guān)系數(shù)據(jù)庫,關(guān)系數(shù)據(jù)庫是高度結(jié)構(gòu)化的,而Notes的文檔數(shù)據(jù)庫允許創(chuàng)建許多不同類型的非結(jié)構(gòu)化的或任意格式的字段,與關(guān)系數(shù)據(jù)庫的主要不同在于,它不提供對參數(shù)完整性和分布事務(wù)的支持,但和關(guān)系數(shù)據(jù)庫也不是相互排斥的,它們之間可以相互交換數(shù)據(jù),從而相互補(bǔ)充、擴(kuò)展。