HTML DOM與XML DOM的區(qū)別與聯(lián)系探究
這里向大家描述一下HTML DOM與XML DOM的區(qū)別與聯(lián)系,本文內容的主題便是,為什么開發(fā)者要認為“DOM Level1規(guī)范的架構”是至關重要的,其突出的重要性在哪里等等,以及還有HTMLDOM和XML DOM之間微妙的區(qū)別及內在的聯(lián)系。
大話HTML DOM與XML DOM的區(qū)別與聯(lián)系
W3C所制訂的DOM Level分為兩大模塊:Core和HTML。***個大模塊是Core核心,W3C規(guī)范是這樣描述Core的:滿足軟件開發(fā)者和Web腳本編寫者,訪問和操控產品項目中包含的可解析的HTML和XML內容。
第二個HTML模塊,規(guī)范描述為:HTML之中特定元素的功能,和恰到好處的、易用的、針對常見性任務的HTML文檔操作機制。
以上可見兩者的重要性。同時HTML模塊的意義也在于,解決了向后兼容的問題,這在當今符合DOM Level1的瀏覽器中已經可以提供適應的解決方案。
按照這樣的說法,如果您仍然不能理解上述的要義,我們則可以這樣認為,HTML文檔可以使用CoreAPI和HTMLAPI兩者;而XML文檔只能使用CoreAPI。換句話說,HTML與XML重疊的部分有CoreAPI,而HTMLAPI則是不能共享的部分,顧名思義限于HTML文檔所使用。這是我們認識Core/HTML的初步認識。
理解DOM Level1 Core
理解DOM Level1Core之要義實質在于將Core看待成為許多節(jié)點(Nodes)而組成的文檔(Document),也就是說,此文檔結構中可允許存在著大量的條目項,其每一項都可理解為“節(jié)點”。討論該結構可以以兩個方面入手:一、一切皆是節(jié)點對象(NodeObject,扁平化的角度去理解,flattenedview,乃適合于多態(tài)下的接口);二、每個對象繼承于基類節(jié)點,實現(xiàn)了節(jié)點的接口(interface,OO繼承的角度去理解)。請觀察一下這段HTML:
- viewplaincopytoclipboardprint?
- <dividdivid="myDiv">
- HelloWorld</div>
- <dividdivid="myDiv">HelloWorld</div>
這是一個閉合的div標簽。從DOM Level1的層面來分析可以有以下幾點內容:
◆標簽div可作為“節(jié)點對象NodeObject(扁平化角度,前面已述)”,或者元素對象ElementOBject(繼承的角度-元素繼承于Node)。
◆節(jié)點屬性id也可作為“節(jié)點對象NodeObject(扁平化角度)”,或者屬性對象Attr.OBject(繼承的角度-Attr繼承于Node)。
◆文本“Helloworld”也可作為“節(jié)點對象NodeObject(扁平化角度)”,字符串對象CharacterData對象(繼承的角度-CharacterData繼承于Node),Text文本對象(繼承的角度-Text繼承于CharacterData)。
稍微歸納一下,就是DOM1Core部分中一切皆是節(jié)點,節(jié)點以及其接口都可實現(xiàn)在每個對象身上(從繼承的角度理解出發(fā)),實現(xiàn)了節(jié)點接口才可以有節(jié)點的屬性、方法。——這是我們理解的前提。然后,根據(jù)特定的節(jié)點類型的不同,其接口的屬性和方法都是不同的,視乎DOM對該節(jié)點的設計而定。#p#
理解DOM Level1 HTML
我們日常工作的時候,跟HTML文檔打交道,其實就是屬于W3C所規(guī)定的DOM Level1HTML模塊內的處理工作。HTMLDOM的特性和方法不是標準的DOM實現(xiàn),是專門針對HTML同時也讓一些DOM操作變的更加簡便。HTML模塊集中表現(xiàn)在HTMLElement接口上,即為全體元素類型的對象所實現(xiàn)的接口。就該文討論的范圍而言,HTMLElement接口的參與形式與上述的Node節(jié)點接口非常地相似。一旦引入了OO設計觀,只要實現(xiàn)了HTMLElement接口的對象,就可以定義它為元素了。一份HTML文檔有相當多的都是元素,當然還有,表示文檔本身的HTMLDocument和集合容器HTMLCollection等等。
因此,要準確理解DOM1HTML的模塊,必須認識其接口是基于元素的(Element-based),而不是基于節(jié)點的(Node-based)。那樣的話,元素方式與節(jié)點方式到底又有什么區(qū)別呢(Elementv.sNode),應該如何界定兩者呢?例如節(jié)點屬性(propertiesofelements),當在“基于元素”的語境中,就是“屬性(attributes)”,并非獨立的節(jié)點對象。——盡管按照某個角度講,元素是節(jié)點的一種特例,我們仍可保留“節(jié)點”這一說法,一個標簽(tag)便是一個“節(jié)點”。假如我們要得到id屬性的字符串的值是什么,采用DOM1Core的方式就是:
- viewplaincopytoclipboardprint?
- myElement.attributes["id"].value;//從Node接口提供的屬性
- myElement.attributes["id"].value;//從Node接口提供的屬性
等于下面的方法:
- viewplaincopytoclipboardprint?
- myElement.getAttributes("id");//從Element實現(xiàn)的方法返回
- myElement.getAttributes("id");//從Element實現(xiàn)的方法返回
但使用DOM1HTML方式的話,我們僅僅如此:
- viewplaincopytoclipboardprint?
- myElement.id;myElement.id;
這般就可以獲取id了。此時此刻,你可能會認為,XML文檔本身就不一定缺省有id的屬性,而因為有你所說的HTMLElement.id屬性預先定義在API中,當然HTML中的每個元素就有id的屬性啦——這里的意思沒有錯,也不妨礙我們的理解。的確全體的HTML元素均有id一項的屬性,不管HTMLDivElement\HTMLImageElement\……
Core or HTML Module?
既然這樣,那我應該使用Core的API,還是HTML模塊的API?對于HTML的文檔來說,用Core或HTMLModuel實際差別不大。本來我們一直都不太強調這種界定,以致忽略了它們細微的差異。如果我們覺得還是模棱兩可的話,我們可進一步查探它們的明細。
個人認為處理XHTML并使用CoreAPI這樣更能夠說明XHTML的“X”,即表明這份HTML就是一份標準的XML文檔,以便與原有HTML4.1從語義上區(qū)別開來。但請記住,當處理一份XML結構的文檔的時候,自然而然就是采用Core去處理。通過XHMLHttpRequest請求執(zhí)行后所返回的responseXML結果,只能使用Core的API去處理分析,就不能夠采用HTML的了。
小結
通過文本開發(fā)者應該明白到,HTML DOM與XML DOM之間,既有區(qū)別,又有聯(lián)系。一般而言,除了上述比較外,須值得一提的就是,HTML是可以允許不Well-Form的,XML就不行。
【編輯推薦】
- XML DOM文檔對象模型解析
- 大話HTML DOM與XML DOM的區(qū)別與聯(lián)系
- 深入學習DOM模型基礎
- 深入了解JavaScript HTML DOM對象
- 術語匯編 Javascript DOM技術探究