自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

應(yīng)用MSXML的DOM模型處理XML

開(kāi)發(fā)
本文主要通過(guò)講述MSXML類庫(kù)的使用來(lái)理解XML文件處理模型中基于文檔對(duì)象模型(DOM)的處理。

DOM模型在MSXML類庫(kù)中的主要表現(xiàn)為把XML文件導(dǎo)入內(nèi)存,形成一個(gè)IXMLDOMDocument,再把其中的每一個(gè)部件都用一個(gè)接口對(duì)應(yīng)起來(lái)。因?yàn)檫€沒(méi)用MSXML進(jìn)行過(guò)XSLT格式化XML文件,所以這相關(guān)的也只好避而不談了。先來(lái)個(gè)有XML基本部件的文本:

   (1)<?xml version='1.0' encoding='GB2312'?>
  (2)<?xml-stylesheet type='text/xsl' href='/expert/Xsl/2.xsl'?>
  (3)<body>
  (4) ?。糲ode1 id=”text”>文本</code>
  (5)  <code2 id=”cdata”>
  (6) ?。?[CDATA[
  (7)  這里是CDATA的內(nèi)容,可以放類似’<’等可能會(huì)和XML控制信息有沖突的內(nèi)容
  (8)  ]]>
  (9) ?。?code>
  (10)</body>

為了表述方便,在第一列都放上了行號(hào)。首先從(1)~(10)夠成了一個(gè)Document,在MSXML中對(duì)應(yīng)IXMLDOMDocument接口;(1)行、(2)行對(duì)應(yīng)MSXML中的接口為IXMLDOMProcessingInstruction;(3)行到(10)行則為一個(gè)Root Element,對(duì)應(yīng)的接口為IXMLDOMElement,(3)里面包含的多個(gè)也是element,不過(guò)是body的下一層element。需要注意的是Root只能有一個(gè),Root下面無(wú)論多深,理論上允許無(wú)數(shù)多個(gè)(?),且允許名稱重復(fù);(4)和(5)里面各有一個(gè)id=”?”這是一個(gè)attribute(注意:(1)和(2)行version;encoding;type;href等也是),對(duì)應(yīng)MSXML里的IXMLDOMAttribute;(4)里面的“文本”看起來(lái)和(7)這一行是差不多的,都是文本信息,很多人以為都可以通過(guò)get_text()直接得到(不久以前我也以為),其實(shí)是錯(cuò)的。對(duì)于“文本”是可以通過(guò)(4)這個(gè)element直接get_text()獲取,對(duì)應(yīng)于IXMLDOMText,但如果在(5)這個(gè)element直接get_text()就會(huì)出錯(cuò),原因?CDATA是區(qū)別于“文本”的另外一種類型,對(duì)應(yīng)于IXMLDOMCDATASection,如何獲取,后面再提。現(xiàn)在整個(gè)XML的基本框架似乎出來(lái)了:

<IXMLDOMDocument>
 ?。糏XMLDOMProcessingInstruction />
 ?。糏XMLDOMProcessingInstruction />
  <IXMLDOMElement (根,只能有一個(gè))>
   <IXMLDOMElement IXMLDOMAttribute>
  IXMLDOMText
 ?。? IXMLDOMElement >
   <IXMLDOMElement IXMLDOMAttribute>
  IXMLDOMCDATASection
 ?。? IXMLDOMElement >
 ?。糏XMLDOMElement>
 ?。?IXMLDOMDocument>

但是,看看很多關(guān)于MSXML的教程用到另外一個(gè)接口IXMLDOMNode,這個(gè)怎么回事?和上面的IXMLDOMElement有什么關(guān)系?前面用了這么長(zhǎng)時(shí)間的MSXML經(jīng)常就是在這個(gè)地方弄混,以至無(wú)所進(jìn)展,最近要在C++Builder5下面使用XML解析,可是沒(méi)有TXMLDocument控件,想自己封裝一下MSXML的一些使用才發(fā)現(xiàn)其中的奧妙。在DOM模型中把包括Document、ProcessingInstruction、Attribute、Element、TextNode、CDATASection等都看作是一個(gè)個(gè)Node,在MSXML中實(shí)現(xiàn)接口的時(shí)候表現(xiàn)為這些對(duì)象都是從Node派生出來(lái)的,要理解Node和這一些接口的關(guān)系關(guān)鍵是要看清楚各接口之間的派生關(guān)系。為什么要添加這一個(gè)Node接口呢?目的是為了使XML各要素之間聯(lián)結(jié)起來(lái),不至于松散。

再加上另外兩個(gè)接口IXMLDOMNodeList和IXMLDOMNamedNodeMap。其中IXMLDOMNamedNodeMap主要使用在聯(lián)結(jié)同一個(gè)Element的各Attribute,因?yàn)橥粋€(gè)Element的Attribute必須保證兩兩不能沖突,而IXMLDOMNodeList則用于聯(lián)結(jié)其他的幾個(gè)要素ProcessingInstruction、Element、TextNode、CDATASection等,而這幾個(gè)要素比如Element,在同一個(gè)層是允許相同名稱重復(fù)出現(xiàn)的。上面的聯(lián)結(jié)并沒(méi)有包括Document這個(gè)Node,因?yàn)镈ocument是整個(gè)XML的第一個(gè)Node,不可能也不允許出現(xiàn)在IXMLDOMNodeList和IXMLDOMNamedNodeMap下面。這段說(shuō)法我也算是經(jīng)過(guò)代碼證實(shí)過(guò)的吧!把MSXML的Document作為第一個(gè)Node,然后通過(guò)NamedNodeMap編歷該層的所有Attribute,再通過(guò)NodeList遞歸循環(huán)下一層的所有Node??梢钥吹竭@樣的一個(gè)樹(shù)狀結(jié)構(gòu)(其中的attribute在該行括號(hào)列出,縮進(jìn)表示所在層):

#document
  xml (version;encoding)
  xml-stylesheet (type; href)
  body
   code1 (id)
  #text
   code2 (id)
  #cdata-section

從上面打印出來(lái)的信息可以看出TextNode,CDATASection是當(dāng)作Element的下一層Node來(lái)處理的。get_text()只是為了方便使用TextNode的一個(gè)捷徑,對(duì)CDATASection通過(guò)get_text()訪問(wèn)會(huì)出錯(cuò),則可考慮通過(guò)下一層Node的第一個(gè)Node來(lái)獲取。方法:

MSXML::IXMLDOMNodePtr child;
  child = parent->childNodes->get_item(0);
  if (child != NULL)
  text = child->get_nodeValue();

在遞歸循環(huán)的時(shí)候,通常我們并不能預(yù)知這一個(gè)Node是什么類型的。為了知道這一個(gè)Node是Element還是TextNode,或者其他類型,可以通過(guò)IXMLDOMNode::nodeType來(lái)獲取,這是一個(gè)枚舉類型,有如下取值(從這也可以看出,上面這個(gè)XML文本并沒(méi)有涵蓋XML所有要素):

NODE_ELEMENT (1)
  NODE_ATTRIBUTE (2)
  NODE_TEXT (3)
  NODE_CDATA_SECTION (4)
  NODE_ENTITY_REFERENCE (5)
  NODE_ENTITY (6)
  NODE_PROCESSING_INSTRUCTION (7)
  NODE_COMMENT (8)
  NODE_DOCUMENT (9)
  NODE_DOCUMENT_TYPE (10)
  NODE_DOCUMENT_FRAGMENT (11)
  NODE_NOTATION (12)

#p#

好了,下面應(yīng)該可以把“XML文件的處理思考”里面出現(xiàn)的一些問(wèn)題一個(gè)個(gè)羅列出來(lái)了吧:

問(wèn)題一:最大的問(wèn)題,通過(guò)路徑來(lái)找到比較深入的一個(gè)節(jié)點(diǎn)

在這篇文章中通過(guò)遞歸調(diào)用函數(shù)來(lái)實(shí)現(xiàn)這個(gè)功能,完全沒(méi)有必要,算是多此一舉了。DOM模型中自身帶的IXMLDOMNode::SelectSingleNode和IXMLDOMNode::SelectNodes(XPath)實(shí)現(xiàn)了比這個(gè)遞歸調(diào)用更完美的功能。簡(jiǎn)單說(shuō)一下SelectSingleNode的使用方法(msdom是IXMLDOMDocument實(shí)例)

MSXML::IXMLDOMNodePtr parent, child;
  parent = msdom->documentElement;
  //child為code1類型Element
  child = parent->selectSingleNode(“/code1”);
  //child為code1的id類型Attribute
  child = parent->selectSingleNode(“/code1@id”);
  //child名為code1且Attribute id=’text’的那個(gè)Element類型Element
  child = parent->selectSingleNode(“/code1@[id=’text’]”);

…其它高深點(diǎn)的用法待后研究,為XPath相關(guān)。

問(wèn)題二:C++ Builder6里面的TXMLDocument并不單純是對(duì)MSXML的封裝

為了在C++ Builder 5下面封裝出一個(gè)類似的控件來(lái),找了一些相關(guān)資料,發(fā)現(xiàn)MSXML、OpenXML等DOM模型的解析器都是同一套接口(希望我沒(méi)有弄錯(cuò)),只是內(nèi)部實(shí)現(xiàn)不同。TXMLDocument通過(guò)設(shè)置Ventor可以設(shè)置使用不同的解析器,但是在C++Builder里面使用方法卻是完全相同的。默認(rèn)好像是使用MSXML解析,比較優(yōu)劣,MSXML需在客戶端注冊(cè)較新的msxml.dll類庫(kù);SAX的需要附帶較大的dll;OpenXML因?yàn)槭侵苯邮褂靡粋€(gè).pas文件編譯,直接生成到了可執(zhí)行文件。

問(wèn)題三:在文章中遍歷NodeList使用了IEnum接口

有點(diǎn)殺雞用牛刀之嫌,現(xiàn)在的遍歷可以這樣:

for (int i = 0; i < nodelist->get_length(); i++)
  {
  child = nodelist->get_item((long)i);
  name = child->get_nodeName();
  }

想想原來(lái)做的時(shí)候應(yīng)該也用過(guò)這個(gè)方法,不過(guò)當(dāng)時(shí)不知道Node和Element之間的關(guān)系,胡亂執(zhí)行下面這樣的轉(zhuǎn)換所以轉(zhuǎn)換出的element == NUL,就以為此路不通。

IXMLDOMElementPtr element = (IXMLDOMNodePtr)node;

問(wèn)題三:到后來(lái)補(bǔ)的一段appendChild的操作,將createElement出來(lái)的Element直接轉(zhuǎn)換成Node再appendChild。其實(shí),這應(yīng)該是最基礎(chǔ)的一個(gè)C++知識(shí),關(guān)鍵是要看清MSXML實(shí)現(xiàn)的Com里面也帶有了C++的這種技巧。

現(xiàn)在再來(lái)看看C++ Builder 5里面怎么解決沒(méi)有TXMLDocument控件,要使用MSXML類庫(kù)有什么辦法。

最開(kāi)始想到的是使用import語(yǔ)句的方法,即

#import "C:Windowssystem32MSXML.DLL" named_guids

可是,import進(jìn)來(lái)能生成tlb和tlh文件,進(jìn)行編譯卻無(wú)法通過(guò),總提示缺少了些什么,或有一些函數(shù)未能導(dǎo)出來(lái)(對(duì)了,可以在VC++里面import,然后復(fù)制生成的tlb和tlh到C++Builder項(xiàng)目)。于是,直接使用C++ Builder里面自帶的TVariant類進(jìn)行COM實(shí)例化,調(diào)用函數(shù),屬性(OleFunction,OlePropertyGet,OlePropertySet)等。例:

TVariant varMSDOM = CreateOleObject(“MSXML.DOMDocument”);
varMSDOM.OleFunction(L“l(fā)oad”, L”c:tmp.xml”);
TVariant varDoc = varMSDOM.OlePropertyGet(“documentElement”);

直覺(jué)是這種調(diào)用方法是會(huì)比import進(jìn)來(lái)的調(diào)用速度要慢。差別好像是import直接通過(guò)虛函數(shù)表查找函數(shù)指針進(jìn)行調(diào)用;OleFunction這些則通過(guò)IDispatch接口的invoke函數(shù),間接調(diào)用,而且不能調(diào)用import進(jìn)來(lái)name_guids的那些函數(shù),如get_nodeName(BSTR *)。不管怎么樣,通過(guò)TVariant還是基本能夠滿足要求,函數(shù)的調(diào)用。

然后,突然發(fā)現(xiàn)C++ Builder的Project上有個(gè)Import From Type Library的菜單,也嘗試一下。tlb和tlh文件都生成了,加入工程編譯一下,能夠通過(guò),不過(guò)tlh里面的定義,和調(diào)用方法卻和VC里面的import進(jìn)來(lái)有些不同:

1. VC里面的實(shí)例化直接用智能指針如:

MSXML::IXMLDOMDocumentPtr msdom;
msdom.CreateInstance(__uuidof(MSXML::DOMDocument));

C++Builder里面的實(shí)例化,則通過(guò)另外一個(gè)編譯器封裝的對(duì)象來(lái)實(shí)現(xiàn)

TCOMIXMLDOMDocument i_xmldocument = CoDOMDocument::Create();
IXMLDOMDocumentPtr msdom = (IXMLDOMDocumentPtr) i_xmldocument;

TCOMIXMLDOMDocument的定義在MSXML2_TLB.h里面可以找到

typedef TComInterface TCOMIXMLDOMDocument;

2. C++Builder里面也有IXMLDOMDocumentPtr msdom,可是這個(gè)指針卻不能直接用于判斷是否等于NULL,編譯器會(huì)提示錯(cuò)誤,而應(yīng)改為:

if ((IXMLDOMDocument *)msdom == NULL)

上面在C++Builder下面使用MSXML的經(jīng)驗(yàn),延伸到其它類型的COM的自動(dòng)化(automation),應(yīng)該是不會(huì)有什么問(wèn)題的!不是嗎?

【編輯推薦】

  1. 在ASP.NET中使用Treeview控件和XML
  2. 如何利用Scala簡(jiǎn)化XML處理
  3. 通過(guò)Java編程處理XML服務(wù)定義
責(zé)任編輯:楊鵬飛 來(lái)源: mblogger
相關(guān)推薦

2010-09-28 10:03:15

DOM文檔對(duì)象模型

2010-09-28 11:03:19

XML DOM

2010-09-28 11:11:23

XML DOMHTML DOM

2010-09-09 17:19:07

HTML DOMXML DOM

2009-02-27 17:15:05

XMLDOMXPath

2010-09-28 10:24:50

HTML DOMXML DOM

2011-12-28 10:57:37

2013-06-08 13:29:27

Android開(kāi)發(fā)DOM讀取XMLXML解析

2010-09-09 13:55:47

XML DOM

2010-09-28 09:33:25

DOM模型

2010-09-09 13:40:19

XML DOM

2009-09-10 17:44:36

DOM模型INQ模型

2022-07-01 07:31:18

AhooksDOM場(chǎng)景

2009-12-02 14:14:06

PHP DOM-XML

2010-09-09 13:12:29

XML DOM

2010-09-28 10:40:32

HTML DOM

2010-09-09 16:17:10

PHPXMLXML DOM

2012-04-26 08:29:22

DOM

2010-09-28 13:24:34

DOM文檔對(duì)象模型

2010-09-28 09:43:37

DOM文檔對(duì)象模型
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)