一、前言
JDOM是Breet Mclaughlin和Jason Hunter兩大Java高手的創作成果,2000年初,JDOM作為一個開放源代碼項目正式開始研發。JDOM是一種解析XML的Java工具包。
DOM適合于當今流行的各種語言,包括Java,JavaScripte,VB,VBScript,Perl,C,C++等。它了為HTML和XML文檔提供了一個可應用于不同平臺的編程接口。W3C DOM的最新信息可從http://www.w3.org/TR2001/WD-DOM-Lever-3-Core-20010913查閱。微軟在http://msdn.microsoft.com/library/default.asp?url=/library/en-us/xmlsdk30/htm/xmconxmldomuserguide.asp上也有DOM的詳細技術信息。
DOM的設計為了適用于不同的語言,它保留了不同語言中非常相似的API。但是它并不適合于Java編程者的習慣。而JDOM作為一種輕量級API被制定,它最核心的要求是以Java為中心,只適合于Java語言,它遵循DOM的接口主要規則,除去了DOM中為了兼容各語言而與Java習慣的不同。
二、使用JDOM的前提條件
須要有SAX、DOM解析器的類文件,JDOM只是一種適合Java程序員來使用的Java XML解析器,目前流行的Java XML解析器還有:Apache Xerces Java、JAXP。
Xerces Java解析器是完全用Java編寫的XML解析器,最新版本是2.5,它支持以下標準和API:
(1) XML1.0規范(第二版本)
(2) XML命名空間規范
(3) DOM2核心標準規范
(4) SAX2核心擴展
(5) JAXP1.2 :是Sun提供的使用Java處理XML的接口API。
(6) XML Schema結構和數據類型標準
還有最好的是它開放源代碼,我們可以在http://xml.apache.org/dist/xerces-j/ 處去下載。下載文件Xerces-J-bin.2.5.0.zip。
解壓下載文件,得到四個壓縮包加到項目的路徑中(其實不要全加,但不熟的情況下考慮這么做)。
JDOM的二進制版本下載:http://www.jdom.org/downloads/index.html
把解壓后的jdom.jar文件加到項目的類路徑中,另外便于調試,還要下載它的源代碼。
三、使用JDOM解析XML
好了,現在該是正題了。下面通過一個簡單的例子說明一下怎么用JDOM這一適合Java程序員習慣的工具包來解析XML文檔。
為了簡單,我用了如下XML作為要解析的XML文件:
1
2
3
4
5
6
7
|
<?xml version= "1.0" encoding= "gb2312" ?> <books> <book email= "zhoujunhui" > <name>rjzjh</name> <price> 60.0 </price> </book> </books> |
夠簡單的吧,但它對于我們關心的東西都有了,子節點,屬性。
下面是用于解析這個XML文件的Java文件:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
|
public JDomParse(){ String xmlpath= "library.xml" ; SAXBuilder builder= new SAXBuilder( false ); try { Document doc=builder.build(xmlpath); Element books=doc.getRootElement(); List booklist=books.getChildren( "book" ); for (Iterator iter = booklist.iterator(); iter.hasNext();) { Element book = (Element) iter.next(); String email=book.getAttributeValue( "email" ); System.out.println(email); String name=book.getChildTextTrim( "name" ); System.out.println(name); book.getChild( "name" ).setText( "alterrjzjh" ); } XMLOutputter outputter= new XMLOutputter(); outputter.output(doc, new FileOutputStream(xmlpath)); } catch (JDOMException e) { e.printStackTrace(); } catch (IOException e) { e.printStackTrace(); } } public static void main(String[] args) { new JDomParse(); } } |
不到30行代碼,現在我對代碼解釋一下:
四、解釋代碼
引用的類:
1
2
3
4
5
6
7
8
9
10
|
import java.io.FileOutputStream; import java.io.IOException; import java.util.Iterator; import java.util.List; //下面是引用到JDOM中的類 import org.jdom.Document; import org.jdom.Element; import org.jdom.JDOMException; import org.jdom.input.SAXBuilder; import org.jdom.output.XMLOutputter; |
(1)使用JDOM首先要指定使用什么解析器。如:
SAXBuilder builder=new SAXBuilder(false);
這表示使用的是默認的解析器
(2)得到Document,我們以后要進行的所有操作都是對這個Document操作的:
1
|
Document doc=builder.build(xmlpath); |
(3)得到根元素:
1
|
Element books=doc.getRootElement(); |
在JDOM中所有的節點(DOM中的概念)都是一個org.jdom.Element類,當然他的子節點也是一個org.jdom.Element類。
(4)得到元素(節點)的集合:
1
|
List booklist=books.getChildren( "book" ); |
這表示得到“books”元素的所在名稱為“book”的元素,并把這些元素都放到一個List集合中
(5)輪循List集合
1
2
3
|
for (Iterator iter = booklist.iterator(); iter.hasNext();) { Element book = (Element) iter.next(); } |
還有一種輪循方法是:
1
2
3
|
for ( int i= 0 ;I<booklist.size();I++){ Element book=(Element)booklist.get(i); } |
(6)取得元素的屬性:
1
|
String email=book.getAttributeValue( "email" ); |
取得元素book的屬性名為“email”的屬性值。
(7)取得元素的子元素(為最低層元素)的值:
1
|
String name=book.getChildTextTrim( "name" ); |
注意的是,必須確定book元素的名為“name”的子元素只有一個。
(8)改變元素(為最低層元素)的值:
1
|
book.getChild( "name" ).setText( "alterrjzjh" ); |
這只是對Document的修改,并沒有在實際的XML文檔中進行修改
(9)保存Document的修改到XML文件中:
1
2
|
XMLOutputter outputter= new XMLOutputter(); outputter.output(doc, new FileOutputStream(xmlpath)); |
我們先要有一個XMLOutputter類,再把已經修改了的Document保存進XML文檔中。