首页 > 编程语言 >java dom4j操作xml

java dom4j操作xml

时间:2023-09-20 12:07:20浏览次数:42  
标签:xml java dom4j price 元素 选取 book bookstore 节点


SAXReader reader = new SAXReader();    
Document doc = reader.read(...);    
List childNodes = doc.selectNodes("//Config/Child/ChildNode");    
for(Object obj:childNodes) {    
      Node childNode = (Node)obj;    
      String name = childNode.valueOf("@name");    
      String text = childNode.getText();    
}



一.Document 对象相关   

      1. 读取XML文件,获得document对象.   
       

SAXReader reader = new SAXReader();   
            Document   document = reader.read(new File("input.xml"));



       2.解析XML形式的文本,得到document对象.   
     

String text = "<members></members>";   
            Document document = DocumentHelper.parseText(text);



      3.主动创建document 对象.   
        

Document document = DocumentHelper.createDocument();   
            Element root = document.addElement("members");// 创建根节点

二.节点相关   

1.获取文档的根节点.   
            Element rootElm = document.getRootElement();   
      2.取得某节点的单个子节点.   
            Element memberElm=root.element("member");// "member"是节点名   
      3.取得节点的文字   
            String text=memberElm.getText(); 也可以用:   
            String text=root.elementText("name");这个是取得根节点下的name字节点的文字.   
      4.取得某节点下名为"member"的所有字节点并进行遍历.   
            List nodes = rootElm.elements("member");   
            for (Iterator it = nodes.iterator(); it.hasNext();) {   
                  Element elm = (Element) it.next();   
                  // do something   
            }   
      5.对某节点下的所有子节点进行遍历.   
             for(Iterator it=root.elementIterator();it.hasNext();){   
                  Element element = (Element) it.next();   
                   // do something   
            }   
      6.在某节点下添加子节点.   
            Element ageElm = newMemberElm.addElement("age");   
      7.设置节点文字.   
            ageElm.setText("29");   
      8.删除某节点.   
            parentElm.remove(childElm);// childElm是待删除的节点,parentElm是其父节点   
      9. 添加一个CDATA节点.   
            Element contentElm = infoElm.addElement("content");   
            contentElm.addCDATA(diary.getContent());


三. 属性相关.   

1.取得某节点下的某属性   
            Element root=document.getRootElement();       
            Attribute attribute=root.attribute("size");// 属性名name
      2.取得属性的文字   
            // 也可以用
            String text=attribute.getText();   
            //  这个是取得根节点下name字节点的属性firstname的值:  
            String text2=root.element("name").attributeValue("firstname");
      3.遍历某节点的所有属性    
            Element root=document.getRootElement();        
            for(Iterator it=root.attributeIterator();it.hasNext();){    
                 Attribute attribute = (Attribute) it.next();    
                 String text=attribute.getText();    
                 System.out.println(text);    
            }
      4.设置某节点的属性和文字.    
            newMemberElm.addAttribute("name", "sitinspring");    
      5.设置属性的文字   
           Attribute attribute=root.attribute("name");    
           attribute.setText("sitinspring");    
      6.删除某属性    
           Attribute attribute=root.attribute("size");// 属性名name    
           root.remove(attribute);



四.将文档写入XML文件.    
      

1.文档中全为英文,不设置编码,直接写入的形式.    
            XMLWriter writer = new XMLWriter(new FileWriter("output.xml"));    
            writer.write(document);    
            writer.close();    
      2.文档中含有中文,设置编码格式写入的形式.    
            OutputFormat format = OutputFormat.createPrettyPrint();    
            format.setEncoding("GBK");    // 指定XML编码            
            XMLWriter writer = new XMLWriter(new FileWriter("output.xml"),format);                    
            writer.write(document);    
            writer.close();



五.字符串与XML的转换    

1.将字符串转化为 XML    
            String text = "<members> <member>sitinspring</member> </members>";    
            Document document = DocumentHelper.parseText(text);    
      2.将文档或节点的XML转化为字符串.    
            SAXReader reader = new SAXReader();    
            Document   document = reader.read(new File("input.xml"));                
            Element root=document.getRootElement();                    
            String docXmlText=document.asXML();    
            String rootXmlText=root.asXML();    
            Element memberElm=root.element("member");    
            String memberXmlText=memberElm.asXML();             {     dom4j API 包含一个解析 XML 文档的工具。本文中将使用这个解析器创建一个示例 XML 文档。清单 1 显示了这个示例 XML 文档,catalog.xml。


      清单 1. 示例 XML 文档(catalog.xml)     

<?xml version="1.0" encoding="UTF-8"?>     
            <catalog>     
                  <!--An XML Catalog-->     
                  <?target instruction?>    
                  <journal title="XML Zone" publisher="IBM developerWorks">     
                        <article level="Intermediate" date="December-2001">    
                               <title>Java configuration with XML Schema</title>     
                               <author>     
                                     <firstname>Marcello</firstname>     
                                     <lastname>Vitaletti</lastname>     
                               </author>    
                         </article>    
                  </journal>     
            </catalog>



            
            然后使用同一个解析器修改 catalog.xml,清单 2 是修改后的 XML 文档,catalog- modified.xml。    
      
      清单 2. 修改后的 XML 文档(catalog-modified.xml)     
   

<?xml version="1.0" encoding="UTF-8"?>     
            <catalog>     
                  <!--An XML catalog-->     
                  <?target instruction?>    
                  <journal title="XML Zone" publisher="IBM developerWorks">     
                        <article level="Introductory" date="October-2002">    
                              <title>Create flexible and extensible XML schemas</title>   
                              <author>     
                                    <firstname>Ayesha</firstname>     
                                    <lastname>Malik</lastname>     
                               </author>     
                        </article> 
                  </journal>
            </catalog>


                  与 W3C DOM API 相比,使用 dom4j 所包含的解析器的好处是 dom4j 拥有本地的 XPath 支持。DOM 解析器不支持使用 XPath 选择节点。   

.xpath语法


选取节点

XPath 使用路径表达式在 XML 文档中选取节点。节点是通过沿着路径或者 step 来选取的。

下面列出了最有用的路径表达式:

表达式

描述

nodename

选取此节点的所有子节点

/

从根节点选取

//

从匹配选择的当前节点选择文档中的节点,而不考虑它们的位置

.

选取当前节点

..

选取当前节点的父节点

@

选取属性

实例

在下面的表格中,我们已列出了一些路径表达式以及表达式的结果:

路径表达式

结 果

bookstore

选取 bookstore 元素的所有子节点

/bookstore

选取根元素 bookstore

注释:假如路径起始于正斜杠( / ),则此路径始终代表到某元素的绝对路径!

bookstore/book

选 取所有属于 bookstore 的子元素的 book 元素。

//book

选取所有 book 子元素,而不管它们在文档中的位置。

bookstore//book

选择所有 属于 bookstore 元素的后代的 book 元素,而不管它们位于 bookstore 之下的什么位置。

//@lang

选取所有名为 lang 的属性。


谓语(Predicates)

谓语用来查找某个特定的节点或者包含某个指定的值的节点。

谓语被嵌在方括号中。

实例

在下面的表格中,我们列出了带有谓语的一些路径表达式,以及表达式的结果:

路 径表达式

结果

/bookstore/book[1]

选取属于 bookstore 子元素的第一个 book 元素。

/bookstore/book[last()]

选取属于 bookstore 子元素的最后一个 book 元素。

/bookstore/book[last()-1]

选取属于 bookstore 子元素的倒数第二个 book 元素。

/bookstore/book[position()<3]

选取最前面的两个属于 bookstore 元素的子元素的 book 元素。

//title[@lang]

选取所有拥有名为 lang 的属性的 title 元素。

//title[@lang='eng']

选取所有 title 元素,且这些元素拥有值为 eng 的 lang 属性。

/bookstore/book[price>35.00]

选取所有 bookstore 元素的 book 元素,且其中的 price 元素的值须大于 35.00。

/bookstore/book[price>35.00]/title

选取所有 bookstore 元素中的 book 元素的 title 元素,且其中的 price 元素的值须大于 35.00。


选取未知节点

XPath 通配符可用来选取未知的 XML 元素。

通配符

描述

*

匹配任何元素节点

@*

匹配任何属性节点

node()

匹配任何类型的节点

实例

在下面的表格中,我们列出了一些路径表达式,以及这些表达式的结果:

路径表达式

结果

/bookstore/*

选取 bookstore 元素的所有子节点

//*

选取文档中的所有元素

//title[@*]

选取所有带有属性的 title 元素。


选取若干路径

通过在路径表达式中使用“|”运算符,您可以选取若干个路径。

实例

在下面的表格中,我们列出了一些路径表达式,以及这些表达式的结果:

路 径表达式

结果

//book/title | //book/price

选 取所有 book 元素的 title 和 price 元素。

//title | //price

选取所有文档中的 title 和 price 元素。

/bookstore/book/title | //price

选取所有属于 bookstore 元素的 book 元素的 title 元素,以及文档中所有的 price 元素。




XPath 轴

轴可定义某个相对于当前节点的节点集。

轴名称

结果

ancestor

选取当前节点的所有先辈(父、祖父等)

ancestor-or-self

选取当前节点的所有先辈(父、祖父等)以及当前节点本身

attribute

选 取当前节点的所有属性

child

选取当前节点的所有子元素。

descendant

选取当前节点的所有后代元素(子、孙等)。

descendant-or-self

选取当前节点的所有后代元素(子、孙等)以及当前节点本身。

following

选 取文档中当前节点的结束标签之后的所有节点。

namespace

选取当前节点的所有命名 空间节点

parent

选取当前节点的父节点。

preceding

选取文档中当前节点的开始标签之前的所有节点。

preceding-sibling

选 取当前节点之前的所有同级节点。

self

选取当前节点。


位置路径表达式

位置路径可以是绝对的,也可以是相对的。

绝对路径起始于正斜杠( / ),而相对路径不会这样。在两种情况中,位置路径均包括一个或多个步,每个步均被斜杠分割:

绝对位置路径:



/step/step/...



相对位置路径:



step/step/...



每个步均根据当前节点集之中的节点来进行计算。

步(step)包括:


定义所选节点与当前节点之间的树关系 节点测试(node-test) 识别某个轴内部的节点 零个或者更多谓语(predicate) 更深入地提炼所选的节点集

步的语法:



轴名称::节点测试[谓语]



实例

例子

结果

child::book

选取所有属于当前节点的子元素的 book 节点

attribute::lang

选 取当前节点的 lang 属性

child::*

选取当前节点的所有子元素

attribute::*

选取当前节点的所有属性

child::text()

选取当前节点的所有文本子节点

child::node()

选取当前节点的所有 子节点

descendant::book

选取当前节点的所有 book 后代

ancestor::book

选择当前节点的所有 book 先辈

ancestor-or-self::book

选取当前节点的所有book先辈以及当前节点(假如此节点是book节点的 话)

child::*/child::price

选取当前节点的所有 price 孙。


 

XPath 运算符

下面列出了可用在 XPath 表达式中的运算符:

运算符

描述

实例

返回值

|

计算两个节点集

//book | //cd

返回所有带有 book 和 ck 元素的节点集

+

加法

6 + 4

10

-

减法

6 - 4

2

*

乘法

6 * 4

24

div

除法

8 div 4

2

=

等于

price=9.80

如果 price 是 9.80,则返回 true。

如 果 price 是 9.90,则返回 fasle。

!=

不等于

price!=9.80

如果 price 是 9.90,则返回 true。

如果 price 是 9.80,则返回 fasle。

<

小于

price<9.80

如 果 price 是 9.00,则返回 true。

如果 price 是 9.90,则返回 fasle。

<=

小于或等于

price<=9.80

如果 price 是 9.00,则返回 true。

如果 price 是 9.90,则返回 fasle。

>

大于

price>9.80

如果 price 是 9.90,则返回 true。

如果 price 是 9.80,则返回 fasle。

>=

大于或等于

price>=9.80

如果 price 是 9.90,则返回 true。

如果 price 是 9.70,则返回 fasle。

or


price=9.80 or price=9.70

如果 price 是 9.80,则返回 true。

如果 price 是 9.50,则返回 fasle。

and


price>9.00 and price<9.90

如果 price 是 9.80,则返回 true。

如果 price 是 8.50,则返回 fasle。

mod

计算除法的余数

5 mod 2

1

【注】Exception in thread "main" java.lang.NoClassDefFoundError: org/jaxen/JaxenException
下载 jaxen-1.1.1.jar包

 

=============================================


标签:xml,java,dom4j,price,元素,选取,book,bookstore,节点
From: https://blog.51cto.com/u_16255870/7535799

相关文章

  • java文件操作
    Java.io.File类主要是完成了文件夹管理的命名、查询文件属性和处理目录等到操作它不进行文件夹内容的读取操作。以下描述了File类的主要常用方法。  File():构造函数,一般是依据文件所在的指定位置来创建文件对象。  CanWrite():返回文件是否可写。  CanRead():返回文件是否可......
  • java.lang.IllegalArgumentException: Malformed \uxxxx encoding — 记一次mvnDebug
    本文唯一发布网站博客园(官网地址:https://www.cnblogs.com/)本文地址:https://www.cnblogs.com/zeromi/p/17716933.html前情提要有天需要写个东西,需要翻一下老代码,使用idea打开一个很久没打开的项目,然后不知道为啥到处飘红在查看了项目的ExternalLabraries列表,发现包都有,再看......
  • java代码访问网页
    importjava.io.BufferedReader;importjava.io.InputStreamReader;importjava.net.URL;importjava.net.HttpURLConnection;publicclassWebPageAccess{publicstaticvoidmain(String[]args){Stringurl="http://example.com";//输入要访......
  • Java 21 新特性:switch的模式匹配
    在之前的Java17新特性中,我们介绍过关于JEP406:switch的模式匹配,但当时还只是关于此内容的首个预览版本。之后在JDK18、JDK19、JDK20中又都进行了更新和完善。如今,在JDK21中,该特性得到了最终确定!下面,我们就再正式学习一下该功能!在以往的switch语句中,对于case中的类型匹配限......
  • java在try-catch-finally代码块中return或者throw Exception时需注意的问题
    在Java的try-catch-finally代码块中使用return或者throwException时,需要注意以下几个问题:1.Return语句的执行:当在try或catch中使用return语句时,程序会立即退出当前方法并返回指定的值。但是在执行return之前,finally代码块将被执行。如果finally中也包含retur......
  • JAVA-基本程序设计结构(类变量、main语法、代码块、final关键字、抽象类)
    1.类变量和类方法1.类变量1.类变量的定义和语法1.类变量(静态变量/静态属性/静态字段)是该类的所有对象共享的变量,任何一个该类的对象去访问它时,取到的都是相同的值,同样任何一个该类的对象去修改它时,修改的也是同一个变量2.定义语法:访问修饰符static数据类型变量名;[推......
  • java中string与byte[]的转换
    1.string转byte[]byte[]midbytes=isoString.getBytes("UTF8");//为UTF8编码byte[]isoret=srt2.getBytes("ISO-8859-1");ISO-8859-1编码ISO-8859-1为单字节的编码2.byte[]转stringStringisoString=newString(byte......
  • group by 用java代码实现
    importjava.util.ArrayList;importjava.util.HashMap;importjava.util.List;importjava.util.Map;importjava.util.Map.Entry;publicclassListGroup{publicstaticvoidmain(String[]args){List<JavaBean>list=newArrayList<JavaB......
  • java日期操作
    将Date类型写入数据库的两种方法先了解几个类: 1、具体类(和抽象类相对)java.util.Date 2、抽象类java.text.DateFormat和它的一个具体子类,java.text.SimpleDateFormat 3、抽象类java.util.Calendar和它的一个具体子类,java.util.GregorianCalendar......
  • Java验证电子邮箱地址、电话号码
    demo1:/***本类用于处理、检查导入数据的格式*@authorAdministrator*weiwenshuai20110915*/publicclassCheckData{/***验证手机号码、电话号码是否有效*手机号前面加86的情况也考虑*新联通*(中国联通+中国网通)手机号码开头数字130、1......