XML解析之DOM解析

XML 结构是一种树型结构，处理步骤都差不多，Java 己经将它们封装成了现成的类库。目前流行的解析方法有三种，分别为 DOM、SAX 和 DOM4j。

本文将讲解DOM解析。

DOM（Document Object Model，文档对象模型）

是 W3C 组织推荐的处理 XML 的一种方式。它是一种基于对象的 API，把 XML 的内容加载到内存中，生成一个 XML 文档相对应的对象模型，根据对象模型，以树节点的方式对文档进行操作。下面用实例说明解析步骤。

1、xml文件

本文将采用的是Maven项目中的pom.xml，读者可以自己随便找一个xml文件即可。（懒得找）

<?xml version="1.0" encoding="UTF-8"?>
<project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
  xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
  <modelVersion>4.0.0</modelVersion>

  <groupId>org.example</groupId>
  <artifactId>Maven01</artifactId>
  <version>1.0-SNAPSHOT</version>
  <packaging>war</packaging>

  <properties>
    <project.build.sourceEncoding>UTF-8</project.build.sourceEncoding>
    <maven.compiler.source>1.7</maven.compiler.source>
    <maven.compiler.target>1.7</maven.compiler.target>
  </properties>

  <dependencies>
    <dependency>
      <groupId>junit</groupId>
      <artifactId>junit</artifactId>
      <version>4.11</version>
      <scope>test</scope>
    </dependency>

    <dependency>
      <groupId>mysql</groupId>
      <artifactId>mysql-connector-java</artifactId>
      <version>8.0.27</version>
    </dependency>
  </dependencies>
</project>

2、DOM解析步骤

步骤一：使用 org.w3c.dom 库中的 newInstance()方法创建一个DocumentBuilderFactory对象

步骤2：使用newDocumentBuilder()方法创建一个DocumentBuilder对象

步骤3：使用parser()方法加载books.xml文件到当前项目

步骤4：使用getElementsByTagName("dependency")获取dependency节点，返回NodeList节点集合对象

步骤5：获取节点dependency的属性名，属性值

1）首先，遍历每一个dependency节点。

① 通过nodeList的getLength()方法可以获取根节点集合dependencyList的长度

② 使用for循环遍历节点集合中的每一个dependency节点

2）然后获取每一个dependency节点的属性名和属性值，这时候有两种方式

方式一：不知道dependency节点有哪些属性时候，用以下方法

①使用item()的方法获取一个dependency节点的具体属性，返回Node类型

②使用getAttributes()获取dependency节点的所有属性集合，返回NamedNodeMap类型

③通过attrs的getLength()方法可以获取属性集合的长度

④使用for循环遍历一个dependency节点的属性

⑤使用item()方法获取dependencys节点属性集合中的每一个属性，返回Node类型

⑥使用getNodeName()方法获取属性的属性名

⑦使用getNodeValue()方法获取属性的属性值

方式二：知道dependency节点只有id一个属性的时候，用以下方法

①将dependency节点进行强制类型转换，转换成Element类型

②通过getAttribute("id")获取属性值

步骤6：获取dependency节点的子节点的节点名和节点值

节点类型	NodeType	Named Constant	nodename的返回值	nodeValue的返回值
Element	1	ELEMENT_NODE	element name	null
Attr	2	ATTRIBUTE_NODE	属性名称	属性值
Text	3	TEXT_NODE	#text	节点内容

3、DOM解析代码实现

@Test
    public void test2(){
        //步骤1：使用org.w3c.dom库的newInstance()方法创建一个DocumentBuilderFactory对象
        DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
        try {
            //步骤2：使用newDocumentBuilder()方法创建一个DocumentBuilder对象
            DocumentBuilder db = dbf.newDocumentBuilder();
            //步骤3：使用parse()方法加载pom.xml文件到当前项目
            Document document = db.parse("D:\\itheima\\SJT230Maven\\pom.xml");
            //步骤4：使用getElementsByTagName("dependency")获取dependency节点，返回的是NodeList对象，也就是节点集合(dependency不止一个)
            NodeList dependencyList = document.getElementsByTagName("dependency");
            //步骤5：获取节点dependency的属性名，属性值
            //首先，遍历每一个dependency节点
            //通过nodeList的getLength()方法可以获取dependencyList的长度
            //1）通过nodeList的getLength()方法可以获取根节点集合dependencyList的长度
            System.out.println("一共有"+dependencyList.getLength()+"个依赖");
            //遍历每一个dependency节点
            for (int i=0;i<dependencyList.getLength();i++) {
                System.out.println("=======下面开始遍历"+(i+1)+"个依赖的内容=======");

                //①使用item()的方法获取一个book节点的具体属性，返回Node类型
                Node dependency = dependencyList.item(i);
                //②使用getAttributes()获取dependency节点的所有属性集合，返回NamedNodeMap类型
                NamedNodeMap attrs = dependency.getAttributes();
                //③通过attrs的getLength()方法可以获取属性集合的长度
                System.out.println("第"+(i+1)+"个依赖共有"+attrs.getLength()+"个属性");
                //④使用for循环遍历一个dependency节点的属性
                for(int j=0;j<attrs.getLength();j++ ) {
                    //⑤使用item()方法获取books节点属性集合中的每一个属性，返回Node类型
                    Node attr = attrs.item(j);
                    //使用getNodeName()方法获取属性的属性名
                    System.out.println("属性名"+ attr.getNodeName()+"的属性值是"+attr.getNodeValue());
                }

                //步骤6：获取dependency节点的子节点的节点名和节点值
                //1）使用getChildNodes()方法获取dependency节点的所有子节点（子节点集合）
                NodeList childNodes = book.getChildNodes();
                //2）遍历getChildNodes获取每个节点的节点名和节点值（节点数是包括空格和换行符）
                System.out.println("第"+(i+1)+"本书共有"+childNodes.getLength()+"个子节点");
                for(int k=0;k<childNodes.getLength();k++ ) {
                    //①由于节点数是包括空格和换行符的，所以要把TEXT_NODE以及ELEMENT_NODE区分开来，
                    //此处使用判断语句，只选择ELEMENT_NODE
                    if (childNodes.item(k).getNodeType()==Node.ELEMENT_NODE){
                        //②通过.item(k).getNodeName()方法获取book每一个子节点的节点名
                        System.out.print("第"+(k+1)+"个节点的节点名："+ childNodes.item(k).getNodeName());
                        System.out.println("的节点值是："+ childNodes.item(k).getFirstChild().getNodeValue());
                    }
                }
                System.out.println("=======结束遍历"+(i+1)+"个依赖的内容=======");
            }
        } catch (ParserConfigurationException e) {
            // TODO Auto-generated catch block
            e.printStackTrace();
        } catch (IOException e) {
            // TODO Auto-generated catch block
            e.printStackTrace();
        } catch (org.xml.sax.SAXException e) {
            e.printStackTrace();
        }
    }

标签：XML,DOM,步骤,dependency,获取,解析,节点,属性
From： https://www.cnblogs.com/jundong2177/p/17427126.html

XML解析之DOM解析

XML解析之DOM解析

1、xml文件

2、DOM解析步骤

3、DOM解析代码实现

相关文章

赞助商

阅读排行