首页 > 编程语言 >JAVA里的xml(详解)

JAVA里的xml(详解)

时间:2024-08-10 17:26:50浏览次数:17  
标签:xml 文件 JAVA name 标签 age 详解 id

1.xml

1.1概述【理解】

  • 万维网联盟(W3C)

    万维网联盟(W3C)创建于1994年,又称W3C理事会。1994年10月在麻省理工学院计算机科学实验室成立。 建立者: Tim Berners-Lee (蒂姆·伯纳斯·李)。 是Web技术领域最具权威和影响力的国际中立性技术标准机构。 到目前为止,W3C已发布了200多项影响深远的Web技术标准及实施指南,

    • 如广为业界采用的超文本标记语言HTML(标准通用标记语言下的一个应用)、

    • 可扩展标记语言XML(标准通用标记语言下的一个子集)

    • 以及帮助残障人士有效获得Web信息的无障碍指南(WCAG)等

  • xml概述

    XML的全称为(EXtensible Markup Language),是一种可扩展的标记语言 标记语言: 通过标签来描述数据的一门语言(标签有时我们也将其称之为元素) 可扩展:标签的名字是可以自定义的,XML文件是由很多标签组成的,而标签名是可以自定义的

  • 作用

    • 用于进行存储数据和传输数据

    • 作为软件的配置文件

  • 作为配置文件的优势

    • 可读性好

    • 可维护性高

1.2标签的规则【应用】

  • 标签由一对尖括号和合法标识符组成

    <student>
  • 标签必须成对出现

    <student> </student>
    前边的是开始标签,后边的是结束标签
  • 特殊的标签可以不成对,但是必须有结束标记

    <address/>
  • 标签中可以定义属性,属性和标签名空格隔开,属性值必须用引号引起来

    <student id="1"> </student>
  • 标签需要正确的嵌套

    这是正确的: <student id="1"> <name>张三</name> </student>
    这是错误的: <student id="1"><name>张三</student></name>

1.3语法规则【应用】

  • 语法规则

    • XML文件的后缀名为:xml
    • 文档声明必须是第一行第一列

      <?xml version="1.0" encoding="UTF-8" standalone="yes”?> version:该属性是必须存在的 encoding:该属性不是必须的

      打开当前xml文件的时候应该是使用什么字符编码表(一般取值都是UTF-8)

      standalone: 该属性不是必须的,描述XML文件是否依赖其他的xml文件,取值为yes/no

    • 必须存在一个根标签,有且只能有一个

    • XML文件中可以定义注释信息

    • XML文件中可以存在以下特殊字符

    •  

      &lt; < 小于 &gt; > 大于 &amp; & 和号 &apos; ' 单引号 &quot; " 引号
    • XML文件中可以存在CDATA区

      <![CDATA[ …内容… ]]>

  • 示例代码

    <?xml version="1.0" encoding="UTF-8" ?>
    <!--注释的内容-->
    <!--本xml文件用来描述多个学生信息-->
    <students>
    ​
        <!--第一个学生信息-->
        <student id="1">
            <name>张三</name>
            <age>23</age>
            <info>学生&lt; &gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;&gt;的信息</info>
            <message> <![CDATA[内容 <<<<<< >>>>>> ]]]></message>
        </student>
    ​
        <!--第二个学生信息-->
        <student id="2">
            <name>李四</name>
            <age>24</age>
        </student>
    ​
    </students>

1.4xml解析【应用】

  • 概述

    xml解析就是从xml中获取到数据

  • 常见的解析思想

    DOM(Document Object Model)文档对象模型:就是把文档的各个组成部分看做成对应的对象。 会把xml文件全部加载到内存,在内存中形成一个树形结构,再获取对应的值

  • 常见的解析工具

    • JAXP: SUN公司提供的一套XML的解析的API

    • JDOM: 开源组织提供了一套XML的解析的API-jdom

    • DOM4J: 开源组织提供了一套XML的解析的API-dom4j,全称:Dom For Java

    • pull: 主要应用在Android手机端解析XML

  • 解析的准备工作

    1. 我们可以通过网站:dom4j 去下载dom4j

      今天的资料中已经提供,我们不用再单独下载了,直接使用即可

    2. 将提供好的dom4j-1.6.1.zip解压,找到里面的dom4j-1.6.1.jar

    3. 在idea中当前模块下新建一个libs文件夹,将jar包复制到文件夹中

    4. 选中jar包 -> 右键 -> 选择add as library即可

  • 需求

    • 解析提供好的xml文件

    • 将解析到的数据封装到学生对象中

    • 并将学生对象存储到ArrayList集合中

    • 遍历集合

  • 代码实现

    <?xml version="1.0" encoding="UTF-8" ?>
    <!--注释的内容-->
    <!--本xml文件用来描述多个学生信息-->
    <students>
    ​
        <!--第一个学生信息-->
        <student id="1">
            <name>张三</name>
            <age>23</age>
        </student>
    ​
        <!--第二个学生信息-->
        <student id="2">
            <name>李四</name>
            <age>24</age>
        </student>
    ​
    </students>
    ​
    // 上边是已经准备好的student.xml文件
    public class Student {
        private String id;
        private String name;
        private int age;
    ​
        public Student() {
        }
    ​
        public Student(String id, String name, int age) {
            this.id = id;
            this.name = name;
            this.age = age;
        }
    ​
        public String getId() {
            return id;
        }
    ​
        public void setId(String id) {
            this.id = id;
        }
    ​
        public String getName() {
            return name;
        }
    ​
        public void setName(String name) {
            this.name = name;
        }
    ​
        public int getAge() {
            return age;
        }
    ​
        public void setAge(int age) {
            this.age = age;
        }
    ​
        @Override
        public String toString() {
            return "Student{" +
                    "id='" + id + '\'' +
                    ", name='" + name + '\'' +
                    ", age=" + age +
                    '}';
        }
    }
    ​
    /**
     * 利用dom4j解析xml文件
     */
    public class XmlParse {
        public static void main(String[] args) throws DocumentException {
            //1.获取一个解析器对象
            SAXReader saxReader = new SAXReader();
            //2.利用解析器把xml文件加载到内存中,并返回一个文档对象
            Document document = saxReader.read(new File("myxml\\xml\\student.xml"));
            //3.获取到根标签
            Element rootElement = document.getRootElement();
            //4.通过根标签来获取student标签
            //elements():可以获取调用者所有的子标签.会把这些子标签放到一个集合中返回.
            //elements("标签名"):可以获取调用者所有的指定的子标签,会把这些子标签放到一个集合中并返回
            //List list = rootElement.elements();
            List<Element> studentElements = rootElement.elements("student");
            //System.out.println(list.size());
    ​
            //用来装学生对象
            ArrayList<Student> list = new ArrayList<>();
    ​
            //5.遍历集合,得到每一个student标签
            for (Element element : studentElements) {
                //element依次表示每一个student标签
      
                //获取id这个属性
                Attribute attribute = element.attribute("id");
                //获取id的属性值
                String id = attribute.getValue();
    ​
                //获取name标签
                //element("标签名"):获取调用者指定的子标签
                Element nameElement = element.element("name");
                //获取这个标签的标签体内容
                String name = nameElement.getText();
    ​
                //获取age标签
                Element ageElement = element.element("age");
                //获取age标签的标签体内容
                String age = ageElement.getText();
    ​
    //            System.out.println(id);
    //            System.out.println(name);
    //            System.out.println(age);
    ​
                Student s = new Student(id,name,Integer.parseInt(age));
                list.add(s);
            }
            //遍历操作
            for (Student student : list) {
                System.out.println(student);
            }
        }
    }

1.5DTD约束【理解】

  • 什么是约束

    用来限定xml文件中可使用的标签以及属性

  • 约束的分类

    • DTD

    • schema

  • 编写DTD约束

    • 步骤

      1. 创建一个文件,这个文件的后缀名为.dtd

      2. 看xml文件中使用了哪些元素

        <!ELEMENT> 可以定义元素

      3. 判断元素是简单元素还是复杂元素

        简单元素:没有子元素。 复杂元素:有子元素的元素;

    • 代码实现

      <!ELEMENT persons (person)>
      <!ELEMENT person (name,age)>
      <!ELEMENT name (#PCDATA)>
      <!ELEMENT age (#PCDATA)>
     
  • 引入DTD约束

    • 引入DTD约束的三种方法

      • 引入本地dtd

        ​​

      • 在xml文件内部引入

        ​​

      • 引入网络dtd

        ​​

    • 代码实现

      • 引入本地DTD约束

        // 这是persondtd.dtd文件中的内容,已经提前写好
        <!ELEMENT persons (person)>
        <!ELEMENT person (name,age)>
        <!ELEMENT name (#PCDATA)>
        <!ELEMENT age (#PCDATA)>
        
        // 在person1.xml文件中引入persondtd.dtd约束
        <?xml version="1.0" encoding="UTF-8" ?>
        <!DOCTYPE persons SYSTEM 'persondtd.dtd'>
        
        <persons>
            <person>
                <name>张三</name>
                <age>23</age>
            </person>
        
        </persons>
      • 在xml文件内部引入

        <?xml version="1.0" encoding="UTF-8" ?>
        <!DOCTYPE persons [
                <!ELEMENT persons (person)>
                <!ELEMENT person (name,age)>
                <!ELEMENT name (#PCDATA)>
                <!ELEMENT age (#PCDATA)>
                ]>
        
        <persons>
            <person>
                <name>张三</name>
                <age>23</age>
            </person>
        
        </persons>
      • 引入网络dtd

        <?xml version="1.0" encoding="UTF-8" ?>
        <!DOCTYPE persons PUBLIC "dtd文件的名称" "dtd文档的URL">
        
        <persons>
            <person>
                <name>张三</name>
                <age>23</age>
            </person>
        
        </persons>
  • DTD语法

    • 定义元素

      定义一个元素的格式为:<!ELEMENT 元素名 元素类型> 简单元素:

      EMPTY: 表示标签体为空

      ANY: 表示标签体可以为空也可以不为空

      PCDATA: 表示该元素的内容部分为字符串

      复杂元素: ​ 直接写子元素名称. 多个子元素可以使用","或者"|"隔开; ​ ","表示定义子元素的顺序 ; "|": 表示子元素只能出现任意一个 ​ "?"零次或一次, "+"一次或多次, "*"零次或多次;如果不写则表示出现一次

  • 定义属性

    格式

    定义一个属性的格式为:<!ATTLIST 元素名称 属性名称 属性的类型 属性的约束> 属性的类型: ​ CDATA类型:普通的字符串

    属性的约束:

    // #REQUIRED: 必须的 ​ // #IMPLIED: 属性不是必需的 ​ // #FIXED value:属性值是固定的

  • 代码实现

    <!ELEMENT persons (person+)>
    <!ELEMENT person (name,age)>
    <!ELEMENT name (#PCDATA)>
    <!ELEMENT age (#PCDATA)>
    <!ATTLIST person id CDATA #REQUIRED>
    
    <?xml version="1.0" encoding="UTF-8" ?>
    <!DOCTYPE persons SYSTEM 'persondtd.dtd'>
    
    <persons>
        <person id="001">
            <name>张三</name>
            <age>23</age>
        </person>
    
        <person id = "002">
            <name>张三</name>
            <age>23</age>
        </person>
    
    </persons>
    ​```

1.6schema约束【理解】

  • schema和dtd的区别

    1. schema约束文件也是一个xml文件,符合xml的语法,这个文件的后缀名.xsd

    2. 一个xml中可以引用多个schema约束文件,多个schema使用名称空间区分(名称空间类似于java包名)

    3. dtd里面元素类型的取值比较单一常见的是PCDATA类型,但是在schema里面可以支持很多个数据类型

    4. schema 语法更加的复杂

  • 编写schema约束

    • 步骤

      1,创建一个文件,这个文件的后缀名为.xsd。 2,定义文档声明 3,schema文件的根标签为: <schema> 4,在<schema>中定义属性: ​ xmlns=http://www.w3.org/2001/XMLSchema 5,在<schema>中定义属性 : ​ targetNamespace =唯一的url地址,指定当前这个schema文件的名称空间。 6,在<schema>中定义属性 : ​ elementFormDefault="qualified“,表示当前schema文件是一个质量良好的文件。 7,通过element定义元素 8,判断当前元素是简单元素还是复杂元素

    • 代码实现

      <?xml version="1.0" encoding="UTF-8" ?>
      <schema
          xmlns="http://www.w3.org/2001/XMLSchema"
          targetNamespace="http://www.itheima.cn/javase"
          elementFormDefault="qualified"
      >
      
          <!--定义persons复杂元素-->
          <element name="persons">
              <complexType>
                  <sequence>
                      <!--定义person复杂元素-->
                      <element name = "person">
                          <complexType>
                              <sequence>
                                  <!--定义name和age简单元素-->
                                  <element name = "name" type = "string"></element>
                                  <element name = "age" type = "string"></element>
                              </sequence>
                              
                          </complexType>
                      </element>
                  </sequence>
              </complexType>
      
          </element>
      
      </schema>
      
  • 引入schema约束

    • 步骤

      1,在根标签上定义属性xmlns="http://www.w3.org/2001/XMLSchema-instance" 2,通过xmlns引入约束文件的名称空间 3,给某一个xmlns属性添加一个标识,用于区分不同的名称空间 ​ 格式为: xmlns:标识=“名称空间地址” ,标识可以是任意的,但是一般取值都是xsi 4,通过xsi:schemaLocation指定名称空间所对应的约束文件路径 ​ 格式为:xsi:schemaLocation = "名称空间url 文件路径“

    • 代码实现

      <?xml version="1.0" encoding="UTF-8" ?>
      
      <persons
          xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
          xmlns="http://www.itheima.cn/javase"
          xsi:schemaLocation="http://www.itheima.cn/javase person.xsd"
      >
          <person>
              <name>张三</name>
              <age>23</age>
          </person>
      
      </persons>
      ​```
  • schema约束定义属性

    • 代码示例

      <?xml version="1.0" encoding="UTF-8" ?>
      <schema
          xmlns="http://www.w3.org/2001/XMLSchema"
          targetNamespace="http://www.itheima.cn/javase"
          elementFormDefault="qualified"
      >
      ​
          <!--定义persons复杂元素-->
          <element name="persons">
              <complexType>
                  <sequence>
                      <!--定义person复杂元素-->
                      <element name = "person">
                          <complexType>
                              <sequence>
                                  <!--定义name和age简单元素-->
                                  <element name = "name" type = "string"></element>
                                  <element name = "age" type = "string"></element>
                              </sequence>
                              
                              <!--定义属性,required( 必须的)/optional( 可选的)-->
                              <attribute name="id" type="string" use="required"></attribute>
                          </complexType>
                          
                      </element>
                  </sequence>
              </complexType>
          </element>
          
      </schema>
      ​
      <?xml version="1.0" encoding="UTF-8" ?>
      <persons
          xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
          xmlns="http://www.itheima.cn/javase"
          xsi:schemaLocation="http://www.itheima.cn/javase person.xsd"
      >
          <person id="001">
              <name>张三</name>
              <age>23</age>
          </person>
      ​
      </persons>
      •```

标签:xml,文件,JAVA,name,标签,age,详解,id
From: https://blog.csdn.net/weixin_65752158/article/details/141092880

相关文章

  • 上千套java软件设计案例参考项目最新源码
    上千套java软件设计案例参考项目最新源码springbootssm小程序,仅供学习参考单买3元一套,299全套带走springboot+vue项目 ssm+vue项目ssm+jsp项目 Javaweb项目  小程序项目【项目可参考我发布的商品】大部分的项目都带万字设计报告文档+源码+数据库+说明文档大......
  • 安装java开发环境
    卸载JDK视频:https://www.bilibili.com/video/BV12J41137hu/?p=17&t=2m39s删除java的安装目录删除JAVA_HOME删除path下关于java的目录在cmd输入java-version,测试java是否卸载成功安装JDK网上搜索JDK8,找到下载地址同意协议下载电脑对应的版本双击安装JDK记住jdk的安......
  • Java | 图片地址查询返回参数自动拼接图片前缀地址
    代码介绍自定义的JsonSerializer来处理图片URL的拼接,增加了灵活性和可配置性。关键点:自动拼接域名:通过properties.getEndpoint()从配置文件中获取Minio接口域名,然后根据条件决定是否拼接域名。处理多个图片URL:代码处理了可能包含多个图片URL的情况(以逗号分隔),并且确保了每个UR......
  • Java每日一练06
    这里写目录标题一级目录二级目录三级目录题目1.一般情况下,以下哪个选项不是关系数据模型与对象模型之间匹配关系?2.transient变量和下面哪一项有关?3.线程安全的map在JDK1.5及其更高版本环境有哪几种方法可以实现?4.使用mvc模式设计的web应用程序具有以下优点,除了?5.......
  • Java中字符串的常量池
    计算机存储中存在一个堆区域,堆区域中存在一个常量池,当申请了字符串变量后,会将值放入常量池中,下次申请新的变量时,会优先从常量池中查找,如果常量池中已经存在,则变量会直接指向常量池中的值,从而节省空间(jdk1.8之后的字符串常量池存在于堆中) Stringx1="aaa";//在常量池......
  • C语言指针变量详解(函数指针,函数指针数组,转移表)
    指针变量 1.字符指针变量在指针的类型中我们知道有⼀种指针类型为字符指针char*;⼀般使⽤:intmain(){charch='w';char*pc=&ch;*pc='w';return0;}还有⼀种使⽤⽅式如下:intmain(){const......
  • C语言指针与数组详解(指针数组,数组指针,⼆级指针)
    指针与数组1.数组名的理解1.1结论:数组名是数组⾸元素的地址,但是有2个例外。      •sizeof(数组名),sizeof中单独放数组名,这⾥的数组名表⽰整个数组,计算的是整个数组的⼤⼩     •&数组名,这⾥的数组名表⽰整个数组,取出的是整个数组的地址(整个数......
  • java实现解析pdf格式发票
    为了减少用户工作量及误操作的可能性,需要实现用户上传PDF格式的发票,系统通过解析PDF文件获取发票内容,并直接将其写入表单。以下文章记录了功能实现的代码。发票样式发票内容解析引用Maven使用pdfbox<dependency><groupId>org.apache.pdfbox</groupId><artif......
  • Java知识点1
    Java知识点什么是字节码?采用字节码的好处是什么?在Java中,JVM可以理解的代码就叫做字节码(即扩展名为.class的文件),它只面向虚拟机。Java语言通过字节码的方式,在一定程度上解决了传统解释型语言执行效率低的问题,同时又保留了解释型语言可移植的特点。字节码并不针对一种特定......
  • java导出pdf
    文章目录概要maven包进入工具类使用示例注意事项概要java利用itextpdf导出pdfmaven包进入 <dependency> <groupId>com.itextpdf</groupId> <artifactId>itextpdf</artifactId> <version>5.5.13.3</version> </dependency> ......