首页 > 其他分享 >DOM(文档对象模型):理解网页结构与内容操作的关键技术

DOM(文档对象模型):理解网页结构与内容操作的关键技术

时间:2024-03-29 20:22:05浏览次数:42  
标签:XML 网页 DOM 元素 xmlDoc 文档 节点 属性

DOM(文档对象模型)定义了一种访问和操作文档的标准。它是一个平台和语言无关的接口,允许程序和脚本动态访问和更新文档的内容、结构和样式。HTML DOM用于操作HTML文档,而XML DOM用于操作XML文档。

HTML DOM示例

通过ID获取并修改HTML元素的值:

<!DOCTYPE html>
<html>
<head>
<style>
table, th, td {
  border: 1px solid black;
  border-collapse: collapse;
}
th, td {
  padding: 5px;
}
</style>
</head>
<body>

<button type="button" onclick="loadXMLDoc()">获取我的CD收藏</button>
<br><br>
<table id="demo"></table>

<script>
function loadXMLDoc() {
  var xmlhttp = new XMLHttpRequest();
  xmlhttp.onreadystatechange = function() {
    if (this.readyState == 4 && this.status == 200) {
      myFunction(this);
    }
  };
  xmlhttp.open("GET", "cd_catalog.xml", true);
  xmlhttp.send();
}

function myFunction(xml) {
  var i;
  var xmlDoc = xml.responseXML;
  var table = "<tr><th>Artist</th><th>Title</th></tr>";
  var x = xmlDoc.getElementsByTagName("CD");
  for (i = 0; i < x.length; i++) {
    table += "<tr><td>" +
    x[i].getElementsByTagName("ARTIST")[0].childNodes[0].nodeValue +
    "</td><td>" +
    x[i].getElementsByTagName("TITLE")[0].childNodes[0].nodeValue +
    "</td></tr>";
  }
  document.getElementById("demo").innerHTML = table;
}
</script>

</body>
</html>

通过标签名获取并修改HTML元素的值:

<!DOCTYPE html>
<html>
<body>

<h1>This is a Heading</h1>

<h1>This is another Heading</h1>

<script>
document.getElementsByTagName("h1")[0].innerHTML = "Hello World!";
</script>

</body>
</html>

XML DOM示例

加载XML文件并获取元素的值:

<!DOCTYPE html>
<html>
<body>

<p id="demo"></p>

<script>
var xhttp = new XMLHttpRequest();
xhttp.onreadystatechange = function() {
    if (this.readyState == 4 && this.status == 200) {
    myFunction(this);
    }
};
xhttp.open("GET", "books.xml", true);
xhttp.send();

function myFunction(xml) {
    var xmlDoc = xml.responseXML;
    document.getElementById("demo").innerHTML =
    xmlDoc.getElementsByTagName("title")[0].childNodes[0].nodeValue;
}
</script>

</body>
</html>

加载XML字符串并获取元素的值:

<html>
<body>

<p id="demo"></p>

<script>
var text, parser, xmlDoc;

text = "<bookstore><book>" +
"<title>Everyday Italian</title>" +
"<author>Giada De Laurentiis</author>" +
"<year>2005</year>" +
"</book></bookstore>";

parser = new DOMParser();
xmlDoc = parser.parseFromString(text,"text/xml");

document.getElementById("demo").innerHTML =
xmlDoc.getElementsByTagName("title")[0].childNodes[0].nodeValue;
</script>

</body>
</html>

DOM编程接口

DOM的编程接口由一组标准属性和方法定义。属性通常用于描述节点的特征,而方法通常用于执行与节点相关的操作。

属性的例子

  • x.nodeName - x的名称
  • x.nodeValue - x的值
  • x.parentNode - x的父节点
  • x.childNodes - x的子节点
  • x.attributes - x的属性节点

方法的例子

  • x.getElementsByTagName(name) - 获取指定标签名的所有元素
  • x.appendChild(node) - 将一个子节点插入到x
  • x.removeChild(node) - 从x中移除一个子节点

这些属性和方法使得通过编程可以访问和操作文档的各个部分。

XML DOM 节点

根据 XML DOM,XML 文档中的所有内容都是节点:

  • 整个文档是一个文档节点
  • 每个 XML 元素是一个元素节点
  • XML 元素中的文本是文本节点
  • 每个属性是一个属性节点
  • 注释是注释节点

DOM 示例

看下面的 XML 文件(books.xml):

<?xml version="1.0" encoding="UTF-8"?>
<bookstore>
  <book category="cooking">
    <title lang="en">Everyday Italian</title>
    <author>Giada De Laurentiis</author>
    <year>2005</year>
    <price>30.00</price>
  </book>
  <book category="children">
    <title lang="en">Harry Potter</title>
    <author>J.K. Rowling</author>
    <year>2005</year>
    <price>29.99</price>
  </book>
  <book category="web">
    <title lang="en">XQuery Kick Start</title>
    <author>James McGovern</author>
    <author>Per Bothner</author>
    <author>Kurt Cagle</author>
    <author>James Linn</author>
    <author>Vaidyanathan Nagarajan</author>
    <year>2003</year>
    <price>49.99</price>
  </book>
  <book category="web" cover="paperback">
    <title lang="en">Learning XML</title>
    <author>Erik T. Ray</author>
    <year>2003</year>
    <price>39.95</price>
  </book>
</bookstore>

上述 XML 中的根节点命名为 <bookstore>

文档中的所有其他节点都包含在 <bookstore> 中。

根节点 <bookstore> 包含了 4 个 <book> 节点。

第一个 <book> 节点包含子节点: <title><author><year><price>

子节点分别包含一个文本节点,内容分别为 "Everyday Italian"、"Giada De Laurentiis"、"2005" 和 "30.00"。

文本始终存储在文本节点中

在 DOM 处理中常见的错误是期望元素节点包含文本。然而,元素节点的文本存储在文本节点中。

在这个例子中:<year>2005</year>,元素节点 <year> 包含一个值为 "2005" 的文本节点。

"2005" 不是 <year> 元素的值!

XML DOM 节点树

XML DOM 将 XML 文档视为树结构。树结构被称为节点树。

所有节点都可以通过树访问。它们的内容可以修改或删除,并且可以创建新元素。

节点树显示了节点集和它们之间的连接。树从根节点开始,延伸到树的最低层的文本节点:

image

图像上方代表 XML 文件 books.xml

节点的父节点、子节点和兄弟姐妹

节点树中的节点之间存在层次关系。

术语父节点、子节点和兄弟姐妹用于描述这些关系。父节点有子节点。在同一层级上的子节点称为兄弟姐妹。

  • 在节点树中,顶部节点称为根节点
  • 除了根节点,每个节点都有一个父节点
  • 一个节点可以有任意数量的子节点
  • 叶子是没有子节点的节点
  • 具有相同父节点的节点称为兄弟节点

以下图像说明了节点树的一部分以及节点之间的关系:

image

由于 XML 数据是以树形式结构化的,可以在不知道树的确切结构和包含的数据类型的情况下遍历它。

第一个子节点 - 最后一个子节点

看下面的 XML 片段:

<bookstore>
  <book category="cooking">
    <title lang="en">Everyday Italian</title>
    <author>Giada De Laurentiis</author>
    <year>2005</year>
    <price>30.00</price>
  </book>
</bookstore>

在上述 XML 中,<title> 元素是 <book> 元素的第一个子节点,<price> 元素是 <book> 元素的最后一个子节点。

此外,<book> 元素是 <title><author><year><price> 元素的父节点。

XML DOM - 访问节点

使用 DOM,您可以访问 XML 文档中的每个节点。

访问节点

有三种方式可以访问节点:

  1. 使用 getElementsByTagName() 方法
  2. 通过循环遍历节点树
  3. 通过导航节点树,使用节点之间的关系

getElementsByTagName() 方法

getElementsByTagName() 返回具有指定标签名的所有元素。

语法

node.getElementsByTagName("tagname");

示例

以下示例返回 x 元素下的所有 <title> 元素:

x.getElementsByTagName("title");

注意,上面的示例仅返回 x 节点下的 <title> 元素。要返回 XML 文档中的所有 <title> 元素,请使用:

xmlDoc.getElementsByTagName("title");

其中 xmlDoc 是文档本身(文档节点)。

DOM 节点列表

getElementsByTagName() 方法返回一个节点列表。节点列表是节点的数组。

x = xmlDoc.getElementsByTagName("title");

x 中的 <title> 元素可以通过索引号访问。要访问第三个 <title>,您可以这样写:

y = x[2];

注意:索引从 0 开始。

DOM 节点列表长度

length 属性定义了节点列表的长度(节点数)。

您可以通过使用 length 属性循环遍历节点列表:

var x = xmlDoc.getElementsByTagName("title");

for (i = 0; i < x.length; i++) {
  // 对每个节点执行一些操作
}

节点类型

XML 文档的 documentElement 属性是根节点。

节点的 nodeName 属性是节点的名称。

节点的 nodeType 属性是节点的类型

遍历节点

以下代码循环遍历根节点的子节点,这些子节点也是元素节点:

txt = "";
x = xmlDoc.documentElement.childNodes;

for (i = 0; i < x.length; i++) {
  // 仅处理元素节点(类型 1)
  if (x[i].nodeType == 1) {
    txt += x[i].nodeName + "<br>";
  }
}

示例解释:

  • 假设您已经将 "books.xml" 加载到 xmlDoc
  • 获取根元素(xmlDoc)的子节点
  • 对于每个子节点,检查节点类型。如果节点类型是 "1",则它是一个元素节点
  • 如果它是一个元素节点,则输出节点的名称

导航节点关系

以下代码使用节点之间的关系导航节点树:

x = xmlDoc.getElementsByTagName("book")[0];
xlen = x.childNodes.length;
y = x.firstChild;

txt = "";
for (i = 0; i < xlen; i++) {
  // 仅处理元素节点(类型 1)
  if (y.nodeType == 1) {
    txt += y.nodeName + "<br>";
  }
  y = y.nextSibling;
}

示例解释:

  • 假设您已经将 "books.xml" 加载到 xmlDoc
  • 获取第一个 book 元素的子节点
  • 将 "y" 变量设置为第一个 book 元素的第一个子节点
  • 对于每个子节点(从第一个子节点 "y" 开始):
    • 检查节点类型。如果节点类型是 "1",则它是一个元素节点
    • 如果它是一个元素节点,则输出节点的名称
    • 将 "y" 变量设置为下一个兄弟节点,并再次运行循环

XML DOM 节点信息

nodeName 属性

nodeName 属性指定节点的名称。

  • nodeName 是只读的。
  • 元素节点的 nodeName 与标签名相同。
  • 属性节点的 nodeName 是属性名。
  • 文本节点的 nodeName 始终是 #text。
  • 文档节点的 nodeName 始终是 #document。

nodeName 属性示例

nodeValue 属性

nodeValue 属性指定节点的值。

  • 元素节点的 nodeValue 是未定义的。
  • 文本节点的 nodeValue 是文本本身。
  • 属性节点的 nodeValue 是属性值。

获取元素的值

以下代码检索第一个 <title> 元素的文本节点值:

var x = xmlDoc.getElementsByTagName("title")[0].childNodes[0];
var txt = x.nodeValue;

结果:txt = "Everyday Italian"

示例解释:

  • 假设您已经将 books.xml 加载到 xmlDoc 中。
  • 获取第一个 <title> 元素节点的文本节点。
  • txt 变量设置为文本节点的值。

更改元素的值

以下代码更改了第一个 <title> 元素的文本节点值:

var x = xmlDoc.getElementsByTagName("title")[0].childNodes[0];
x.nodeValue = "Easy Cooking";

示例解释:

  • 假设您已经将 books.xml 加载到 xmlDoc 中。
  • 获取第一个 <title> 元素节点的文本节点。
  • 将文本节点的值更改为 "Easy Cooking"。

nodeType 属性

nodeType 属性指定节点的类型。

  • nodeType 是只读的。
  • 最重要的节点类型是:
    • 元素:1
    • 属性:2
    • 文本:3
    • 注释:8
    • 文档:9

nodeType 属性示例

DOM 属性列表(命名节点映射)

元素节点的 attributes 属性返回属性节点的列表。

这称为命名节点映射,与节点列表类似,只是在方法和属性上有一些差异。

属性列表会自我更新。如果删除或添加了属性,列表会自动更新。

此代码片段从 "books.xml" 中的第一个 <book> 元素返回属性节点的列表:

x = xmlDoc.getElementsByTagName('book')[0].attributes;

执行上述代码后,x.length 是属性的数量,x.getNamedItem() 可用于返回一个属性节点。

此代码片段获取书籍的 "category" 属性值和属性列表的数量:

x = xmlDoc.getElementsByTagName("book")[0].attributes;

txt = x.getNamedItem("category").nodeValue + " " + x.length;

输出:

  • cooking 1

示例解释:

  • 假设 books.xml 已加载到 xmlDoc 中。
  • 设置 x 变量以保存第一个 <book> 元素的所有属性的列表。
  • 获取 "category" 属性的值和属性列表的长度。

最后

为了方便其他设备和平台的小伙伴观看往期文章:

微信公众号搜索:Let us Coding,关注后即可获取最新文章推送

看完如果觉得有帮助,欢迎点赞、收藏、关注

标签:XML,网页,DOM,元素,xmlDoc,文档,节点,属性
From: https://www.cnblogs.com/xiaowange/p/18104554

相关文章

  • Webbrowser打开https网页提示证书错误
    vb.net开发了一个捕快网文采集器 txt文本使用了IE控件Webbrowser在访问https网页时,有些网页出现了证书错误的提示,无法访问,而且没有"继续"的选项试了一下强制默认证书认证全部为<真>的代码有效.ImportsSystem.Security.Cryptography.X509Certificates......
  • JSON Editor 中文文档
    JSONEditorJSONEditor根据定义的JSONSchema生成了一个Html表单来对JSON进行编辑。它完整支持JSONSchema的版本3和版本4,并且它集成了一些流行的CSS框架,例如bootstrap,foundation,andjQueryUI等。JSONEditor生成的编辑器支持输入框、下拉框、等几乎所有的html5输入......
  • 虚拟DOM和真实DOM的区别
    虚拟DOM(VirtualDOM)、DOM(RealDOM)是前端开发中常用的两种概念。什么是真实DOM?​真实DOM是浏览器中实际存在的DOM结构,它由浏览器解析HTML生成,并且直接与浏览器交互。当页面中的数据发生变化时,真实DOM会重新计算布局和渲染,这个过程比较耗费性能。什么是虚拟DOM?​虚拟DO......
  • Storybook version8 智能化构建组件文档与单元测试
    根据官方文档说法,storybook是一个独立构建前端UI组件与页面的车间。StorybookisafrontendworkshopforbuildingUIcomponentsandpagesinisolation.Ithelpsyoudevelopandsharehard-to-reachstatesandedgecaseswithoutneedingtorunyourwholeapp.Th......
  • 摄影跟拍预定系统的设计与实现|Springboot+ Mysql+Java+ B/S结构(可运行源码+数据库+
    本项目包含可运行源码+数据库+LW,文末可获取本项目的所有资料。项目研究的背景困扰管理层的许多问题当中,摄影跟拍预定管理一定是不敢忽视的一块。但是管理好摄影跟拍预定又面临很多麻烦需要解决,例如有几个方面:第一,往往用户人数都比较多,如何保证能够管理到每一用户;第二,......
  • 软件项目管理全套文档模板(开发/实施/运维/安全/交付)
     前言:在软件项目管理中,每个阶段都有其特定的目标和活动,确保项目的顺利进行和最终的成功交付。以下是软件项目管理各个阶段的详细资料:软件项目全套文档资料下载:点我获取1.需求阶段目标:收集、分析和定义用户需求和业务目标。主要活动:需求调研:与用户沟通,了解他们的需求和......
  • 基于Java+Vue的企业采购系统(供应商、询价、招投标)(附文档+源码)
      前言:供应商招投标管理系统是一个综合性的管理平台,旨在规范供应商的招投标流程,确保采购过程的透明度和公正性,同时提高采购效率。以下是对您提到的各个环节的详细解释:一、供应商准入供应商准入是招投标管理系统的首要环节,它负责审核和管理潜在供应商的资质。具体流程包括......
  • 基于Java+Neo4j的知识图谱+全文检索的知识库管理系统(附文档+代码)
      在数字化高度普及的时代,企事业机关单位在日常工作中会产生大量的文档,例如医院制度汇编,企业知识共享库等。针对这些文档性的东西,手工纸质化去管理是非常消耗工作量的,并且纸质化查阅难,易损耗,所以电子化管理显得尤为重要。【springboot+elasticsearch+neo4j+vue+activiti】实......
  • 短信系统开发注意事项|网页版短信后台
    在开发短信系统时,有一些重要的注意事项需要考虑,以确保系统的稳定性、安全性和功能完整性。以下是一些开发短信系统时需要注意的事项:合规性和法律要求:确保短信系统的开发符合当地法律法规和通信行业规定,包括用户隐私保护、反垃圾短信措施等。系统设计:在设计阶段考虑系统架......
  • 在线练测系统(源码+mysql+文档)
    本系统(程序+源码)带文档lw万字以上  文末可领取本课题的JAVA源码参考系统程序文件列表系统的选题背景和意义选题背景:随着信息技术的飞速发展,教育领域也迎来了革命性的变化。在线练习测验系统如8u098的出现,正是这一变革的产物。这类系统提供了一个虚拟的平台,让教师能够设......