超文本标记语言(英语:HyperText Markup Language,简称:HTML)是一种用来结构化 Web 网页及其内容的标记语言。网页内容可以是:一组段落、一个重点信息列表、也可以含有图片和数据表。正如标题所示,本文将对 HTML 及其功能做一个基本介绍。
HTML 到底是什么?
HTML 不是一门编程语言,而是一种用于定义内容结构的标记语言。HTML 由一系列的元素组成,这些元素可以用来包围不同部分的内容,使其以某种方式呈现或者工作。一对标签可以为一段文字或者一张图片添加超链接,将文字设置为斜体,改变字号,等等。例如,键入下面一行内容:
My cat is very grumpy
可以将这行文字封装成一个段落元素来使其在单独一行呈现:
HTML
< code >< span class="token tag">< span class="token punctuation"><p< span class="token punctuation">>My cat is very grumpy< span class="token tag">< span class="token punctuation"></p< span class="token punctuation">>
HTML 元素详解
让我们深入探索一下这个段落元素。
这个元素的主要部分有:
- 开始标签(Opening tag):包含元素的名称(本例为 p),被大于号、小于号所包围。表示元素从这里开始或者开始起作用 —— 在本例中即段落由此开始。
- 结束标签(Closing tag):与开始标签相似,只是其在元素名之前包含了一个斜杠。这表示着元素的结尾 —— 在本例中即段落在此结束。初学者常常会犯忘记包含结束标签的错误,这可能会产生一些奇怪的结果。
- 内容(Content):元素的内容,本例中就是所输入的文本本身。
- 元素(Element):开始标签、结束标签与内容相结合,便是一个完整的元素。
元素也可以有属性(Attribute):
属性包含了关于元素的一些额外信息,这些信息本身不应显现在内容中。本例中,class
是属性名称,editor-note
是属性的值。class
属性可为元素提供一个标识名称,以便进一步为元素指定样式或进行其他操作时使用。
属性应该包含:
- 在属性与元素名称(或上一个属性,如果有超过一个属性的话)之间的空格符。
- 属性的名称,并接上一个等号。
- 由引号所包围的属性值。
备注: 不包含 ASCII 空格(以及 "
'
`
=
<
>
)的简单属性值可以不使用引号,但是建议将所有属性值用引号括起来,这样的代码一致性更佳,更易于阅读。
嵌套元素
也可以将一个元素置于其他元素之中 —— 称作嵌套。要表明猫咪非常暴躁,可以将“very”用 <strong>
元素包围,爆字将突出显示:
HTML
< code >< span class="token tag">< span class="token punctuation"><p< span class="token punctuation">>My cat is < span class="token tag">< span class="token punctuation"><strong< span class="token punctuation">>very< span class="token tag">< span class="token punctuation"></strong< span class="token punctuation">> grumpy.< span class="token tag">< span class="token punctuation"></p< span class="token punctuation">>
必须保证元素嵌套次序正确:本例首先使用 <p>
标签,然后是 <strong>
标签,因此要先结束 <strong>
标签,最后再结束 <p>
标签。这样是不对的:
HTML
< code >< span class="token tag">< span class="token punctuation"><p< span class="token punctuation">>My cat is < span class="token tag">< span class="token punctuation"><strong< span class="token punctuation">>very grumpy.< span class="token tag">< span class="token punctuation"></p< span class="token punctuation">>< span class="token tag">< span class="token punctuation"></strong< span class="token punctuation">>
元素必须正确地开始和结束,才能清楚地显示出正确的嵌套层次。否则浏览器就得自己猜测,虽然它会竭尽全力,但很大程度不会给你期望的结果。所以一定要避免!
空元素
不包含任何内容的元素称为空元素。比如 <img>
元素:
HTML
< code >< span class="token tag">< span class="token punctuation"><img < span class="token attr-name">src< span class="token attr-value">< span class="token punctuation attr-equals">=< span class="token punctuation">"images/firefox-icon.png< span class="token punctuation">" < span class="token attr-name">alt< span class="token attr-value">< span class="token punctuation attr-equals">=< span class="token punctuation">"My test image< span class="token punctuation">" < span class="token punctuation">/>
本元素包含两个属性,但是并没有 </img>
结束标签,元素里也没有内容。这是因为图像元素不需要通过内容来产生效果,它的作用是向其所在的位置嵌入一个图像。
HTML 文档详解
以上介绍了一些基本的 HTML 元素,但孤木不成林。现在来看看单个元素如何彼此协同构成一个完整的 HTML 页面。回顾 文件处理 小节中创建的 index.html
示例:
HTML
< code >< span class="token doctype">< span class="token punctuation"><!< span class="token doctype-tag">doctype < span class="token name">html< span class="token punctuation">> < span class="token tag">< span class="token punctuation"><html < span class="token attr-name">lang< span class="token attr-value">< span class="token punctuation attr-equals">=< span class="token punctuation">"en-US< span class="token punctuation">"< span class="token punctuation">> < span class="token tag">< span class="token punctuation"><head< span class="token punctuation">> < span class="token tag">< span class="token punctuation"><meta < span class="token attr-name">charset< span class="token attr-value">< span class="token punctuation attr-equals">=< span class="token punctuation">"utf-8< span class="token punctuation">" < span class="token punctuation">/> < span class="token tag">< span class="token punctuation"><meta < span class="token attr-name">name< span class="token attr-value">< span class="token punctuation attr-equals">=< span class="token punctuation">"viewport< span class="token punctuation">" < span class="token attr-name">content< span class="token attr-value">< span class="token punctuation attr-equals">=< span class="token punctuation">"width=device-width< span class="token punctuation">" < span class="token punctuation">/> < span class="token tag">< span class="token punctuation"><title< span class="token punctuation">>My test page< span class="token tag">< span class="token punctuation"></title< span class="token punctuation">> < span class="token tag">< span class="token punctuation"></head< span class="token punctuation">> < span class="token tag">< span class="token punctuation"><body< span class="token punctuation">> < span class="token tag">< span class="token punctuation"><img < span class="token attr-name">src< span class="token attr-value">< span class="token punctuation attr-equals">=< span class="token punctuation">"images/firefox-icon.png< span class="token punctuation">" < span class="token attr-name">alt< span class="token attr-value">< span class="token punctuation attr-equals">=< span class="token punctuation">"My test image< span class="token punctuation">" < span class="token punctuation">/> < span class="token tag">< span class="token punctuation"></body< span class="token punctuation">> < span class="token tag">< span class="token punctuation"></html< span class="token punctuation">>
这里有:
<!DOCTYPE html>
——文档类型。这是必不可少的开头。混沌初分,HTML 尚在襁褓(大约是 1991/92 年)之时,这个元素用来关联 HTML 编写规范,以供自动查错等功能所用。而在当今,它作用有限,可以说仅用于保证文档正常读取。现在知道这些就足够了。<html></html>
——<html>
元素。该元素包含整个页面的所有内容,有时候也称作根元素。里面也包含了lang
属性,写明了页面的主要语种。<head></head>
——<head>
元素。所有那些你加到页面中,且不向看客展示的页面成员,都以这个元素为容器。其中包含诸如提供给搜索引擎的关键字和页面描述、用作风格化页面的 CSS、字符集声明等等。<meta charset="utf-8">
——该元素指明你的文档使用 UTF-8 字符编码,UTF-8 包括世界绝大多数书写语言的字符。它基本上可以处理任何文本内容。以它为编码还可以避免以后出现某些问题,没有理由再选用其他编码。<meta name="viewport" content="width=device-width">
——视口元素可以确保页面以视口宽度进行渲染,避免移动端浏览器上因页面过宽导致缩放。<title></title>
——<title>
元素。该元素设置页面的标题,显示在浏览器标签页上,也作为收藏网页的描述文字。<body></body>
——<body>
元素。该元素包含期望让用户在访问页面时看到的全部内容,包括文本、图像、视频、游戏、可播放的音轨或其他内容。
图像
重温一下 <img>
元素:
HTML
< code >< span class="token tag">< span class="token punctuation"><img < span class="token attr-name">src< span class="token attr-value">< span class="token punctuation attr-equals">=< span class="token punctuation">"images/firefox-icon.png< span class="token punctuation">" < span class="token attr-name">alt< span class="token attr-value">< span class="token punctuation attr-equals">=< span class="token punctuation">"My test image< span class="token punctuation">" < span class="token punctuation">/>
像之前所讲,该元素通过包含图像文件路径的地址属性 src
,可在所在位置嵌入图像。
该元素还包括一个替换文字属性 alt
,是图像的描述内容,用于当图像不能被用户看见时显示,不可见的原因可能是:
- 用户有视觉障碍。视障用户可以使用屏幕阅读器来朗读
alt
属性的内容。 - 有些错误使图像无法显示。可以试着故意将
src
属性里的路径改错。保存并刷新页面就可以在图像位置看到:
alt
属性的关键字即“描述文本”。alt
文本应向用户完整地传递图像要表达的意思。用 "测试图片" 来描述 Firefox 标志并不合适,修改成 "Firefox 标志:一只盘旋在地球上的火狐" 就好多了。
可以试着为图像编写一些更好的 alt
文本。
备注: 更多信息请参阅 无障碍访问。
标记文本
本段包含了一些最常用的文本标记 HTML 元素。
标题(Heading)
标题元素可用于指定内容的标题和子标题。就像一本书的书名、每章的大标题、小标题,等。HTML 文档也是一样。HTML 包括六个级别的标题, <h1>
(en-US)–<h6>
(en-US) ,一般最多用到 3-4 级标题。
HTML
< code >< span class="token tag">< span class="token punctuation"><h1< span class="token punctuation">>主标题< span class="token tag">< span class="token punctuation"></h1< span class="token punctuation">> < span class="token tag">< span class="token punctuation"><h2< span class="token punctuation">>顶层标题< span class="token tag">< span class="token punctuation"></h2< span class="token punctuation">> < span class="token tag">< span class="token punctuation"><h3< span class="token punctuation">>子标题< span class="token tag">< span class="token punctuation"></h3< span class="token punctuation">> < span class="token tag">< span class="token punctuation"><h4< span class="token punctuation">>次子标题< span class="token tag">< span class="token punctuation"></h4< span class="token punctuation">>
可以尝试在 <img>
元素上面添加一个合适的标题。
备注: 你可以看到第一级标题是有隐式的主题样式。不要使用标题元素来加大、加粗字体,因为标题对于 无障碍访问 和 搜索引擎优化 等问题非常有意义。要保持页面结构清晰,标题整洁,不要发生标题级别跳跃。
段落(Paragraph)
如上文所讲,<p>
元素是用来指定段落的。通常用于指定常规的文本内容:
HTML
< code >< span class="token tag">< span class="token punctuation"><p< span class="token punctuation">>这是一个段落< span class="token tag">< span class="token punctuation"></p< span class="token punctuation">>
列表(List)
Web 上的许多内容都是列表,HTML 有一些特别的列表元素。标记列表通常包括至少两个元素。最常用的列表类型为:
- 无序列表(Unordered List)中项目的顺序并不重要,就像购物列表。用一个
<ul>
元素包围。 - 有序列表(Ordered List)中项目的顺序很重要,就像烹调指南。用一个
<ol>
元素包围。
列表的每个项目用一个列表项目(List Item)元素 <li>
包围。
比如,要将下面的段落片段改成一个列表:
HTML
< code >< span class="token tag">< span class="token punctuation"><p< span class="token punctuation">> At Mozilla, we're a global community of technologists, thinkers, and builders working together… < span class="token tag">< span class="token punctuation"></p< span class="token punctuation">>
可以这样更改标记:
HTML
< code >< span class="token tag">< span class="token punctuation"><p< span class="token punctuation">>At Mozilla, we're a global community of< span class="token tag">< span class="token punctuation"></p< span class="token punctuation">> < span class="token tag">< span class="token punctuation"><ul< span class="token punctuation">> < span class="token tag">< span class="token punctuation"><li< span class="token punctuation">>technologists< span class="token tag">< span class="token punctuation"></li< span class="token punctuation">> < span class="token tag">< span class="token punctuation"><li< span class="token punctuation">>thinkers< span class="token tag">< span class="token punctuation"></li< span class="token punctuation">> < span class="token tag">< span class="token punctuation"><li< span class="token punctuation">>builders< span class="token tag">< span class="token punctuation"></li< span class="token punctuation">> < span class="token tag">< span class="token punctuation"></ul< span class="token punctuation">> < span class="token tag">< span class="token punctuation"><p< span class="token punctuation">>working together…< span class="token tag">< span class="token punctuation"></p< span class="token punctuation">>
试着在示例页面中添加一个有序列表和无序列表。
链接
链接非常重要 — 它们赋予 Web 网络属性。要植入一个链接,我们需要使用一个简单的元素 — <a>
— a 是 "anchor" (锚)的缩写。要将一些文本添加到链接中,只需如下几步:
- 选择一些文本。比如“Mozilla Manifesto”。
- 将文本包含在
<a>
元素内,就像这样:HTML
< code >< span class="token tag">< span class="token punctuation"><a< span class="token punctuation">>Mozilla Manifesto< span class="token tag">< span class="token punctuation"></a< span class="token punctuation">>
- 为此
<a>
元素添加一个href
属性,就像这样:HTML
< code >< span class="token tag">< span class="token punctuation"><a < span class="token attr-name">href< span class="token attr-value">< span class="token punctuation attr-equals">=< span class="token punctuation">"< span class="token punctuation">"< span class="token punctuation">>Mozilla Manifesto< span class="token tag">< span class="token punctuation"></a< span class="token punctuation">>
- 把属性的值设置为所需网址:
HTML
< code >< span class="token tag">< span class="token punctuation"><a < span class="token attr-name">href< span class="token attr-value">< span class="token punctuation attr-equals">=< span class="token punctuation">"https://www.mozilla.org/zh-CN/about/manifesto/< span class="token punctuation">" < span class="token punctuation">>Mozilla Manifesto< span class="token tag">< span class="token punctuation"></a < span class="token punctuation">>
如果网址开始部分省略了 https://
或者 http://
,可能会得到错误的结果。在完成一个链接后,可以试着点击它来确保指向正确。
备注: href
这个名字可能开始看起来有点令人费解,代表超文本引用( hypertext reference)。
现在就为页面添加一个链接吧。
小结
如果你一直跟着这篇文章里的指导做的话,你应该完成了一个像下面这样的页面(也可以查看这里):
如果你遇到困难,你可以将 Github 上的完整示例代码与你的文件进行比较。