搜索机器人通常通过跟踪链接来浏览您的网站。问题是爬虫可能永远不会以这种方式访问某些页面:要么是因为您的网站太大,要么是因为没有链接指向您的页面。这就是站点地图存在的原因。
在这篇文章中,我们将探讨 XML 站点地图对网站的好处,讨论不同类型的站点地图,并学习如何创建合适的站点地图。我们还在最后提供了一个额外的信息图,总结了本文中涵盖的站点地图构建技巧。
目录
- 关键要点
- 什么是站点地图?
- 您的网站需要站点地图吗?
- 拥有 XML 站点地图有什么好处?
- 站点地图格式
- 其他站点地图类型
- 如何创建 XML 站点地图文件
- Google 对站点地图文件的要求
- 决定站点地图中要包含哪些页面
- 如何向 Google 提交站点地图
- 常见的站点地图错误
关键要点
- 站点地图将爬虫引导至网站的重要页面,确保不会因内部链接不佳或站点结构复杂而被忽视。
- 虽然并非每个站点都强制要求,但大型或新启动的网站以及经常使用新内容、图像、视频或新闻文章更新的网站都需要站点地图。
- XML 站点地图有助于提高索引速度和覆盖率,使搜索引擎更容易找到、理解和正确排名网站最有价值的页面。
- 要创建结构良好的站点地图,请仔细选择高质量、可索引的页面,并通过排除返回错误代码、被 robots.txt 阻止或标记为 noindex 的页面来避免混淆搜索引擎。
- 如果您的网站不是那么大,您可以手动创建站点地图。否则,最好使用 CMS 插件或站点地图生成器,例如 SE Ranking 的网站审核工具中的内置生成器。
- 站点地图准备就绪后,将其添加到 Google Search Console 并在 robots.txt 文件中引用它。这有助于搜索引擎处理和索引站点地图。
什么是站点地图?
站点地图是列出网站上所有 URL 的文件。这使爬网程序和用户更容易浏览网站。
搜索爬虫使用站点地图来防止重要内容被忽视。站点地图将搜索引擎爬虫引导至他们以前可能从未访问过的网站区域,并最终帮助搜索引擎更有效地导航和索引网站内容。
站点地图还会告诉搜索引擎您认为您网站上的哪些页面和文件最重要。它们提供有关每个文件的其他元数据,包括上次修改日期和更改频率。
您的网站需要站点地图吗?
根据 Google 的说法,在以下情况下可能需要包含站点地图:
- 您的网站很大: 在大型网站上管理互连可能具有挑战性。Googlebot 也不太可能发现您的某些新页面。XML 站点地图可以帮助 Google 发现根深蒂固的内容,从而解决此问题。
- 您的网站是新的并且缺少反向链接: 网络爬虫依靠来自其他网站的链接来爬取和发现新页面。Googlebot 很难在没有外部链接指向这些页面的情况下找到这些页面。站点地图可以帮助 Google 更快地找到您的内容。
- 您的网站有大量新鲜的媒体内容: Google 可以出于搜索目的检查站点地图中的其他信息,尤其是当您的网站包含富媒体或出现在 Google 新闻中时。
另一方面,对于页面数约为 500 页或更少、内部链接详尽、媒体文件或新闻页面较少的小型网站来说,站点地图可能不是必需的,否则这些页面对排名至关重要。创建站点地图不会有什么坏处,但在这里也不会有太大帮助。决定权在您手中。
拥有 XML 站点地图有什么好处?
如果您有一个包含大量媒体文件的大型网站,或者您正在开始一个新项目,建议您创建站点地图。然而,大多数 SEO 都同意拥有站点地图对于索引和排名很重要。接下来让我们来看看这些好处:
更快的索引
创建 XML 站点地图有助于搜索引擎了解要索引的页面。在站点地图中包含 URL 会向 Google 表明该页面质量很高。这有助于搜索引擎更快地发现新页面,从而加快索引过程并提高网站在搜索结果中的可见度。
请注意,Google 可以选择忽略您的请求,因为所有页面都必须符合 Google 的质量标准才能被编入索引。
更好的深度页面索引
站点地图是索引深度页面的关键。深层页面距离主页只有几下点击距离,使用常规的网站导航方法无法轻易发现。
在站点地图中包含深层页面可确保搜索引擎知道它们的存在并可以轻松找到它们。
如果您的网站具有复杂的结构,例如表单提交后面的页面或只能通过搜索功能访问的页面,站点地图将特别有用。
监控已编入索引的网页
虽然站点地图本身并不直接帮助监控索引页面,但它为搜索引擎提供了一个参考点,可以将索引页面与站点地图中列出的页面进行比较。
将站点地图与 Google Search Console 相结合可以帮助您找出站点地图中的哪些 URL 已编入索引。
定期将您的站点地图与实际索引的页面进行比较,以识别任何差异或缺失的页面。如果站点地图中列出的某些页面未编入索引,则可能表明存在索引或抓取问题,例如技术错误、阻止指令或内容质量问题。
包含页面的区域版本
要通知 Google 您页面的区域版本,您可以在站点地图中列出它们以及特殊的 hreflang 属性。
这不是正确组织多语言网站的唯一方法,但一些网站管理员认为这是最简单的方法。
更好的用户体验
结构良好的可视化站点地图还可以帮助用户浏览您的网站。如果用户在主导航菜单下找不到他们正在寻找的内容,他们将访问您的站点地图。他们也可能使用它来查看您有多少主题或产品。这就是为什么保持 HTML 站点地图的用户友好很重要的原因。为此,请按类别组织页面并使用描述性锚点。
根据 Google 的说法,将站点地图添加到您的网站总是有益的,它永远不会因为您拥有站点地图而受到惩罚。
站点地图格式
站点地图有两种主要类型:HTML 和 XML 站点地图。其他不太常用的站点地图包括文本站点地图、RSS、mRSS 和 Atom 1.0。每个都有不同的用途,XML 站点地图对于 SEO 和索引至关重要,而 HTML 站点地图用于改善用户导航和可访问性。
让我们更详细地了解这些类型。
HTML 站点地图
HTML 站点地图是一个网页,其中包含指向网站最重要部分和页面的链接列表。以下是一些设计良好的 HTML 站点地图的不错示例:FedEx 和 Lufthansa。
HTML 站点地图的首要目的是帮助人们(而不是机器人)快速浏览网站并提供其主要部分的概述。另一方面,根据 John Mueller 的说法,如果您的网站已经具有清晰的导航结构,则无需创建 HTML 站点地图。相反,您所要做的就是改进网站的现有结构。
XML 站点地图
XML 站点地图是一个 XML 文件,通常命名为 sitemap.xml,位于网站的根文件夹中。它指定链接、页面修改日期以及与搜索引擎相关的其他参数。由于它们的所有参数都标有特殊标签,因此 XML 文件类似于网站的 HTML 代码:
虽然 XML 站点地图在视觉上可能看起来不吸引人,但它们对 SEO 非常重要。创建 XML 站点地图可以让爬虫全面了解您网站的结构,帮助他们轻松找到新内容等等。
除了列出网站 URL 的标准 XML 站点地图外,Google 还允许您为图像和视频内容以及新闻站点地图创建自定义站点地图。XML 站点地图通常位于根文件夹中:exampledomain.com/sitemap.xml
RSS、mRSS 和 Atom 1.0 站点地图
CMS 会自动创建 RSS、mRSS 和 Atom 1.0 站点地图格式。这些格式的结构与 XML 站点地图类似。
文本站点地图
文本站点地图是小型网站的简单解决方案。您可以创建一个 .txt 文件并列出您希望 Google 抓取的所有 URL。例如,如果您的网站只有 10 个页面,您可以在 .txt 文件中每行列出一个页面。与 XML 站点地图类似,此站点地图必须位于根文件夹 exampledomain.com/sitemap.txt 中。
其他站点地图类型
建议为图片、新闻和视频提供单独的站点地图文件。每个专门的站点地图都可以包含特定于格式的详细信息,例如视频长度、评级或发布日期。
图像站点地图专门用于为搜索引擎提供有关网站上图像的信息。它们用于通知 Google 您网站上搜索引擎可能无法发现的图像,包括通过 JavaScript 代码访问的图像。
创建视频站点地图有助于 Google 查找和了解您网站上的视频内容,尤其是新添加的内容或爬虫可能不容易发现的视频。对于视频站点地图,您可以指定详细信息,例如视频长度、评级、家庭友好性等。
根据 Google 的说法,您无需列出与主机页面内容无关的视频。例如,不应包含作为次要添加或与正文内容无关的视频。此外,视频站点地图中引用的所有文件都不应被 robots.txt 规则禁止抓取,也不应被防火墙或类似机制阻止。这些文件还必须无需 metafile 即可访问,并且需要登录凭证。
新闻 站点地图
新闻站点地图是为发布新闻文章的网站制作的。它们为搜索引擎提供有关新文章的信息,包括 URL、发布日期、标题和其他重要细节,例如文章的发布时间或它们使用的语言。
新闻站点地图可帮助搜索引擎更有效地识别时效性强的新闻内容并将其编入索引,从而提高网站在新闻相关搜索结果中的可见度。
Google 需要能够快速发现新闻文章。事实上,Google 只允许你在新闻站点地图中包含最近两天发布的新文章。这可确保用户仅获得最新信息。单个新闻站点地图可以包含不超过 1000 篇文章,但应删除较旧的内容。最后一个——也可能是最重要的条件——是您的网站应该在 Google 新闻中注册。
如何创建 XML 站点地图文件
让我们看看创建站点地图的一些最常见方法。
网站站长通常会选择以下选项之一:
- 手动创建站点地图
- 站点地图生成器
- CMS 插件
让我们回顾一下每种方法。
CMS 插件
生成 XML 站点地图的最简单方法是通过您的 CMS。由于 CMS 平台存储有关您网站所有页面和您所做的任何调整的信息,因此它们可以自动将所有这些数据输入到动态站点地图中。
一些 CMS 平台具有内置的站点地图生成功能。Magento、Shopify、Wix 和 Squarespace 就是这种情况。对于其他流行的 CMS 平台,如 WordPress、Joomla、Drupal 或 OpenCart,您需要使用特殊插件。
上表显示了 CMS 平台的顶级站点地图插件列表。要为您的网站选择合适的,请特别注意插件的功能。对 SEO 友好的解决方案应该可以让您从 XML 站点地图中排除不适当的页面,例如 404、重定向、noindex 和规范化页面。此外,请查找自定义选项,以便可以轻松修改文件中包含的页面。
站点地图生成器
如果您的网站不是建立在 CMS 之上或可用的 CMS 选项不合适,您可以使用专用的站点地图工具,它可以创建一个包含所有必要页面的 XML 文件。这通常比安装另一个插件更容易。
市场上有免费和付费选项,因此请仔细研究每种工具可以做什么。虽然您可以使用付费生成器生成可定制的动态站点地图,但大多数免费解决方案都过于基础且缺乏关键功能。免费生成器通常会创建一个包含所有站点页面的静态站点地图,包括规范化、noindex 和重定向 URL。
如果您无法选择使用付费解决方案或 CMS,请考虑使用 SE Ranking 的网站审核工具创建站点地图。它可以在几分钟内为您的网站生成静态站点地图(基于最新的抓取)。默认情况下,该工具在 XML 站点地图中仅包含 200 个 OK 页面,同时省略 4xx、3xx、noindex 和您通常想要排除的其他页面。
如果没有任何现成的解决方案适用于您的网站,您可以创建自定义 XML 站点地图。由于这需要编码技能,因此您必须聘请开发人员为您的网站制作合适的动态站点地图。
手动创建站点地图
如果您没有大型站点,您可以自己创建一个站点地图文件。只需打开任何文本编辑器并使用 XML 代码创建站点地图文件。下面是一个简单的 XML 站点地图示例:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://www.example.com/url1/</loc>
<lastmod>2024-11-20</lastmod>
</url>
<url>
<loc>https://www.example.com/url2/</loc>
<lastmod>2024-11-19</lastmod>
</url>
<url>
<loc>https://www.example.com/url3</loc>
<lastmod>2024-11-18</lastmod>
</url>
</urlset>
Sitemaps.org 是 Google 推荐的一个有用来源,它列出了供您在 XML 文件中使用的标记。现在,我们来了解一下每种标签类型。我们将确定每个标签的用途以及如何正确使用它。
必需的标记:
<urlset>
是一个必需元素,用于封装站点地图并指示使用的 XML Sitemap 协议标准版本(通过 xmlns 属性)。协议标准也称为命名空间。<url>
是另一个必需元素,它使用有关单个 URL 的所有信息来标记块。<loc>
是指示页面 URL 本身的必需最后一个元素。列出的所有 URL 都应该是完全限定的,并包含站点协议(HTTP 或 HTTPS)和 www 前缀(如果它包含在您的域名中)。
可选标签:
<lastmod>
表示页面上内容的上次更新时间。根据 Google 分析师 Gary Illyes 的说法,它被视为爬虫弄清楚抓取页面的频率的信号。但是,正如 2024 年 Google API 泄漏所揭示的那样,Google 可能会也可能不信任它,这意味着您应该只在发生重大变化的情况下更新<lastmod>
标签。
过时的标签:
<changefreq>
定义页面可以更改的频率。您可以将此参数设置为始终、每小时、每天、每周、每月、每年或从不。<priority>
设置页面的抓取优先级(有效值范围为 0.0 到 1.0)。
但是,根据 2024 年 6 月 21 日更新的上一版谷歌构建站点地图指南,谷歌表示上述标签将被忽略。
Google 对站点地图文件的要求
为确保您的站点地图被 Google 编入索引,请遵循站点地图协议。
首先在指定 URL 时使用相同的语法。
XML 站点地图文件应采用 UTF-8 编码,并且所有数据值(包括 URL)都必须进行实体转义。
新闻、图片和视频站点地图将需要不同的标签,例如 <news:news>。本文档介绍了在图片/新闻/视频站点地图中使用的所有必需标记:
最后,您可以使用任何您喜欢的文件名,只要 URL 允许使用字符即可。请记住,发现了一个 URL 文件名中包含连字符的错误。
使用站点地图索引文件管理站点地图
搜索引擎抓取 XML 站点地图的能力有限。解压缩后的最大文件大小应为 50 MB,包含的 URL 不超过 50,000 个。Google 施加这些限制是为了防止 Web 服务器在提供大文件时过载。如果您有一个巨大的网站和站点地图文件,则必须将其拆分为几个较小的文件。从那里,您可以创建一个站点地图索引文件来列出这些较小的站点地图,并将索引文件提交给 Google。
操作步骤:
- 创建几个单独的站点地图文件并使用 gzip 等工具压缩它们,如果需要,它可以节省带宽。压缩文件将具有 .gz 扩展名,例如 sitemap.xml.gz。
- 将所有单独的站点地图添加到 sitemap 索引文件中,如下例所示:
该示例显示了 XML 格式的站点地图索引文件。它列出了两个站点地图。
有关更多信息,请参阅 Google 的文档。
决定站点地图中要包含哪些页面
这部分非常重要,请仔细阅读!
一个常见的误解是,您需要将网站的所有页面都包含在 XML 站点地图中,以帮助 Google 抓取和索引您的网站。但是,Google 不需要查看您网站上的所有页面。相反,你只需要通知 Google 你认为值得高排名的高质量页面。这会提示 Google 仅优先考虑这些页面,但请记住,Google 可能会也可能不会。请遵循您的建议。请参阅下面的站点地图中应该(和不应该)包含的页面列表。
返回 200 OK 代码的页面
根据经验,您添加到列表中的所有页面都必须是 200 个 OK 页面,并且它们必须充满高质量、以用户为中心的内容。排除所有不符合这些标准的页面。
查看此 HTTP 状态代码指南。它易于理解,有助于理解不同的状态代码。
您还应该突出显示要包含在站点地图中的 200 个 OK 页面中最重要的类型:
- 主页
- 主菜单页面
- 类别页面
- 子类别
- 博客页面
- 内部页面
- 联系页面
- 包含品牌信息的页面
由于这些页面对您的排名和整体业务成功至关重要,因此您必须确保 Google 了解它们。
不应包含在站点地图中的页面
3XX 页
3XX 响应代码表示页面已重定向到新地址。像这样的页面不应该出现在你的 XML 站点地图中。
相反,请专注于在您的站点地图中包含最终目标 URL,因为这些 URL 是在重定向后提供内容的 URL。这有助于搜索引擎更好地了解您网站的结构,并正确索引和排名您的内容。
4XX 页
4XX 响应代码指示请求的页面不存在或具有限制访问。从站点地图中排除这些页面。
404 页面是已删除的页面,因此如果它们是故意删除的,请不要将它们包含在您的 XML 站点地图中。
软 404 页面也不适合 SEO。它们返回 200 级成功状态代码,尽管内容很少或没有,包含指向主页的重定向,或者包含被 robots.txt 阻止的 404 个页面。强烈建议您花时间修复此问题。
另一个流行的 4XX 状态代码是 401,它表示 Google“未授权”访问该页面。这些页面通常是为登录用户准备的,不应该被 Google 编入索引,这意味着它们不值得包含在您的站点地图中。
5XX 页
5XX 状态代码表示您的 Web 服务器存在问题。最常见的是 503 Service Unavailable 错误,该错误表示服务器暂时关闭。如果 Web 服务器正在维护或过载,则可能会发生这种情况。
如果错误只发生一次,则无需担心,因为它可能是由于计划的 Web 服务器维护造成的。但是,如果问题仍然存在,您必须找出根本原因并立即解决。否则,Google 可能会得出结论,您的网站维护不善。
在站点地图中添加或删除 5XX 页面不会有什么区别。相反,请专注于修复问题以返回响应代码 200 OK。
不可编入索引的网页
每个网站都有几个重要的用户实用页面,但不是搜索引擎的实用页面,包括登录页面、只有登录后才能使用的页面、排序和过滤页面等。一种常见的做法是使用 robots.txt 文件阻止这些页面,以防止 Google 访问它们。您还可以让 Google 抓取该页面,但使用特殊指令(noindex 或 all)限制其索引编制。
这些页面都不应该首先出现在您的 XML 站点地图上。如果一个页面无法被索引,但在你的站点地图上被推荐,它既会让 Google 感到困惑,又会浪费你的抓取预算。被 robots.txt 阻止的页面也是如此——Google 不会抓取它们。
审核您的网站以确保正确使用 noindex 指令和 robots.txt 文件并且您没有意外阻止错误的页面也是一个好主意。
要找到这些页面,请转到 SE Ranking 的 Issues Report 的 Crawling&Indexing 部分。
单击相应的页数将带您进入标记为 noindex 或被 robots.txt 阻止的 URL 的完整列表。它还显示了其他重要参数,例如指向页面的内部链接数量、所有机器人元标记和 x-robots 标记以及页面标题。您还将立即看到每个页面当前是否包含在您的 XML 站点地图中。
非规范页面
规范标签用于指示两个或多个相似页面中的哪一个是主要页面。Google 的工作是对首选页面进行索引和排名,并忽略重复或接近重复的页面。使用规范标签标记的类似页面可以具有完全不同的 URL,也可以具有相似的 URL(例如,在排序和过滤过程中生成的 URL、带有 UTM 标签和跟踪参数的 URL)。
有时,规范标签还用于确保页面可以通过 HTTP 和 HTTPS 访问,以及带和不带 www 前缀。在这种情况下,页面的主版本(例如 HTTPS 非 www 变体)标有 rel=canonical。但是,大多数网站更喜欢服务器端重定向。这是因为它们更直接,并且可以保证只有首选的网站变体才会被索引。
规范标签的工作方式与重定向不同,更像是推荐而不是指令。Google 也可以关注或忽略他们。这就是为什么在站点地图中包含非规范 URL 可能会让搜索引擎感到困惑的原因。如果该页面未被标记为规范页面,Google 将假定您不希望它被编入索引。同时,将页面添加到您的 XML 站点地图会鼓励 Google 将该页面编入索引。这将导致 Google 将所有页面版本编入索引,从而导致关键词蚕食。
搜索引擎还可以为非规范 URL 编制索引,进一步强调为什么明确哪个页面是主要页面很重要。
静态与动态站点地图
到目前为止,您可能想知道每当您发布新页面或修改现有页面时,您需要花费多少时间来更新您的站点地图。如果您创建静态站点地图,则保持 XML 站点地图最新可能会很困难。好消息是,如果您创建动态站点地图,则很容易避免这种麻烦。
每当您更改网站时,动态站点地图都会自动更新。例如,每当您删除一个页面,并且它变为 404 时,该页面将从站点地图中删除。如果你将页面标记为 noindex 或将其添加到 robots.txt 文件中,它也将从站点地图中删除。另一方面,每当您创建新页面并将其标记为规范页面时 - 它会立即添加到您的站点地图中。您所要做的就是正确设置该工具,以确保它动态生成您的站点地图。
动态站点地图是使您的站点地图保持最新状态的完美解决方案,因为它是每次搜索引擎请求时都会创建的。但由于它会给服务器带来额外的负载,我们只建议将其用于更新频繁的较大站点。
结合图片、视频和新闻站点地图
您的网站内容有时可能分为多个类别,例如带有嵌入图像和视频的新闻文章。您可以通过将图像、视频和新闻站点地图合并到一个大文件中来解决此问题。
操作步骤:
- 对于要在共享站点地图中使用的每个站点地图,请指定相应的命名空间以声明支持的标记。这是使用 urlset 标记中的 xmlns 属性完成的。
- 要合并站点地图,请将所需站点地图中的标记一个接一个地添加到相应的
<url>
标记中,如每个站点地图文档中所述。
有关更多详细信息,请参阅 Google 文档。
将站点地图添加到 robots.txt 文件
在您的 robots.txt 文件中添加对它的引用是通知搜索引擎您的站点地图的最安全、最简单的方法。robots.txt 文件通常位于 Web 服务器的根目录中,因此您所要做的就是包含 sitemap 命令,如下面的屏幕截图所示。
这种做法有助于搜索引擎发现您的网站并更有效地理解它,从而更容易查看和索引您的网页。
尽管在 robots.txt 文件中公开您的站点地图对于索引很有用,但任何人都可以轻松找到它们。如果您想让这些页面远离公众视线,这可能是一个问题。
要了解更多信息,请参阅我们关于如何创建 robots.txt 文件的综合指南。
如何向 Google 提交站点地图
根据用于生成站点地图的工具,您可能需要手动将其添加到您的网站中,或者它可能已经就位——由 CMS 生成的动态列表通常是这种情况。通常,当 XML 站点地图自动添加到网站时,可以在 yoursite.com/sitemap.xml 中找到它。
如果您使用工具生成 XML 站点地图文件,请手动将其上传到您网站的根文件夹。使用您的 cPanel 或 FTP 客户端(例如 Total Commander 或 FileZilla)来执行此操作。请务必在上传前检查站点地图的有效性,尤其是在文件是手动创建的情况下。您可以使用免费工具(例如此工具)来查看您的 XML 站点地图是否按预期运行。
一旦您的网站上拥有有效的站点地图,您就可以通过 Sitemaps 报告将其提交给 Google Search Console (GSC)。只需单击添加新站点地图,输入您的站点地图 URL,然后点击提交按钮。
检查 Status 列,看看 Google 是否可以正确处理您的站点地图。如果一切顺利,它将返回 Success 状态。如果网站站点地图已解析,但 Google 检测到错误,则状态将返回 Has errors。最后,如果 Google 无法抓取你的站点地图,你最终会得到 Couldn’t fetch 状态。
修复所有站点地图错误,以确保您的站点地图状态为成功。
在 Sitemap 报告的同一表格中,您将看到发现了多少个 URL。理想情况下,它应该与您添加到站点地图的相同数量的 URL 匹配。
最后,单击带有三个点的按钮以转到页面索引报告。这将使您更好地了解 Google 如何抓取您的网站并将其编入索引。研究该报告以更有效地从 XML 站点地图中删除低质量的页面,并添加其他遗漏的页面。
常见的站点地图错误
请考虑以下站点地图错误以及如何解决这些错误:
- 无效的 XML 格式: 站点地图必须遵守 XML 格式规则。使用正确的 XML 语法构建您的站点地图。如前所述,使用 XML 验证器来验证您的站点地图。
- 被 robots.txt 阻止、无法访问或未跟进的 URL: 根据您是否要为这些 URL 编制索引,您必须解除阻止或将它们从站点地图中删除。
- URL 缺失或不正确: 验证站点地图中包含的所有 URL 是否正确且可访问。检查是否有任何缺失或损坏的链接并相应地更新它们。此外,请包含每个 URL 的规范版本,以防止出现重复内容问题。
- 较大的站点地图大小: 如果您的站点地图超过允许的最大大小(通常为 50 MB 或 50,000 个 URL),请将其划分为多个站点地图,并创建一个站点地图索引文件来引用它们。
- 路径不匹配: 确保站点地图中 URL 中存在 “www” 的一致性。如果您的站点地图位于 https://example.com/sitemap.xml,则其包含的任何 URL 都不应包含 www。如果您的站点地图位于 https://www.example.com/sitemap.xml,则它列出的所有 URL 都应包含 www。
考虑使用 Website Audit 工具来检测站点地图错误并将它们合并到一个单独的报告中。它将显示您是否对 XML 站点地图中的 noindex 页面、XML 站点地图中的非规范页面、XML 站点地图中的 3XX/4XX/5XX 页面等等有问题。
定期监控您的站点地图、评估其结构并及时解决任何错误或问题有助于搜索引擎有效地抓取和索引您的网站。