首页 > 其他分享 >http状态返回码对谷歌优化的影响

http状态返回码对谷歌优化的影响

时间:2023-09-27 19:04:39浏览次数:30  
标签:状态 网页 Googlebot 错误 代码 谷歌 404 码对 http

HTTP 状态代码是由托管网站的服务器在对客户端(如浏览器或抓取工具)发出的请求作出响应时生成的。每个 HTTP 状态代码都有不同的含义,但请求结果往往相同。例如,有多个状态代码会发出重定向信号,但它们的结果是相同的。

Search Console 会为 4xx–5xx 范围内的状态代码和失败的重定向 (3xx) 生成错误消息。如果服务器返回 2xx 状态代码,则响应中接收到的内容可能会被考虑编入索引。

HTTP 2xx (success) 状态代码并不能保证一定会编入索引。

下表包含 Googlebot 最常遇到的 HTTP 状态代码,并解释了 Google 如何处理各个状态代码。

HTTP 状态代码

2xx

Google 会考虑将内容编入索引。如果内容表明有错误,例如空网页或错误消息,则 Search Console 会显示 soft 404 错误。

3xx

Googlebot 会跟踪最多 10 次重定向。如果抓取工具在 10 次重定向内没有收到内容,则 Search Console 会在网站的“网页索引编制”报告中显示重定向错误。Googlebot 跟踪的重定向次数取决于用户代理;例如,Googlebot(智能手机版)的重定向次数值可能不同于 Googlebot Image。

对于 robots.txt,Googlebot 会按照 RFC 1945 的规定跟踪至少五次重定向,然后便会停止,并将其作为 robots.txt 文件的 404 错误处理。

Googlebot 重定向网址中收到的任何内容都会被忽略,最终目标网址的内容会被考虑编入索引。

虽然 Google 搜索会以相同的方式处理这些状态代码,但请注意,它们在语义上是不同的。请使用适合重定向的状态代码,以便其他客户端(例如电子阅读器、其他搜索引擎)可以从中受益。

4xx

Google 的索引编制流水线不会考虑将返回 4xx 状态代码的网址编入索引,而已编入索引且返回 4xx 状态代码的网址会从索引中移除。

Googlebot 从会返回 4xx 状态代码的网址收到任何内容都将被忽略。

5xx

5xx 和 429 服务器错误会提示 Google 抓取工具暂时减慢抓取速度。已编入索引的网址仍会保留在索引中,但最终会被丢弃。

如果 robots.txt 文件返回服务器错误状态代码的时间超过 30 天,Google 会使用 robots.txt 的最后一个缓存副本。如果没有缓存副本,Google 会假定没有任何抓取限制。

Googlebot 从会返回 5xx 状态代码的网址收到任何内容都将被忽略。


200


201

202

Googlebot 会等待内容一段时间,然后将其接收的任何内容传递给索引编制流水线。超时时长取决于用户代理,例如,Googlebot(智能手机版)的超时时长可能与 Googlebot Image 的不同。

204

Googlebot 会向索引编制流水线发出信号,指示它未收到任何内容。Search Console 可能会在网站的“网页索引编制”报告中显示 soft 404 错误。

soft 404

soft 404 错误是一个网址,会在返回的页面中向用户表明目标网页不存在,同时还会返回 200 (success) 状态代码。在某些情况下,软 404 可能是一个不含任何主要内容的页面或是一个空页面。

此类网页可能是由网站的网络服务器、内容管理系统或用户的浏览器出于各种原因生成的。例如:

缺少服务器端包含 (SSI) 文件。

与数据库的连接中断。

空的内部搜索结果页。

未加载或缺少 JavaScript 文件。

返回 200 (success) 状态代码,但在网页上显示或建议了错误消息或某种类型的错误,这会导致糟糕的用户体验。用户可能会认为该网页是正常运行的网页,但之后却出现了某种错误。此类网页不会显示在搜索结果中。

当 Google 算法根据网页的内容检测到该网页实际上是错误网页时,Search Console 会在网站的“网页索引编制”报告中显示 soft 404 错误。

修正 soft 404 错误

您可以通过多种方式解决 soft 404 错误,具体取决于网页的状态和您想要的结果:

网页和内容已不再存在。

网页或内容现已移到别处。

网页和内容仍然存在。

请尝试确定最适合用户的解决方案。

网页和内容已不再存在

如果您移除了相应网页,并且您的网站上没有含类似内容的替换网页,请针对该网页返回 404 (not found) 或 410 (gone) 响应(状态)代码。这些状态代码会告知搜索引擎:该网页不存在,相应内容不应编入索引。

如果您有权访问服务器的配置文件,可以自定义这类错误页面,以便为用户提供帮助。一个好的自定义 404 页面会帮助用户找到所需信息,还会提供其他实用内容,促使用户进一步浏览您的网站。以下是一些技巧,帮助您设计实用的自定义 404 页面:

明确告诉访问者无法找到其要找的网页。采用友好并有吸引力的语言。

确保 404 页面的外观和风格(包括导航方式)与您网站的其他网页一致。

考虑添加指向以下内容的链接:您的最热门文章/博文以及网站首页。

不妨提供一种供用户报告链接损坏的方式。

自定义 404 网页是专为用户创建的。由于从搜索引擎的角度来看,这些网页没有任何用处,因此请确保服务器返回 404 HTTP 状态代码,以防止这些网页被编入索引。

网页或内容现已移到别处

如果您的网页已移走或有明确的替换网页,请返回 301 (permanent redirect) 以重定向用户。这样做不会中断用户的浏览体验,还是一种将网页新位置告知搜索引擎的好办法。请使用网址检查工具验证您的网址是否确实返回了正确的代码。

网页和内容仍然存在

如果系统将某个本身正常的网页标记为 soft 404 错误,可能是因为 Googlebot 无法加载该网页、该网页在呈现期间缺少重要资源或显示醒目的错误消息。请使用网址检查工具检查呈现的内容和返回的 HTTP 代码。如果呈现的是空白、几乎空白的网页或内容显示错误消息,可能是因为您的网页引用了许多无法加载的资源(图片、脚本和其他非文本元素),这种情况可解读为 soft 404 错误。无法加载资源的原因包括:资源被屏蔽(遭到 robots.txt 屏蔽)、网页包含的资源过多/过大、各类服务器错误或者资源加载速度缓慢。

标签:状态,网页,Googlebot,错误,代码,谷歌,404,码对,http
From: https://blog.51cto.com/u_16211399/7627502

相关文章

  • HTTP代理SSL连接:保障网络安全的重要协议
    HTTP代理SSL连接是一种重要的协议,用于保障网络安全。在这篇文章中,我们将会介绍HTTP代理SSL连接的基本原理、优点以及如何使用它来保护我们的网络安全。一、HTTP代理SSL连接的基本原理HTTP代理SSL连接是把HTTP通信转化为SSL协议通信的一种方式。在正常的HTTP协议连接中,数据是以明文......
  • 外贸企业网站做谷歌SEO优化没转化怎么办?
    如果您的外贸企业网站在经过谷歌SEO优化后仍然没有获得预期的转化效果,这可能意味着您的优化策略需要重新审视和调整。以下是谷歌seo优化服务商九凌网络的一些建议,帮助您解决这个问题:1.重新定义目标关键词首先,确保您了解您的目标受众是谁,以及他们可能会搜索什么关键词来找到您的产......
  • Linux2.1.13网络源代码学习(https://qiankunli.github.io/2022/07/04/linux_2_1_13_ne
    简介简介源码目录网络分层数据结构套接字套接字与vfssk_buff结构网络协议栈实现——数据struct和协议structlinux1.2.13接收数据收到数据包的几种情况Socket读取发送数据面向过程/对象/ioc以下来自linux1.2.13源码,算是参见Linux1.0的学习笔记。源码目......
  • 一步一步实现kbmmw的httpsys使用https功能
    感谢xalion,为我们详细写的文档《一步一步实现kbmmw的httpsys使用https功能》,以下为原文:kbmmw的httpsys的功能已经实现了好长时间,但是现在各个平台都要求使用https来提供服务。今天一步一步来说一下如何使用kbmmw 的httpsys功能支持https.首先为了获得证书,我们可以使用阿里云申请......
  • 使用HttpServletResponse实现curl接口时控制台输出(续)
    上一篇文章的问题在上一篇文章SpringBootRestController接口如何输出到终端中讨论了如何使用HttpSerlvetResponse写入输出流,使应急接口通过curl调用时可以在控制台输出信息,使运维人员知道命令执行情况。但是上一篇文章的问题是,HttpServletResponse是Controller的参数......
  • 彻底搞懂HTTPS03
    原理版点我直达01点我直达02点我直达03代码版点我直达01......
  • 谷歌系统垃圾内容认定政策分析
    我们的垃圾内容政策有助于保护用户的安全,并提升搜索结果的质量。要想让内容能够显示在Google网页搜索结果(网页、图片、视频、新闻内容或Google在网络上发现的其他内容)中,相应内容不得违反 Google搜索的总体政策或本页列出的垃圾内容政策。这些政策适用于所有网页搜索结果,包括......
  • 浏览器输入 http 自动转 https 问题解决方法
    很多朋友问浏览器输入http被自动跳转至https问题,到底该怎么解决呢,其实解决方法很简单,主要关闭浏览器的HSTS功能就可以了IE浏览器1.地址栏中输入edge://net-internals/#hsts2.在Deletedomain中输入项目的域名,并Delete(删除)3.可以在Querydomain测试是否删除成功。Chrome浏览......
  • 谷歌搜索引擎排名的因素之一署名日期
    署名日期是指Google估计的网页更新或发布日期。如果Google能确定您的网页或视频的署名日期,并且认为这些信息对用户有用,就会在Google搜索结果中显示这些信息。您可以提供相关信息,帮助Google确定署名日期。Google不会仅依赖1种因素来确定日期,因为所有因素都可能会出现问......
  • python2 http服务端和客户端
    server.pyimportSimpleHTTPServerimportSocketServerclassMyHandler(SimpleHTTPServer.SimpleHTTPRequestHandler):defdo_GET(self):self.send_response(200)self.send_header('Content-type','text/plain')self......