首页 > 其他分享 >谷歌系统垃圾内容认定政策分析

谷歌系统垃圾内容认定政策分析

时间:2023-09-26 18:02:08浏览次数:33  
标签:网页 网站 谷歌 用户 内容 垃圾 认定 链接

我们的垃圾内容政策有助于保护用户的安全,并提升搜索结果的质量。要想让内容能够显示在 Google 网页搜索结果(网页、图片、视频、新闻内容或 Google 在网络上发现的其他内容)中,相应内容不得违反 Google 搜索的总体政策或本页列出的垃圾内容政策。这些政策适用于所有网页搜索结果,包括 Google 自有资源中的搜索结果。

除了通过自动化系统检测违反政策的内容和行为以外,我们也会根据需要执行人工审核,进而采取人工处置措施。违反我们政策的网站可能会在搜索结果中排名较低,或者完全不会显示在搜索结果中。

如果您认为某个网站违反了 Google 的垃圾内容政策,请提交搜索质量用户报告告知我们。 我们专注于开发可扩容的自动解决方案来解决上述问题,并会使用上述报告进一步改进我们的垃圾内容检测系统。

我们的政策涵盖常见的垃圾内容形式,但 Google 可能会针对我们检测到的任何类型的垃圾内容采取相应措施。

伪装真实内容

伪装真实内容指的是为了操纵搜索排名并误导用户而向用户和搜索引擎分别呈现不同内容的做法。伪装真实内容的示例包括:

向搜索引擎显示关于旅行目的地的网页,同时向用户显示关于折扣药品的网页

仅当请求网页的用户代理是搜索引擎而非人类访问者时,才在网页中插入文字或关键字

如果您的网站采用了搜索引擎难以访问的技术(例如 JavaScript 或图片),请参考我们的建议,了解如何让搜索引擎和用户都可以访问这些内容,而不会伪装真实内容。

如果网站被黑,黑客通常可能会伪装真实内容,让网站所有者很难检测到被黑内容。详细了解如何修复被黑网站并避免遭到黑客入侵。

在您设置了付费墙或内容设限机制的情况下,如果 Google 能够像可以访问设限内容的任何用户那样,看到付费墙背后的完整内容,并且您遵循了实施灵活抽样时需遵循的常规指南,则此行为不视为伪装真实内容。

门页

门页是指针对特定、相似搜索查询而专门创建的网站或网页,其目的是提高网站排名。此类内容会将用户转到中间网页,这些网页并不像最终的目标网页那样有用。门页的示例包括:

拥有多个网站,仅网址和首页稍作更改,以便尽可能覆盖任何特定查询

拥有以覆盖特定地区/城市用户为目标的多个域名或网页,以将用户引导到同一个网页

为了将访问者引导至您网站上的实用部分或相关部分而生成的网页

网站内部没有明确定义且可浏览的层次结构,只提供多个内容大致相同的网页,结构类似于搜索结果列表

被黑内容

被黑内容是指因网站存在安全漏洞而被黑客擅自(未经许可)放到网站上的所有内容。被黑内容无法为用户提供实用的搜索结果,而且可能会在用户的计算机上安装恶意内容。黑客入侵行为的示例包括:

代码注入:黑客获得您网站的访问权限之后,可能会尝试在您网站的现有网页中注入恶意代码。通常是将恶意 JavaScript 直接注入到网站或 iframe 中。

网页注入:有些时候,由于存在安全缺陷,黑客能够将包含垃圾内容或恶意内容的新网页添加到您的网站中。黑客通常会使用这些网页来操纵搜索引擎,或企图实施钓鱼式注入。 您现有的网页可能不会显示黑客入侵迹象,但这些新建的网页可能会危害您网站的访问者或影响您网站在搜索结果中的表现。

内容注入:黑客还可能会试图以不易察觉的方式操纵您网站上的现有网页。其目的是将搜索引擎可以发现而您和您的用户却很难认出的内容添加到您的网站中。这可能包括使用 CSS 或 HTML 将隐藏链接或隐藏文字添加到网页中,也可能包括更为复杂的更改,例如伪装真实内容。

重定向:黑客可能会将恶意代码注入您的网站中,这些代码会将部分用户重定向到有害网页或垃圾网页。此类重定向有时需依靠引荐来源网址、特定用户代理或设备才能运行。例如,点击 Google 搜索结果中的某个网址可能会将您重定向到可疑网页,但如果您直接通过浏览器访问同一网址,却不会发生重定向。

隐藏文字和链接

隐藏文字或链接是放置在网页上的内容,其目的单纯是为了操纵搜索引擎,而不是方便人类访问者查看。违反我们政策的隐藏文字或链接的示例包括:

在白色背景上显示白色文字

将文字隐藏在图片后面

使用 CSS 将文字放在画面外

将字体大小或不透明度设为 0

通过只链接一个小字符(例如段落中间的连字符)来隐藏链接

如今,许多网页设计元素会动态显示和隐藏内容,从而改善用户体验;以下元素不违反我们的政策:

手风琴式折叠内容或标签页式内容,可在隐藏和显示更多内容之间切换

在多张图片或文本段落之间循环显示的幻灯片或滑块

用户与某元素互动时会显示额外内容的提示或类似文字

只有屏幕阅读器可以访问、旨在改善屏幕阅读器用户体验的文字

关键字堆砌

关键字堆砌是指在网页中大量使用关键字或数字,试图操纵网页在 Google 搜索结果中的排名的做法。这些关键字通常以列表或群组形式显示(较为突兀),或与上下文无关。关键字堆砌的示例包括:

没有实质作用的电话号码列表

罗列城市和地区的文本块,目的是帮助网页提高排名

频繁重复相同的字词或短语,读起来很不自然。例如:

无限制应用商店抵用金。很多网站都声称免费提供应用商店抵用金,但都是假的,不过是为了欺骗想要获得无限制应用商店抵用金的用户。您可以直接在本网站上获取无限制应用商店抵用金。 立即访问相关页面,获取我们的无限制应用商店抵用金!

垃圾链接

在确定网页与搜索字词的相关性时,Google 将链接作为一个重要因素。任何企图操纵网页在 Google 搜索结果中排名的链接都可能被视为垃圾链接,其中包括所有对您网站的入站链接或出站链接进行操纵的行为。以下是垃圾链接的示例:

出于排名目的购买或销售链接。其中包括:

花钱购买链接或包含链接的帖子

用产品或服务交换链接

向他人发送产品,以此作为交换条件,让这些人撰写包含链接的产品评论

链接交换(“链接到我,我也会链接到你”)过多,或单纯为了建立交叉链接而构建的合作伙伴网页过多

使用自动程序或服务创建指向您的网站的链接

将链接列为服务条款、合同或类似协议的必要条件,而且不允许第三方内容所有者限定该出站链接

不会影响排名权重传递的文字广告或文字链接

通过在文章中包含可传递排名权重的链接,或以优化定位文字指向其他网站上所发布文章、客座博文或新闻稿的链接来收费的软文广告或原生广告。例如:

市面上有很多款婚戒。如果您要举办婚礼,就必须挑选最好的婚戒。您还需要买花和婚纱。

劣质的目录或书签站点链接

富含关键字的链接、隐藏链接或低劣链接,通常嵌入微件中并发布到各类网站中

在各种网站的页脚或模板中广泛分布的链接

帖子或签名中带有优化链接的论坛评论,例如:

谢谢,信息非常实用!- 张华张华茶楼 南京茶楼 南京最好的茶楼

Google 确实知道,出于广告和赞助目的,购买和销售链接属于正常的网络经营活动。只要此类链接符合条件(<a> 标记设置了 rel="nofollow" 或 rel="sponsored" 属性值),便不会违反我们的政策。

机器生成的流量

机器生成的流量会消耗资源,阻碍我们为用户提供最佳服务。自动流量的示例包括:

向 Google 发送自动查询

出于排名检查目的而爬取结果或其他各类未经许可而自动访问 Google 搜索的行为

此类活动违反了我们的垃圾内容政策和 Google 服务条款。

恶意软件和恶意行为

Google 会检查网站上是否托管了会损害用户体验的恶意软件或垃圾软件。

恶意软件是指符合以下特征的所有软件或移动应用:蓄意危害计算机、移动设备、计算机/移动设备上运行的软件或计算机/移动设备用户。恶意软件会表现出各种恶意行为,其中包括:未经用户同意就擅自安装软件,以及安装有害软件。有时网站所有者并未意识到其网站上的可下载文件会被视为恶意软件,因此在无意中托管了此类二进制文件。

垃圾软件是指会出现以下行为的可执行文件或移动应用:具有欺骗性/意外性,或者会对用户的浏览/计算体验造成负面影响。例如,有些垃圾软件会擅自更改浏览器的主页或其他设置,或在没有适当披露的情况下泄露隐私和个人信息。

网站所有者应确保自己没有违反垃圾软件政策,并确保遵循我们的指南。

误导性功能

网站所有者应打造高品质内容网站,提供对用户有益的实用功能。然而,有些网站所有者企图通过创建提供误导性功能和服务的网站来操纵搜索排名,这类网站会导致用户误以为他们可以访问某些内容或服务,但实际上却无法访问。误导性功能的示例包括:

网站包含虚假生成器,声称会提供应用商店抵用金、但实际上并不提供此类抵用金

网站声称会提供某些功能(例如 PDF 合并、倒计时器、在线字典服务),但故意引诱用户访问欺骗性广告,而不提供所声称的服务

抄袭内容

有些网站所有者会根据从其他网站(通常为更有名气的网站)获取(“抄袭”)的内容来建立网站。如果网页中的内容都是抄袭而来,网站本身不能提供实用服务或内容,即便内容取自高质量的网站,也不会为用户带来任何价值。此类行为还有可能侵犯版权。如果网站收到大量有效的依法移除要求,还可能会被降位。滥用抄袭的示例包括:

复制和重新发布其他网站的内容,而不增加任何原创内容或无任何附加价值,甚至引用了原始来源

复制其他网站的内容,对其略做修改(例如,替换同义词或使用自动技术)后重新发布

复制其他网站的内容 Feed,而没有给用户带来任何独特的好处

专门嵌入或汇编来自其他网站的视频、图片等媒体内容,而不向用户提供实质性附加值

欺骗性重定向

重定向是将访问者引导到其他网址(而非其原本请求的网址)的行为。欺骗性重定向是指向用户和搜索引擎分别呈现不同内容,或者向用户显示无法满足其原始需求的意外内容的恶意行为。欺骗性重定向的示例包括:

向搜索引擎呈现一种内容,同时将用户重定向到截然不同的其他内容

向桌面设备用户呈现正常网页,同时将移动设备用户重定向到完全不同的垃圾网域

虽然欺骗性重定向是一种网络垃圾,出于很多与网络垃圾无关的正当原因,我们需要将一个网址重定向到另一个网址。正当重定向的示例包括:

将网站迁移到新地址

将多个网页整合到一个网页

在用户登录后将其重定向到内部网页

在检查重定向是否存在欺骗性时,请考虑重定向是否旨在欺骗用户或搜索引擎。详细了解如何在网站上合理使用重定向。

自动生成的垃圾内容

自动生成的垃圾内容是指程序化生成的内容,这类内容没有原创性,也没有增加足够的价值;其主要目的是操纵搜索排名,而非帮助用户。自动生成的垃圾内容示例包括:

对读者没有意义但包含搜索关键字的文字

使用自动化工具翻译且在发布之前未经过人工审核或润饰的文字

通过自动化流程生成的文字,未考虑质量或用户体验

使用自动列举同义词、同义转换或混淆技术生成的文字

通过爬取 Feed 或搜索结果生成的文字

由不同网页中的内容拼贴或组合而成但没有附加足够价值的内容

如果您的网站托管了此类内容,您可以使用这些方法阻止 Google 搜索将其编入索引。

内容贫乏的联属网站上的网页

内容贫乏的联属网站上的网页是指带有商品联属营销链接的网页,其中的商品说明和评价是直接从原始商家复制而来,没有任何原创内容或附加值。

如果联属网站上的网页所属的计划会在整个联属网络中分发其内容,而不提供额外价值,则该网页被视为内容贫乏。这些网站往往千篇一律,要么是在同一网站内以模板化的方式提供相同或相似的内容,要么是在多个网域内或以多种语言提供此类内容。如果搜索结果页返回了多个来自此类网站的结果,并且这些结果提供相同内容,内容贫乏的联属网站上的网页会导致用户体验不佳。

然而,并非所有参与联属营销计划的网站都是内容贫乏的联属网站。优质联属网站会通过提供有意义的内容或功能来增加价值。优质联属网页的示例包括:提供有关价格的额外信息、原创商品评价、严格测试和评分、商品或类别导航以及商品对比。

用户生成的垃圾内容

用户生成的垃圾内容是指用户通过供用户输入内容的渠道向网站添加的垃圾内容。网站所有者通常对此类垃圾内容并不知情。用户生成的垃圾内容的示例包括:

任何人都可以注册的托管服务中的垃圾帐号

论坛会话中的垃圾帖子

博客上的垃圾评论

上传至文件托管平台的垃圾文件

点击此处即可了解一些如何阻止用户滥用网站公开区域的提示。请参阅此页面中的提示来修复被黑客入侵的网站和避免遭到黑客入侵。

其他可能导致网站遭降位或移除的行为

依法移除

如果收到大量涉及特定网站的有效版权内容移除要求,我们会据此降低该网站中其他内容在搜索结果中的排名。这样,如果存在其他侵权内容,用户更可能看到原始内容,而非相应侵权内容。对于涉及诽谤、仿冒产品和法院命令移除的投诉,我们会采用类似的降位衡量因素。

移除个人信息

如果我们处理的大量个人信息移除要求涉及某个采用有偿移除做法的网站,我们会降低该网站中其他内容在搜索结果中的排名。我们也会设法了解其他网站是否存在同类行为;如果有,则对此类网站上的内容采取降位措施。对于收到大量人肉搜索内容移除要求的网站,我们可能会采取类似的降位做法。此外,我们还采取了自动保护措施,防止未经当事人同意而发布的露骨个人图片在涉及相关姓名的查询中获得较高的排名。

规避政策

如果您继续采取措施来绕过我们的垃圾内容政策或 Google 搜索内容政策,我们可能会采取相应措施,包括限制或撤消对某些搜索功能(例如焦点新闻、Google 探索)的使用资格。规避行为包括但不限于:

创建或使用多个网站,旨在继续违反我们的政策

使用其他方法继续散布违反我们政策的内容或从事违反我们政策的行为

欺骗和欺诈

欺骗和欺诈行为有多种形式,包括但不限于通过假冒网站冒充官方企业或服务,故意显示与企业或服务有关的虚假信息,或以其他方式诱使用户访问虚假网站。Google 会使用自动化系统识别包含欺骗性或欺诈性内容的网页,并阻止其显示在 Google 搜索结果中。网上欺骗和诈骗的示例包括:

冒充知名企业或服务提供商,诱使用户向错误收款方付款

创建欺骗性网站,伪装成代表合法企业提供官方客户服务或提供此类企业的虚假联系信息

标签:网页,网站,谷歌,用户,内容,垃圾,认定,链接
From: https://blog.51cto.com/u_16211399/7611236

相关文章

  • 喜报 | 谷器数据荣获“专精特新中小企业”认定!
    近日,北京市经济和信息化局公布了2023年第二季度专精特新中小企业认定名单。经过专业的审查和公示,谷器数据凭借聚焦于制造领域的卓越产品能力成功入选!“专精特新”是“专业化、精细化、特色化、新颖化”的简称。“专精特新”企业评选认定严格,从企业的经营条件、专业化程度、创新制造......
  • 谷歌搜索引擎排名的因素之一署名日期
    署名日期是指Google估计的网页更新或发布日期。如果Google能确定您的网页或视频的署名日期,并且认为这些信息对用户有用,就会在Google搜索结果中显示这些信息。您可以提供相关信息,帮助Google确定署名日期。Google不会仅依赖1种因素来确定日期,因为所有因素都可能会出现问......
  • 谷歌优化之确保链接可供抓取
    bookmark_border只有当您的链接使用正确的 <a> 标记和可解析的网址时,Google才能跟踪这些链接:使用正确的 <a> 标记只有链接是含有 href 属性的 <a> 标记时,Google才能跟踪这些链接。Google的抓取工具不会跟踪使用其他格式的链接。Google无法跟踪缺少 href 属性的 <a>......
  • 不同垃圾收集器的简介
    SerialNew(串行新生代收集器):这个收集器主要用于新生代,采用复制算法。它将新对象复制到一块干净的内存区域,并且在收集过程中会暂停应用程序的执行。ParallelNew(并行新生代收集器):与串行新生代收集器类似,也用于新生代,采用复制算法。不同之处在于它使用多线程来加速垃圾收集过程,提......
  • 谷歌JavaScript SEO 基础知识
    JavaScript是网络平台的重要组成部分,因为它提供的很多功能可将网络转变成一个非常强大的应用平台。请设法让用户能够通过Google搜索轻松找到您的由JavaScript提供支持的网络应用,这样做有助于您在用户搜索您的网络应用所提供的内容时找到新用户并再度吸引现有用户。虽然Googl......
  • 喜报 | 谷器数据荣获“专精特新中小企业”认定!
    近日,北京市经济和信息化局公布了2023年第二季度专精特新中小企业认定名单。经过专业的审查和公示,谷器数据凭借聚焦于制造领域的卓越产品能力成功入选!“专精特新”是“专业化、精细化、特色化、新颖化”的简称。“专精特新”企业评选认定严格,从企业的经营条件、专业化程度、创新制造......
  • 微软推出统一 Copilot AI 助手;谷歌拟自主研发 AI 芯片;苹果拟在国内引进新的 OLED 供应
    开发者朋友们大家好:这里是「RTE开发者日报」,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享RTE(RealTimeEngagement)领域内「有话题的新闻」、「有态度的观点」、「有意思的数据」、「有思考的文章」、「有看点的会议」,但内容仅代表编辑的个人观点,欢迎大家留......
  • 成功入选 2023 谷歌出海创业加速器,Tapdata 乘势远航Tapdata Connector 实用指南:如何将
    9月6日,2023Google开发者大会的收官之行于上海拉开帷幕。会间,官方正式公布了最新一期谷歌出海创业加速器入营名单,Tapdata成功入选:长期以来,Google开发者大会为开发者提供了一个独一无二的学习和合作机会,这是一场汇聚全球创新者的聚会,鼓励创新思维。从中能够深入了解最新的......
  • 聊城高新技术企业认定中的专利能多次使用吗
    聊城高新技术企业认定中的专利能多次使用吗恒标知产刘经理 根据高企认定办法,在知识产权的使用次数上,按Ⅱ类评价的知识产权在申请高新技术企业时,仅限使用一次,Ⅰ类知识产权不限次数。例:A公司拥有1项发明专利、5项实用新型专利、5项软著并于2016年顺利通过高企认定,其后,A公司的子公司......
  • 谷歌优化里的cache: 搜索运算符
    cache: 运算符是可用于查找网页的缓存版本的搜索运算符。Google会生成缓存版本,以便在网站无法访问的情况下,用户仍可访问网页。cache: 运算符只能用于网页搜索。虽然Google缓存的目标受众群体是Google搜索用户,但它对网站创建者和开发者了解Google在将网页编入索引时看到的......