Code前端首页关于Code前端联系我们

rel=canonical tag 和 SEO:为相似或重复的网页指定权威版本

terry 2年前 (2023-09-26) 阅读数 49 #网站优化

看一下下面的语句:

rel=canonical标签与SEO:为类似或重复网页指定权威版本

tag 你应该知道它位于 内的元素标签,定义文档与外部资源之间的关系。并且 rel 标签中的属性,canonical ♶♿ 值是属性 。

好吧,现在开始进入正题,解释一下rel=canonical的重要性以及如何使用这个属性。

使用 rel=canonical 为相似或重复的页面指定规范页面

如果您有一个可从多个 URL 访问的页面,或者您有包含相似内容的不同页面(例如,如果(一个页面有一个移动版本(也是桌面版本),那么你必须明确告诉搜索引擎哪个URL是该页面的权威URL(authoritative URL)。否则,搜索引擎将为您做出选择或将两个版本视为相同,这可能会导致一些不适当的行为。

请注意,虽然建议您为重复的 URL 或版本指定权威页面,但搜索引擎可能会出于各种原因(例如性能或内容)通过算法选择不同的页面作为规范页面。

为什么我的网站上有相似/重复的页面?

您的网站上有多个不同的 URL 指向同一页面,或者在不同的 URL 上有重复的页面或非常相似的页面,这可能是有正当理由的。以下是最常见的原因:

支持更多设备类型:

  • https://example.com/news/koala-rampage
  • https://m.example.com/news/koala-rampage
  • https://amp.example.com/news/koala-rampage

要为搜索参数或会话 ID 等启用动态 URL:

  • https://www.example.com / products?category =dresses&color=green
  • https://example.com/dresses/cocktail?gclid=ABCD
  • https://www.example.com/dresses/green/greendress.html

当您放置同一篇博文同时出现在多个版块中,您的博客系统会自动存储多个URL。

  • https://blog.example.com/kjoler/green-dresses-are-awesome/
  • https://blog.example.com/green-things/green-dresses-are-awesome/

您的服务器配置为针对 www/非 www http/https 变体提供相同的内容:

  • http://example.com/green-dresses
  • https://example.com/green-dresses dresses
  • http://www.example.com/green-dresses

您在相应博客上提供的用于在其他网站上转载的内容是这些域上原始内容的完整或部分副本:

  • https ://news.example.com/grørnne-kjoler-til-hver-dag-155672.html(转载博客文章)
  • https://blog.example.com/kjoler/grørnne-kjoler-er-amazing/ 3245 /(原始博客文章)

具体细节

当搜索引擎对网站进行索引时,它会尝试确定网站每个页面上涵盖的主题。如果网络爬虫在同一网站上发现多个页面似乎包含相同的内容,它会选择它认为最完整和最有用的页面,并将其标记为规范。为了节省网站的抓取预算,抓取工具将经常抓取权威页面,而不是经常抓取重复页面。因此,如果你没有告诉爬虫哪个页面是权威的,而你决定将另一个页面(爬虫选择的页面除外)设为规范页面,那么爬虫可能不会经常索引该页面。你已经仔细更新了。在搜索结果中索引或显示页面。

爬虫会以您网站上的权威页面作为网站内容的黄金标准来评估网站内容和质量。搜索引擎的搜索结果通常会指向权威页面,除非重复的页面明显匹配用户的查询:如果用户例如在移动设备上,即使桌面页面被标记为规范,搜索结果也可能指向移动页面。

搜索引擎根据多种因素(或“信号”)选择权威页面,例如页面是通过 http 还是 https 提供服务;用户声明的首选域;页面的质量; URL 是否出现在站点地图中;以及任何“rel=canonical”标签。您不能强制搜索引擎将页面选择为规范页面,但您可以使用下述一种或多种方法影响其选择。

为什么指定权威页面很重要

在一组重复/相似页面中明确选择权威页面可以满足您的许多需求,如下所示:

  • 指定您希望用户在搜索结果中看到的内容。 您可能希望用户通过 https://www.example.com/dresses/green/greendress.html(而不是 https://example.com/dresses/cocktail?gclid=ABCD)访问您的绿色连衣裙产品页。
  • 集成来自相似或重复网页的链接信号。 明确选择权威页面有助于搜索引擎将他们在各个 URL 上找到的信息(例如指向它们的链接)合并到一个首选 URL 中。也就是说,来自另一个站点的 http://example.com/dresses/cocktail?gclid=ABCD 的链接将与 https://www.example.com/dresses/green/greendress.html 的链接集成。
  • 简化单个主题/项目的跟踪指标。 当多个 URL 提供特定内容时,获取该内容的综合指标可能会更加困难。
  • 管理转发的内容。 如果您要重新发布内容以分发到其他域,则必须将页面位置嵌入您的首选 URL 中。
  • 避免花时间爬行重复的网页。 您肯定希望搜索引擎能够最大化您网站的价值,因此最好让它花时间爬行您网站上的新(或更新)页面,而不是爬行同一页面的桌面版本。和移动版本。

指定权威网页的三种常用方法

1、rel=canonical标签

在网页上的所有复制者中添加一个

指向权威网页。

优点:

  • 可以映射无限重复的网页。

缺点:

  • 可能导致页面尺寸增大。
  • 在大型站点或 URL 频繁更改的站点上维护映射可能会很复杂。
  • 仅适用于 HTML 网页,不适用于 PDF 等文件(在这种情况下,您可以使用 rel=canonical HTTP 标头)。

2。 rel=canonical HTTP 标头

在 Web 响应中发送 rel=canonical 标头。

优点:

  • 不会增加网页的大小。
  • 可以映射无限重复的网页。

缺点:

  • 在大型站点或 URL 频繁更改的站点上维护映射可能会很复杂。

3。 301 重定向

使用 301 重定向定期告诉搜索重定向的 URL 是给定 URL 的更好版本。仅当您弃用重复页面时才使用此方法。

具体方法

如果您想为重复的URL或重复/相似的页面指定权威URL,请选择以下方法之一。

使用 rel="canonical" 链接标签

您可以在标题中使用 标签来指示某个页面与另一个页面重复。

假设您想将 https://example.com/dresses/green-dresses 设置为权威 URL(即有很多 URL 指向此内容),那么您可以通过以下方式将此 URL 设置为权威 URL:执行以下步骤:

1。使用链接元素 rel="canonical" 标记所有重复的网页。将 rel="canonical" 元素添加到重复页面的 部分,并将其指向权威页面,如下所示 显示为: ♼❀❙ "canonical" href = “https://example.com/kjoler/grønne-kjoler”/>

2。如果权威网页有对应的手机版本,请注明。它添加了链接 rel="alternate" 并将其指向此页面的移动版本:

使用 rel="canonical" HTTP 标头

如果您可以配置自己的服务器,则可以使用 rel =“规范” HTTP 标头(而不是 HTML 标记)指定非 HTML 文档(例如 PDF 文件)的规范 URL。

如果您例如通过多个 URL 提供 PDF 文件,您可以为重复的 URL 返回以下 rel="canonical" HTTP 标头,以告知爬虫该 PDF 文件的权威 URL :

  • 链接: ; rel="canonical"

对于rel="canonical"链接元素,请使用绝对路径(而非相对路径)


  • 推荐结构:https://www.example.com/dresses/green/greendresss.html
    已弃用的结构:/dresses/green/greendress.html

    1 重定向1 方法(如果您想删除现有的)重复页面,但必须确保在禁用旧 URL 之前成功迁移。

    假设用户可以通过以下方式访问您的页面:

    • https://example.com/home
    • https://home.example.com
    • https://www.example。 com

    您可以选择这些 URL 之一作为您的规范 URL,并使用 301 重定向将流量从其他 URL 引导到您的首选 URL。服务器页面 301 重定向是确保用户和搜索引擎定向到正确网页的最佳方式。 301 状态代码表示页面已永久移动到新位置。

    无论您使用哪种方法,请务必遵循以下一般准则

    • 请勿将文件robots.txt用于权威目的。
    • 请勿将 URL 删除工具用于权威目的:它将从搜索结果中删除该 URL 的所有版本。
    • 不要使用相同或不同的规范方法为同一页面指定不同的规范URL(例如,不要为站点地图中的页面指定两个规范URL,并使用rel =“canonical” 表示同一页面的不同规范 URL)。
    • 不要使用noindex作为阻止选择权威页面的方法。该指令旨在从索引中排除页面,而不是控制规范页面的选择。
    • 使用hreflang标签时,一定要指定权威页面。提供同种语言的权威页面,或者如果没有这样的权威页面,则提供最佳替代语言的权威页面。

    优先选择 HTTPS(相对于 HTTP)作为权威 URL

    搜索引擎将优先选择 HTTPS 页面(相对于相应的 HTTP 页面)作为权威 URL,除非存在问题或冲突信号,例如:

    • HTTPS - 证书页面无效。
    • HTTPS 页面包含不安全的关联功能(图像除外)。
    • HTTPS 页面将用户重定向到 HTTP 页面或从 HTTP 页面重定向用户。
    • HTTPS 页面包含 rel="canonical" 指向 HTTP 页面的链接。

    虽然默认情况下搜索引擎更喜欢 HTTPS 页面而不是 HTTP 页面,但您可以通过执行以下操作之一来确保始终发生此行为:

    • 添加从 HTTP 页面到 HTTPS 页面重定向的链接。
    • 添加从 HTTP 页面到 HTTPS 页面的 rel="canonical" 链接。

    为了防止搜索引擎错误地选择 HTTP 页面作为权威页面,您应该避免以下做法:

    • 使用不正确的 SSL 证书和 HTTPS-HTTP 重定向。这很容易导致搜索引擎更喜欢HTTP,即使实现HSTS也无法取代这种强烈的偏好。
    • 在站点地图或 hreflang 条目中包含 HTTP 页面(而不是 HTTPS 版本)。
    • 为错误的主机版本实施 SSL/TLS 证书:例如,在 example.com 上为 www.example.com 提供证书。该证书必须与您的完整网站 URL 匹配,或者是可用于同一域的多个子域的通配符。

版权声明

本文仅代表作者观点,不代表Code前端网立场。
本文系作者Code前端网发表,如需转载,请注明页面地址。

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

热门