rel=canonical tag 和 SEO:为相似或重复的网页指定权威版本
看一下下面的语句:
tag 你应该知道它位于
内的元素标签,定义文档与外部资源之间的关系。并且 rel
是 标签中的属性,
canonical
♶♿ 值是属性 。
好吧,现在开始进入正题,解释一下rel=canonical
的重要性以及如何使用这个属性。
使用 rel=canonical 为相似或重复的页面指定规范页面
如果您有一个可从多个 URL 访问的页面,或者您有包含相似内容的不同页面(例如,如果(一个页面有一个移动版本(也是桌面版本),那么你必须明确告诉搜索引擎哪个URL是该页面的权威URL(authoritative URL)。否则,搜索引擎将为您做出选择或将两个版本视为相同,这可能会导致一些不适当的行为。
请注意,虽然建议您为重复的 URL 或版本指定权威页面,但搜索引擎可能会出于各种原因(例如性能或内容)通过算法选择不同的页面作为规范页面。
为什么我的网站上有相似/重复的页面?
您的网站上有多个不同的 URL 指向同一页面,或者在不同的 URL 上有重复的页面或非常相似的页面,这可能是有正当理由的。以下是最常见的原因:
支持更多设备类型:
- https://example.com/news/koala-rampage
- https://m.example.com/news/koala-rampage
- https://amp.example.com/news/koala-rampage
要为搜索参数或会话 ID 等启用动态 URL:
- https://www.example.com / products?category =dresses&color=green
- https://example.com/dresses/cocktail?gclid=ABCD
- https://www.example.com/dresses/green/greendress.html
当您放置同一篇博文同时出现在多个版块中,您的博客系统会自动存储多个URL。
- https://blog.example.com/kjoler/green-dresses-are-awesome/
- https://blog.example.com/green-things/green-dresses-are-awesome/
您的服务器配置为针对 www/非 www http/https 变体提供相同的内容:
- http://example.com/green-dresses
- https://example.com/green-dresses dresses
- http://www.example.com/green-dresses
您在相应博客上提供的用于在其他网站上转载的内容是这些域上原始内容的完整或部分副本:
- https ://news.example.com/grørnne-kjoler-til-hver-dag-155672.html(转载博客文章)
- https://blog.example.com/kjoler/grørnne-kjoler-er-amazing/ 3245 /(原始博客文章)
具体细节
当搜索引擎对网站进行索引时,它会尝试确定网站每个页面上涵盖的主题。如果网络爬虫在同一网站上发现多个页面似乎包含相同的内容,它会选择它认为最完整和最有用的页面,并将其标记为规范。为了节省网站的抓取预算,抓取工具将经常抓取权威页面,而不是经常抓取重复页面。因此,如果你没有告诉爬虫哪个页面是权威的,而你决定将另一个页面(爬虫选择的页面除外)设为规范页面,那么爬虫可能不会经常索引该页面。你已经仔细更新了。在搜索结果中索引或显示页面。
爬虫会以您网站上的权威页面作为网站内容的黄金标准来评估网站内容和质量。搜索引擎的搜索结果通常会指向权威页面,除非重复的页面明显匹配用户的查询:如果用户例如在移动设备上,即使桌面页面被标记为规范,搜索结果也可能指向移动页面。
搜索引擎根据多种因素(或“信号”)选择权威页面,例如页面是通过 http 还是 https 提供服务;用户声明的首选域;页面的质量; URL 是否出现在站点地图中;以及任何“rel=canonical
”标签。您不能强制搜索引擎将页面选择为规范页面,但您可以使用下述一种或多种方法影响其选择。
为什么指定权威页面很重要
在一组重复/相似页面中明确选择权威页面可以满足您的许多需求,如下所示:
- 指定您希望用户在搜索结果中看到的内容。 您可能希望用户通过 https://www.example.com/dresses/green/greendress.html(而不是 https://example.com/dresses/cocktail?gclid=ABCD)访问您的绿色连衣裙产品页。
- 集成来自相似或重复网页的链接信号。 明确选择权威页面有助于搜索引擎将他们在各个 URL 上找到的信息(例如指向它们的链接)合并到一个首选 URL 中。也就是说,来自另一个站点的 http://example.com/dresses/cocktail?gclid=ABCD 的链接将与 https://www.example.com/dresses/green/greendress.html 的链接集成。
- 简化单个主题/项目的跟踪指标。 当多个 URL 提供特定内容时,获取该内容的综合指标可能会更加困难。
- 管理转发的内容。 如果您要重新发布内容以分发到其他域,则必须将页面位置嵌入您的首选 URL 中。
- 避免花时间爬行重复的网页。 您肯定希望搜索引擎能够最大化您网站的价值,因此最好让它花时间爬行您网站上的新(或更新)页面,而不是爬行同一页面的桌面版本。和移动版本。
指定权威网页的三种常用方法
1、rel=canonical标签
在网页上的所有复制者中添加一个 优点: 缺点: 在 Web 响应中发送 优点: 缺点: 使用 301 重定向定期告诉搜索重定向的 URL 是给定 URL 的更好版本。仅当您弃用重复页面时才使用此方法。 如果您想为重复的URL或重复/相似的页面指定权威URL,请选择以下方法之一。 您可以在标题中使用 假设您想将 https://example.com/dresses/green-dresses 设置为权威 URL(即有很多 URL 指向此内容),那么您可以通过以下方式将此 URL 设置为权威 URL:执行以下步骤: 1。使用链接元素 2。如果权威网页有对应的手机版本,请注明。它添加了链接 如果您可以配置自己的服务器,则可以使用 如果您例如通过多个 URL 提供 PDF 文件,您可以为重复的 URL 返回以下 对于 假设用户可以通过以下方式访问您的页面: 您可以选择这些 URL 之一作为您的规范 URL,并使用 301 重定向将流量从其他 URL 引导到您的首选 URL。服务器页面 301 重定向是确保用户和搜索引擎定向到正确网页的最佳方式。 301 状态代码表示页面已永久移动到新位置。 搜索引擎将优先选择 HTTPS 页面(相对于相应的 HTTP 页面)作为权威 URL,除非存在问题或冲突信号,例如: 虽然默认情况下搜索引擎更喜欢 HTTPS 页面而不是 HTTP 页面,但您可以通过执行以下操作之一来确保始终发生此行为: 为了防止搜索引擎错误地选择 HTTP 页面作为权威页面,您应该避免以下做法: 指向权威网页。
rel=canonical
HTTP 标头)。 2。 rel=canonical HTTP 标头
rel=canonical
标头。 3。 301 重定向
具体方法
使用 rel="canonical" 链接标签
标签来指示某个页面与另一个页面重复。
rel="canonical"
标记所有重复的网页。将 rel="canonical"
元素添加到重复页面的 部分,并将其指向权威页面,如下所示 显示为: ♼❀❙ "canonical" href = “https://example.com/kjoler/grønne-kjoler”/>
rel="alternate"
并将其指向此页面的移动版本:使用 rel="canonical" HTTP 标头
rel =“规范”
HTTP 标头(而不是 HTML 标记)指定非 HTML 文档(例如 PDF 文件)的规范 URL。 rel="canonical"
HTTP 标头,以告知爬虫该 PDF 文件的权威 URL : rel="canonical"
链接元素,请使用绝对路径(而非相对路径)
推荐结构:https://www.example.com/dresses/green/greendresss.html
已弃用的结构:/dresses/green/greendress.html1 重定向1 方法(如果您想删除现有的)重复页面,但必须确保在禁用旧 URL 之前成功迁移。
无论您使用哪种方法,请务必遵循以下一般准则
rel =“canonical”
表示同一页面的不同规范 URL)。 优先选择 HTTPS(相对于 HTTP)作为权威 URL
rel="canonical"
指向 HTTP 页面的链接。 rel="canonical"
链接。
版权声明
本文仅代表作者观点,不代表Code前端网立场。
本文系作者Code前端网发表,如需转载,请注明页面地址。
发表评论:
◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。