什么是 URL 规范化?会不会有SEO问题?正确的处理方式
什么是URL规范化
例如,下面的URL会指向相同内容的相同网页:
http://www.wangxiaokai.vip
http://wangxiaokai.vip
http://wangxiaokai.vip?mode=light
当搜索引擎必须从选择链接中选择合适的链接时搜索内容,但存在不确定性。
那么怎么办网站标准化:通过SEO技术手段帮助搜索引擎确定真实的、有代表性的链接。这个过程就是一个标准化过程。
如果URL不规范会有什么问题?
1。页面排名可能会受到影响
如果复制的内容出现在不同的网站上并且搜索引擎做出错误的决定,则原始版本可能不会排名。
这对于一些站长来说也是一个痛苦:原始内容被一些吸引流量和变现的网站爬虫抓取,导致这些页面被优先索引,而原始网站没有搜索排名。
2。 URL权重是分布式的
很多URL都是不规则的,导致网站的内部和外部链接可能指向不同的版本。
结果,本应获得所有链接的标准URL却没有获得应有的权重,从而影响了关键词的排名。
3。对抓取资源的爬虫造成浪费
一个网站给一定数量的爬虫。由于搜索引擎必须抓取URL的每个版本,这将绕过其他更有用的页面的抓取。
标准加工方法
1.尝试从源头删除
选择标准网站版本后,应在整个网站实施此策略。
这样,搜索引擎就会知道哪些是规范的 URL。
2。使用 301 跳转
如果您无法控制其他网站用于重定向到您的页面的 URL,您应该在您的服务器上为所有非标准 URL 创建 301 重定向并跳转到规范 URL。
3。使用 canonical
标签指定
canonical
标签可以达到与 301 跳转相同的效果,不同的是用户停留在原来的 URL 上。
如果可以的话,先用301
跳跃,这是最好的解决方案。
4。提交 sitemap.xml
sitemap.xml
向搜索引擎提交站点地图文件时,仅提交默认 URL。使用
rel=canonical
在head
页面中添加如下语句:
<head>
<link rel="canonical" href="https://wangxiaokai.vip" />
</head>
这里语句的含义是:当前页面,规范URL https://wangxiaoi.vip 。
需要避免的误区
1、rel=canonical
的位置
只在<head>
中出现,而且尽早将rel=canonical
添加到<head>
中。
如果rel=canonical
出现在<body>
中,搜索引擎会将其忽略。
2、避免多次声明rel=canonical
如果多次声明rel=canonical
,则Google很可能会忽略所有rel=canonical
提示。
这样,就会丧失正确rel=canonical
带来的所有好处。
3、href对应的网址,必须是绝对网址
<link>
标记既接受绝对网址,也接受相对网址。
如果指定相对网址<link rel="canonical" href="/example.HTML"
,则Google搜索引擎,无法识别它的真实规范化网址https://wangxiaokai.vip/example.html
。
搜索引擎的做法是:忽略这个rel=canonical
。
4、避免rel=canonical
指向404
指向404,也即网页不存在。则所做的SEO优化,都白费了。
案例分析
如图所示 ,是笔者在掘金上发表的一篇文章:JavaScript实现十大排序算法(图文详解)
网址的路径是:https://juejin.cn/post/7099436855388536869
rel=canonical
在这里的作用,就是对当前页面,进行网址规范化,把页面权重集中到当前网址上。
另外,掘金的markdown编辑器,也会屏蔽rel=canonical
,避免被白嫖党利用,造成页面的搜索排名损失。
版权声明
本文仅代表作者观点,不代表Code前端网立场。
本文系作者Code前端网发表,如需转载,请注明页面地址。
发表评论:
◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。