Rel=Canonical 标签
什么是Rel=Canonical标签?
rel=canonical标签是一条可以在页面原始码的 head中找到的HTML元素,用作防止重复内容 问题。
一般的rel=canonical标签:
有时候一个页面的内容可以透过不同的URL获取,特别是使用 URL参数或者在一组非常相似的页面, 抓取 或 收录 其中一个就可以。 rel=canonical 是一种可以让站长告诉搜索引擎一组页面中那一个是首选页(也称为”canonical”页) 及应该被 收录。
例如: www.example.com/blue-widgets?sort-asc 是一个产品列表页, www.example.com/blue-widgets?sort=desc 也是产品列表页,但顺序是反转的, www.example.com/blue-widgets?sort=asc&source=ppc 也是拥有一样的内容,不过附加了流量来源的URL参数,如果这三个页面都被收录,它们便会被认为是 重复内容.
所以你应该在这三个页面上都加上Rel=Canonical标签。 www.example.com/blue-widgets?sort-asc 是这几个页面的 Canonical 版本,搜索引擎知道它应该收录这个页面并无视其余两个,进而解决重复内容的问题
“多个 Rel=Canonical 标签”是什么意思?
这些URL的页面上都含超过一条rel=canonical标签。
为什么这个问题值得关注?
当一个页面含有多个rel=canonical标签,搜索引擎将无法分辨哪个标签的URL是真正的canonical页面。谷歌会直接无视一个以上的所有rel=canonical标签,在其他搜索引擎你也将无法预计它们能否正确判断canonical页面。
因此使用多个rel=canonical标签与完全不用无异,甚至更糟。
重复内容的危害
浪费抓取额度- 搜索引擎的资源有限,所以它们限制不同网站的抓取限度,搜索引擎允许抓取页面的数量就是”抓取额度”,它和所有有限的资源一样,都需要按优先级分配。最理想的状况是我们让搜索引擎先抓取网站内最重要的页面,然后才抓取不太重要/重复的页面。这个时候若rel=canonical标签未能正确使用,搜索引擎有机会会把大部分的抓取额度用作抓取重复的页面,而非独特的页面。所以我们需要透过rel=canonical标签,让搜索引擎只抓取和收录网站的独特页面。
排名降低或移除收录 – 搜索引擎非常讨厌浪费他们资源和为用户带来微小价值的重复内容,这也可以是低价值、 薄弱内容网站的讯号。因为这样,近年很多搜索引擎都用重复来容作为一个排名因素,打击不受欢迎或带重复内容的网站。这不仅会影响到重复内容的页面,整个网站的排名都有可能会因为这样而被下降甚至被移除收录。这正在2011年头 谷歌的Panda更新 的用意。
如何修复
有时候这个问题是由于使用有自动加入rel=canonical标签到页面功能的CMS,插件,模板或程序无意导致的。
检查下面列表的每条URL的原始码来找出这些rel=canonical标签是如何被加到页面中的。当你能找到问题的源头,你可以透过停用插件或代码来解决问题。