2009年2月份,谷歌、雅虎和live search 三家搜索引擎宣布支持Link的一个新属性canonical,其目的是帮助网站管理员们,解决网站内容存在多个版本时,指定规范链接,帮助解决内容重复收录问题。
canonical标签是做什么用的?
canonical标签就是告诉搜索引擎哪个页面是权威页面。以我的理解,Canonical标签大致的作用如下。
第一,使用Canonical标签使网址规范化。
第二,避免内容重复页面,搜索引擎收录更准确。
第三,集中传递页面权重。
canonical链接标签只能作用于同一个域名所在的网址,不能作用于不同域名上的重复内容。如果是跨站,可以使用301重定向。
网址不规范,会降低页面权重,是因为搜索引擎会认为页面内容有重复。做法是将这些不规范的网址,指向同一个页面。
比如本文的源代码里面:,就有使用这种标签,我曾经说过:“WordPress分页标题如何显示不同标题”,其实就是为了解决分页重复标题的问题,可现在在诸如wordpress这类的网站程序使用的时候,经常会产生重复页面,虽然可以用robots.txt,可是你懂的,百度很傻,反应不快。我们使用这个标签就能够有效的让搜索引擎知道哪个是标准,哪个是重复页面,不要抓。
其标准用法是:
在这里应该使用绝对地址而不是相对地址,因为网站空间如果绑定多个域名的时候,输出的url依然是相对的,那这个代码就形如虚设了。使用canonical目的就是为规范链接,所以采用绝对地址是最妥当的,但是要注意的是:不能跨域名指向,也就是不能指向不同的域名,这点要谨记。谷歌也推荐使用绝对地址,详见:地址
在什么条件下使用link rel=”canonical”标签呢
一:网站因其他原因无法做301重定向
如果空间不支持或其他原因,网站不能做301重定向了,那就可以使用这个标签告诉搜索引擎哪个域名是重要的。
二:网站site值差距很大的时候
比如:site:example.com和site:www.example.com这两个站收录差距很大,但你主推其中一个域名的时候。就可以使用这个标签。
三:重复文章页
这里得数落数落wodpress,wordpress由于默认不是生成静态页面,每读取一个页面都得查询mysql数据库,而写文章的时候往往会生成两个相同的页面,可以用robots.txt屏蔽。但是还采用这个标签会更保险。
附录:认识canonical标签
用好canonical标签,下面几点也是需要认识的。
第一,该链接标签可用于定义相对地址,也可用于定义绝对地址。但为了保险起见,建议使用绝对地址。
第二,如果使用了canonical链接标签的页面在整个网站中并无重复内容的页面,也无需担心,该标签暂时会被搜索引擎“束之高阁”。
第三,该链接具有可传递性。假如你在网址A中将网址B指定为首选地址,而在网址B中又将网址C指定为首选地址,那么搜索引擎会认为网址C才是A和B的首选页面。这种情况有时候在网址重定向中会发生。
第四,一个网页链向了有canonical标签的页面,会被当作像301转向到这一页的canonical页。
第五,一个页面可以用rel=canonical指向自己,一个网站的所有页面可以都有rel=canonical。在使用rel=canonical完全不用担心,只用在使用时指对了页面。
当然canonical不是万能的 ,对于大型重复页面出现的商城,例如淘宝,京东这些,要解决完美的url规范都不是那么容易的。
附录:百度支不支持canonical标签
目前,都说是只有google支持
但前几天看到有人无意间做了个试验:
程序员不小心在所有产品页面都加上了rel=”canonical”,并且指向了首页,结果产品页在百度的收录减少了两万多条。把产品页的rel=”cannonical”都撤掉后,收录恢复正常。
这证明百度也能识别这个页面。
本文地址:http://huxiaoyi.com/search-engine/20120626.html
-
广告合作
-
QQ群号:707632017