搜索引擎会不会抓取微博信息?
很多人认为微博和其他社交网站一样,是封闭的,但实际上并非这样,微博对搜索引擎是开放的,是基于微博API开放的。因此,百度推出了微博搜索,能够检索到两天以内最新更新的微博信息,也就是说百度是在抓取微博信息的。
但实际上,这种搜录和一般的网站搜录有着非常明显的区别:1、以时间倒序排序,最新的微博排在最前面;2、抓取的内容有限,并非所有的微博都被抓取,只有少量的微博内容被抓取,检索结果不如使用微博自己的搜索功能;3、检索的结果中以文字、图片内容为主,少有视频内容。
微博发布的链接是不是外链?
理论上讲是的,但实际上看,百度收录的微博链接很少。在百度检索的结果列表中,微博结果得到的地位和新闻是同等的,如下图。
在结果中,百度检索到的最新微博会被列出来。那么微博发布的链接是不是外链呢?因为微博是没有锚文本链接的概念的,因此微博提供的外链不能像一般的网页链接那样去考虑。而且百度在搜录微博内容时,更加注重内容,所以在微博中发布链接,更要将链接作为内容的补充,也就是百度一直在提倡的自然链接。百度收录微博内容才真正执行着内容为王的原则。
需要提醒SEOer们注意,新浪微博链接有问题,看统计就知道。今天无意间通过微博里的链接来到自己的网站,会发现链接中带上了锚,即在URL末尾会出现 #xxxxxx-tsina-1-3×40-da7d3456eb9c7x4b976297526ed33a7c 这个信号会透露我的信息,因此将其中一些部分用x来代替。
也就是说新浪微博中的短网址会带上附加信息,这个信息可能是一个用户信息记录收集器,承担着监测用户在互联网上的行为。当然,这是比较大数据时代的想法了。想近一些,这是由百度分享故意添加的(我是使用百度分享的一键分享功能分享至新浪微博的),或者新浪方面也会考虑添加一个锚,可以快速跳到网站整合新浪API时所留下的痕迹。
那么它对SEO会产生影响吗?从目前的情况来看,这不但不会影响SEO,还会增加百度对该网页的信任,因为如果从新浪微博的来链中带上了这个锚,很有可能就是来自百度分享的结果,而这一分享得到了回流,说明文章具有吸引力,引来了微博读者。
不过对于URL挑剔的博主,这可不是一件什么好事,因为过长的URL对搜索引擎的收录可不大友好。另外,由于URL中带了锚,而在网页上如果找不到这个锚,很有可能被认为该URL是个错误页面(非404,但URL找不到),也有可能会造成不同URL对应同一网页的结果。
因此,我们应该想办法对付一下它。
1、尽量自己编写微博,使用URL缩短工具缩短网址;
2、在页面中添加rel=”canonical”。
这样基本能解决URL中多余部分带来的可能的SEO问题。
来源:嗖录网
-
广告合作
-
QQ群号:707632017