首页站长新闻再谈网站原创与百度收录之间的关系

再谈网站原创与百度收录之间的关系

2013-08-27 34

对于百度这个占据中国搜索引擎80%市场份额的中文市场搜霸来说,广大中小站长可以说是又爱又恨,在收录和排名方面尤其如此。可能现在很多个人站长都碰到这样的问题:网站经常更新,并且都是原创,但百度为何却不收录?我之前曾猜想过关于网站没有权重和排名的几点想法,这次看了一位同学写的“为什么网站经常更新,但搜索引擎不收录”也颇为感触,一些观点也很不错。

再谈网站原创与百度收录之间的关系

1、您的站点有提交吗?有很多朋友从网站建设完成到网站运营一直没有向引擎提交相关内容和外链发布,导致引擎不知道有您这样的站点存在。

站点提交是早期做SEO以及站长让搜索引擎收录必做的事,但随着搜索引擎的智能化和不断升级,现在已很少由站长去主动提交网站来让搜索引擎抓取和收录了,而是搜索引擎主动过来爬行、抓取网站。所以这点基本上不是网站不被收录的原因。

2、您的网站是否有蜘蛛到访?我们一般只推荐用户使用百度专业的官方统计代码,《站长工具》和《爱站》只是个人杜撰的查看系统,他并不是权威的百度推出的查询系统。所以我们去看蜘蛛是否有来访您的站,我们建议使用百度站长统计工具。

这点与第一点基本相同,搜索引擎的智能化已今非昔比,在SEO知识和概念已成为做网站最基本和最必须的理念之后,现在的网站,包括开源程序都会注重网站的优化,除非网站做的实在让搜索引擎蜘蛛不堪忍受,没有丝毫的优化,严重影响蜘蛛的爬行,所以,一般情况下,搜索引擎蜘蛛都会到访来抓取我们的网站内容,前提是我们也要定期进行更新才行。

3、您的网站是否有索引页?也就是您的网站是否存在目录导航,我们一般建议导航使用文字,而不是图片,因为百度不会读取图片,他属于代码,更多情况下只是抓取文本和代码。

这点一者即使是在比较糟糕的企业网站,现在的情况也大为改观,导航和一些重要内容都会有简单的优化,二者主流搜索引擎百度和谷歌都号称可以识别和抓取一些特殊内容,如JS。

4、您的网站首页的快照?为什么要关心快照,百度给的快照文件和实际页面的差别,您的网站是否有助于引擎收录,您可以通过快照对比;如果您的网站和快照有区别,那么您可以查看您的网站是否大量使用JS特效、flash、大图片等,导致蜘蛛无法爬取,无法识别您的内容。没有识别您的网站没办法识别,那么也将导致网站也将无法被收录。很多企业站、公司站让网络公司站在设计网站的时候,都第一步是很炫的flash或图片,强制用户点击图片底下的进入页面,这种形似在百度而言他是非常不认可的,所笔者也劝诫这种企业站的做法。

百度快照对于网站优化参考度现在来说还是有一定意义,虽然快照已经越来越像谷歌PR一样被官方淡化了。

5、网站重复度很高:虽然很多用户说我的网站内容都是自己原创的,为什么说我的网站的重复性太高呢?因为很多建站公司用的都是cms进行建站,所以很多头部、底部、框架重复的内容已经超过正文了,建站公司改个LOGO、改个图片就交给企业了。为什么说这种站点不好,因为百度不是看您的网站,他是来读您的网站,您的站点源码过度接近,他会给出一个信息,这种过度重复的内容不进行收取。

对比我的博客来说,这倒有可能是一个原因。

6、网站域名:是否曾经做过非法站点,您在购买该域名之前是否有别人利用这个域名做过非法网站,这样会引起百度的不收录;笔者这里就不强调这个话题了,因为大家都是聪明人,您会懂的。

虽然百度一再号称不会有影响,但是被惩罚过的域名就像有前科的罪犯一样,在搜索引擎的档案里会给你记上一笔,想成功走出被百度“歧视”的境遇,是一个相当缓慢和困难的过程。当然不排除有资源和有实力的网站可以很快消除影响,百度,你懂得。

7、您的网站被挂马:也会照成收录下降,百度非常严厉打击这类网站,可能永久会是零。所以网站的安全性非常重要,一定要将最安全的网站系统展示给您的客户。

所以说,网站安全也是一个大事。不过一般情况下,作为中小站长,尤其是个人站长,一个月来不了几万IP的情况下,不会有黑客来关注你,因为太不值当的,没有价值。

8、您网站的URL地址无法识别:动态参数过多,我们经常谈到的地址有两种:一个静态、一个动态;一般情况动态和静态都是可以被百度收录的,但参数过多将会导致无法收录的,类似:www.xxx.com/?=ad&=asda&?p=1这种对引擎而言是不太好的,甚至还有很多是中文地址;切记一定要把URL标准化,不要担心URL麻烦,伪静态麻烦,只有付出辛苦,才能收益更多。

静态URL和伪静态是搜索引擎一直倡导的,纵然是百度和谷歌等主流搜索引擎可以识别甚至抓取动态地址,但静态和伪静态地址显然更符合搜索引擎的口味。一般来说,因为动态url而造成搜索引擎不收录也是有可能的,但基本上搜索引擎都可以抓取并收录。

9、一个页面2个不同的地址:一旦出现这种情况,百度也视为重复性过高,我这里说的不是两个域名,而是站内2个地址同时指向一个内容相同的页面,比如:http://www.xxx.com/123.html和http://www.xxx.com/123.asp如果您的网站有这种情况,这样百度会将此类网站数据清空。

这个其实是网址规范化的问题,说不规范网址会造成网页相似度高或者降权倒是也有可能。不过说实话,如果不是海量级的过分严重,一般是不会被搜索引擎惩罚或者不收录的。即使是惩罚,也得严重到一定级别。

10、内容是否是用户需求的:虽然网站经常更新数据,但是很多朋友基本处于拷贝他人信息,没有自己的观点和思想,导致很多用户搜索到您的网站信息重复,从而导致用户进来后马上离开,随之改变了引擎的数据展示,认为您的网站信息没有可阅读性。这样也就导致了引擎把收录的信息慢慢的隐藏掉,您在搜索您自己站点的时候会发现自己的站点没出现在引擎上。

最后一点是相似度或者重复率的问题。其实是对于新站和毫无权重的小站来说的,大站或知名站,即使是抄袭和伪原创,也不会出现这种情况。看看那些新闻站,看看那些接受投稿的网站,他们的内容从何而来,百度一下那些内容吧,你会发现,三四页甚至七八页都有可能是一模一样的内容。

来源:北漂书生博客http://www.361blog.com/seo/866.html

  • 广告合作

  • QQ群号:707632017

温馨提示:
1、本网站发布的内容(图片、视频和文字)以原创、转载和分享网络内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。邮箱:2942802716#qq.com(#改为@)。 2、本站原创内容未经允许不得转裁,转载请注明出处“站长百科”和原文地址。

相关文章