首页站长新闻网站日志分析 教你辨别蜘蛛来源

网站日志分析 教你辨别蜘蛛来源

2013-08-03 27

作为一个站长,皇冠网小编觉得略懂网站日志分析,网站会更安全。网站日志可以从ftp或服务器上面下载。下载后,我们可以通过相应的来源ip段进行分析,判别这ip段是否属于真实的蜘蛛

下面皇冠网小编就对皇冠营销网站点的日志进行分析。

第一、小编从服务器上面下载了8-2网站日志

第二、打开网站日志

网站日志分析  教你辨别蜘蛛来源

通过上图,我们可以看出,这里面很乱看得有点累,而且很难分析到底有哪些ip访问了我们的站点,哪些页面被蜘蛛捉取了。竟然很乱,那么我们可以简单的处理,让难变易。小编这里是通过txt格式转换成xls。这样我们就可以一行一列的进行分析。转换后,我们可以通过案列进行分列,这样就可以一列一列的详细的按规律来显示出来。

网站日志分析  教你辨别蜘蛛来源

通过上图,我们就可以清晰明了的分析客户ip来源了,具体哪些文章页面、哪个栏目被收录,我们都可以一眼明了,甚至还可也看出网站被爬取的状态。但从这里还是不能清晰的汇总出到底有哪几个ip段访问我们的站点。至此,我们还要通过execl的数据筛选功能进行ip段类似的进行汇总,例如,220.181.108.121和220.181.108.78等c段之前都是一样的话,那么我们就可以通过c段相同的汇总在一起。具体操作,选择数据-自动筛选-自定义-包含-填写要归类一起的ip段。

网站日志分析  教你辨别蜘蛛来源

从这里,我们就可以直接的看出有哪些ip类型访问了我们的站点,那么我们就要了解这些ip类型是好还是坏。

作为站长要知道哪些ip段是好,哪些ip段是不好,这样就可以尽量的避免站点问题的持续衍生下去。通常的ip段解读

一220.181.108.*ip段的百度蜘蛛(提权蜘蛛):

这个ip段访问你的站点,那么说明你的站点目前很健康,一天访问次数越多,说明百度蜘蛛对你的站点非常的友好。一经抓取的页面,被释放的时间非常短。

二123.125.71.*ip段的百度蜘蛛(劣质文章捉取蜘蛛):

这个ip段访问你的站点,那么说明你的文章质量不高,伪原创或者采集的相对比较高。虽然抓取了,可不会立马释放,释放时间比较久。出现越多者不好吧!

三123.125.68.*ip段的百度蜘蛛(考察蜘蛛):

这ip段访问你的站点,一般是对于新站比较频繁,这ip段是考核蜘蛛,若对于老站经常出现这ip段的话,那么你的站点就有可能被降权,出现这情况,因立马对站点做修正处理。

四117.28.255.*ip段的百度蜘蛛(假冒蜘蛛):

这只其实是一只假的百度蜘蛛,至于他是什么蜘蛛我们也无从得知.。但我们有一个方法可以判断真假百度蜘蛛:

点击桌面的“开始”图标-在搜索栏输入“CMD”-输入“nslookup”,

网站日志分析  教你辨别蜘蛛来源

输入后点击确定,然后再功能框里面输入ip地址,ip地址只能手动输入,不能黏贴。

出现下图所示为真实百度蜘蛛:

网站日志分析  教你辨别蜘蛛来源

出现下图所示为真实冒牌蜘蛛:

网站日志分析  教你辨别蜘蛛来源

从上两图我们可以看出如果该ip地址是真的百度蜘蛛的话,那该就会显示“baidu”标识,如果没有看到“baidu”字样的服务器名就是假的百度ip。

五222.77.187.*ip段的百度蜘蛛:

这个ip段访问,说明你经常使用chinaz工具,这个ip段是chinaz模拟百度蜘蛛来访问我们站点的结果。

网站日志分析,是作为一个站长每天必做的事情,对网站日志的分析要十二分的重视,切勿爱分析分析一下,不爱分析就都不管了。分析网站日志是一个站点长远发展的必经之路。好了,皇冠网小编就对略懂网站日志分析,网站更安全介绍到此,欢迎高手留言交流!

来源:皇冠seo

  • 广告合作

  • QQ群号:707632017

温馨提示:
1、本网站发布的内容(图片、视频和文字)以原创、转载和分享网络内容为主,如果涉及侵权请尽快告知,我们将会在第一时间删除。邮箱:2942802716#qq.com(#改为@)。 2、本站原创内容未经允许不得转裁,转载请注明出处“站长百科”和原文地址。

相关文章