模板:今日头条/2009年第24期

网络蜘蛛(Web Spider)又称为：“网络爬虫”，“机器人”，简称“蜘蛛”。是通过网页的链接地址来寻找网页，从网站某一个页面（通常是首页）开始，读取网页的内容，找到在网页中的其它链接地址，然后通过这些链接地址寻找下一个网页，这样一直循环下去，直到把这个网站所有的网页都抓取完为止。如果把整个互联网当成一个网站，那么网络蜘蛛就可以用这个原理把互联网上所有的网页都抓取下来。

网络蜘蛛就是一个爬行程序，一个抓取网页的程序。网络蜘蛛与搜索引擎有着比较密切的关系，目前全球知名的搜索引擎google、百度、雅虎等都为各自开发了网络蜘蛛程序。

Google为了获取上亿的网页，设计了一个分布式的爬行系统。一个URL 服务器将URL列表提供给网络爬行器。每个爬行器同时保持大约300个网络连接。在最高速度的时候，通过4个爬行器，该系统可以每秒种获取超过100个网页。

WIKI使用导航

站长百科导航

站长专题

模板:今日头条/2009年第24期