Mirror Sites
Mirror Sites即镜象站点,通过复制网站或昂页的内容并分配以不同域名和服务器,以此欺骗搜索引擎对同一站点或同一页面进行多次索引。现在大多数搜索引擎都提供有能够检测镜象站点的适当的过滤系统,一旦发觉镜象站点,则源站点和镜象站点都会被从索引数据库中删除。
简介[ ]
镜像,原意是光学里指的物体在镜面中所成之像。引用到计算机网络上,一个镜像站点(或称镜像)是指另一个站点内容的拷贝。镜像通常用于为相同信息内容提供不同的源,特别是在下载量大的时候提供了一种可靠的网络连接。制作镜像是一种文件同步的过程。
创建目的[ ]
创建镜像的目的通常有以下几个: 保存网页信息,特别是在一个网站面临关站的时候。提高用户在某个地区的下载速度。譬如一个美国网站的中国镜像可以使来自中国的用户直接从这个中国的镜像访问,从而加快了速度。这可以看作是一种全球范围的缓存。对不可用的信息提供连接途径。例如,2002年的时候中国对Google封锁的时候,镜像站点google成为了有效的绕过封锁的途径。保存历史性的数据、信息,防止丢失。平衡网站的流量负载。例如,一个Linux 的发行版的ISO镜像文件的大量下载可能会导致主站过荷而下线,而镜像站点则可以在多个服务器分担流量,从而保证站点的持续在线。对因流量激增而下线的站点提供临时的访问。便于不同地区的人获得更快的访问速度。避开对于主网站的审查和屏蔽。创建镜像站点通常是由于网络带宽限制、封锁或是其他原因,导致无法实现对主站点的正常访问。这时通过将主站点的信息资源移植转移到相对容易访问的 本地服务器,以提高用户的访问效率。常见于内部网、校园网或是其他有较大存储设备的服务器。较小的网站有时也以镜像来应对封锁、屏蔽(参见防火长城)。 通过镜像站点,也可以实现多目标多线程的快速下载。例如GetSmart2和GetRight正是使用了这种高级的多线程下载技术。
创建方法[ ]
镜像站点是通过主服务器增加转移存储地址来实现信息的异地备份。通常一个镜像会定期访问主网站,以更新其内容。镜像也有分一级、二级等等。二级镜像是指那些通过访问一级镜像网站来更新内容的网站,通常更新速度不如一级镜像,但不会给主网站增加负担。更新镜像最常用的软件是rsync,有时候也直接用http镜像工具。