Siteserver-信息采集管理-单文件页采集

来自站长百科
跳转至: 导航、​ 搜索

导航: 上一页

单文件页采集

此文介绍单文件页的采集

单文件页采集能够将指定网址采集到指定的文件中,包括页面对应的图片、CSS样式、JS脚本等。通常在需要制作与指定网址相似的页面时使用。

一、建立采集规则

  • 点击系统左侧的“功能管理”→“信息采集管理”→“单文件页采集”进入单文件页采集的界面。
  • 点击界面中的“添加采集规则”按钮,进入添加采集规则界面。

采集规则设置

基本信息包括采集规则的名称、采集到的文件地址以及其他的采集参数设置,如下图:

Siteserver0184.gif

  • 采集规则名称可以取任何您觉得易记的名称。
  • 采集页面地址为需要采集的页面地址,此页面将采集到对应的文件中。
  • 网页编码表示指定页面的编码类型,必须和指定网页的编码一致。
  • 采集到文件地址为需要保存指定网页的文件地址,指定网址的HTML代码将保存到此文件中。
  • 删除JS脚本用于判断是否将指定网址中的JS代码删除。
  • 下载相关文件用于判断是否将指定网址中的图片、CSS样式文件、JS脚本文件下载到服务器

接着点击下一步便完成了单文件采集规则的添加工作

二、开始采集

点击“开始采集”链接开始采集指定网址到文件中,如下图:

Siteserver0185.gif

点击开始采集后系统将显示采集进度。

至此,采集完毕。

参考资料[ ]