Siteserver-信息采集管理-单文件页采集
来自站长百科
导航: 上一页
单文件页采集
此文介绍单文件页的采集。
单文件页采集能够将指定网址采集到指定的文件中,包括页面对应的图片、CSS样式、JS脚本等。通常在需要制作与指定网址相似的页面时使用。
一、建立采集规则
- 点击系统左侧的“功能管理”→“信息采集管理”→“单文件页采集”进入单文件页采集的界面。
- 点击界面中的“添加采集规则”按钮,进入添加采集规则界面。
采集规则设置
基本信息包括采集规则的名称、采集到的文件地址以及其他的采集参数设置,如下图:
- 采集规则名称可以取任何您觉得易记的名称。
- 采集页面地址为需要采集的页面地址,此页面将采集到对应的文件中。
- 网页编码表示指定页面的编码类型,必须和指定网页的编码一致。
- 采集到文件地址为需要保存指定网页的文件地址,指定网址的HTML代码将保存到此文件中。
- 删除JS脚本用于判断是否将指定网址中的JS代码删除。
- 下载相关文件用于判断是否将指定网址中的图片、CSS样式文件、JS脚本文件下载到服务器。
接着点击下一步便完成了单文件采集规则的添加工作
二、开始采集
点击“开始采集”链接开始采集指定网址到文件中,如下图:
点击开始采集后系统将显示采集进度。
至此,采集完毕。