SiteFactoryCMS:采集管理概述

来自站长百科
跳转至: 导航、​ 搜索

导航: 上一页 | 首页 | DedeCMS | 帝国CMS | Drupal | PHPCMS | PHP168 | Xoops | Joomla | SupeSite

系统提供强大的采集功能。采集系统可以直接深入到站点及其网页的所有内容,将网页中的有效数据采集出来(而不仅是网页或链接),并保持数据之间的逻辑关系。对一个新闻站点,它可以将每个新闻的标题、正文等信息单独采集出来,分别作为字段存储在系统中。

系统提供的采集功能具有以下特点:

·大量应用AJAX技术,采集设置即截即用,以可视化预览的方式截取代码。

·以字段为中心,每个字段都既可以设置采集规则,也可以应用私有过滤和公有过滤的规则。

·每个字段都可以预览采集后的结果。对系统每一种字段类型都提供了十几种采集规则,采集规则与字段类型相挂钩(如“文本类型”设置采集规则界面和“时间规则”设置采集规则界面不同)。

·采集应用了线程技术,用户可以在采集操作进行过程中进行其他管理操作,系统会采集所指定的项目内容。

·采集使用了缓存技术,系统在收集所有列表页链接后再进行采集,从而极大地节省系统资源。

·采集可以选择图片、软件等任意模型类型,从而支持采集多种类型的信息。

依次点击“内容管理”->“采集管理”功能链接,在出现的下拉式导航菜单中显示了开始采集、采集管理、采集历史记录、采集过滤管理、查看采集进度等功能链接。