SiteFactoryCMS:采集流程第一步
导航: 上一页 | 首页 | DedeCMS | 帝国CMS | Drupal | PHPCMS | PHP168 | Xoops | Joomla | SupeSite
本节将以采集动易官方网站“公司动态”栏目为例讲解添加采集项目并进行信息采集的全过程。
如果您第一次接触采集功能,请认真阅读操作步骤及并理解相关说明,按以下步骤一一操作以建立所需采集的项目。
第一步:采集项目设置
依次点击“内容管理”->“采集管理”->“采集管理”功能链接,在出现的管理界面中,单击左侧管理操作导航中“添加采集项目”功能链接,系统出现“添加采集项目设置”管理界面,以设置所需新建的采集项目的名称、采集网站、编码等基本设置信息。
重要参数说明:
·项目名称:填写自定义采集项目的名称(如“动易公司动态”)。
·对应本站栏目:点选设置所采集的数据保存到本站所对应的栏目节点名(如“文章中心”)。
·对应内容模型:点选设置对应栏目的模型(如“文章模型”)。
温馨提示:若后续在采集项目完成后,再更改了所对应的模型,系统将自动删除采集第三步所有字段的规则。
·采集网站:填写所需采集目标网站的名称(如“动易官网”)。
·采集URL:填写采集网页的网址(以 http:// 开头,如“http://www.powereasy.net/Announce/index.html”)。
·编码选择:提供GB2312、UTF-8和Big5三种编码格式。国内的网站基本都是GB2312,若采集香港、台湾的网站请选择Big5编码,若采集海外网站则选择UTF-8编码(如“动易技术中心”选择“GB2312” 编码)。
·指定采集数量:指定采集的数量,不指定为采集全部数据。
·采集顺序:设置按倒序或正序方式进行采集(系统默认为倒序采集)。
·采集简介:填写本采集项目的简要介绍信息(如“动易官方网站动易公司动态信息”)。
设置好相关选项后,单击页面底部“下一步”功能按钮进行采集列表项目信息设置。
温馨提示:若目标网站的信息需要登录后才可查阅与采集,请参阅动易技术中心(http://tech. powereasy.net/)中的相关说明以进行设置。