SiteWeaver内容管理系统:动易2006版区域采集管理

来自站长百科
跳转至: 导航、​ 搜索

导航: 上一页 | 首页 | DedeCMS | 帝国CMS | Drupal | PHPCMS | PHP168 | Xoops | Joomla | SupeSite

区域采集就是采集网站页面的某个固定区域,并将采集得来的区域代码保存为内联页提供给模板调用,刷新区域采集就可时时更新。

区域采集用途:打破大网站的垄断资源,举例:销售排行榜、股票信息、违章车辆、奥运奖牌等这些信息是不会提供接口的,通过区域采集就可时时更新最新报道。

1.进入后台,在“采集管理”中单击“区域采集管理”,右栏出现“区域采集管理”界面。

Sw593.jpg

“区域采集管理”界面参数说明:

·管理导航:系统提供的区域采集管理导航操作。

->管理首页:链接到区域采集系统项目管理首页。

->添加区域采集项目:单击本功能链接添加新的区域采集项目。

·“操作”列功能链接说明:

->修改:修改你指定的采集项目。

->删除:选择您要删除的采集项目(可多选),选择后单击“删除”按钮即可删除选定的采集项目。

->刷新:生成区域文件。

->预览:预览采集区域文件效果。

·操作按钮:系统提供将已选定的项目[刷新所有区域采集文件]操作按钮。

2.添加区域采集项目

->在管理导航中单击“添加区域采集项目”功能链接,开始添加添加区域采集项目。

Sw594.jpg

“添加区域采集项目”的界面参数说明:

·采集区域项目名称:填写自定义采集区域项目名称。

·采集区域项目简介:填写您自己对本项目的一个简单介绍说明。

·文件名称:指您自定义的文件名。

·网站URL: 填写采集网站的的栏目列表页。

·网页编码格式:提供GB2312UTF-8Big5三种编码格式。国内的网站基本都是GB2312,(默认选项可不选)

如果是香港,台湾网站请采用 Big5编码,如果是采集海外网站用UTF-8编码。

·截取开始字符:填写所要采集页面某个固定区域代码的开始字符。

·截取结束字符:填写所要采集页面某个固定区域代码的结束字符。

!请尽量用较少的字符(如一行内的字符),以保证字符的准确性。填写的代码必须保证是当前列表页唯一的。

·截取代码预览:显示所截取固定区域代码的预览效果。本内容只有在修改区域采集项目时才会显示。

·字符替换项目数:将截取的代码中相应的字符进行替换,以显示自定义的内容。

在此下拉框中可选择要替换项目的数量,不需要替换选择0,最多可替换9个项目。例如选择一个字符替换项目,下方就会出现两个文本框,<如图>假如您想将某些其他网站上标志性的文字或者样式替换成自己网站的内容,只需在“将字符:”后的文本框内输入将被替换的内容,在其后“替换为:”文本框内输入替换的内容即可。

·截取内容链接的后缀名:设置区域采集项目中所需要保存到本服务器文件的后缀名。如将区域采集项目中的远程图片保存在本地服务器中。即采集的区域代码链接包含什么后缀名在这里添上即可,多个的话选用|分割,采集会将这些后缀的链接转变为绝对地址。

Sw595.jpg

·过滤选项:过滤采集正文页中的html字符。

IFRAME:过滤内联。

Object:过滤Falsh和控件。

Script:过滤js、vbs等脚本。

Class:过滤类。

Div:过滤层。

Span:过滤行内元素Span容器。

Table、Tr、Td:过滤表格属性。

Img:过滤图片。

FONT:过滤字体定义。

A:过滤链接,可防止用户单击链接为其它网址。

Html:过滤全部Html代码。

->设置好各项参数之后单击[确定]按钮。

3.单击[刷新所有区域采集文件]操作按钮即可更新区域采集的内容。

!区域采集可和定时设置功能同时运行。

4.代码调用:在“区域采集管理”界面中,将鼠标移至“调用代码”下的文本框内,系统会自动选中,只需复制代码到你模板的相应位置,区域采集就可以正常运行了。