LeadWit CMS系统操作汇总
导航:返回上一页
设置采集属性[ ]
- 设置采集站点名称:
采集站点名称为助记名称,你可以任意填写,
但要写得清楚明朗,使人一看就明白从哪里采集的
- 设置采集站地址:
要正确填写你要采集站点的URL网址。 如要采集动网新闻系统里的文章,那么这里就设置http://news.dvbbs.net/,注意一定要带“/”
- 设置采集列表页地址:
输入你要采集的有文章标题列表的页面的URL网址。
如要采集这一页“文章标题”下25篇文章,采集列表页地址就一定填: http://news.dvbbs.net/infoList/Catalog_6_1.html
- 设置采集分类:
采集分类是归类名称,你可以任意填写
- 设置采集到:
目前只要填写前两项,即:频道ID和栏目ID
选LZ8_Article表示采集到的内容入文章版块的栏目(栏目编号为你所填写的ClassID)中
选LZ8_News表示采集到的内容入新闻版块的栏目(栏目编号为你所填写的ClassID)中
- 设置列表开始/结束字符:(这个比较关键,要查看“列表页”原代码)
就是要将要采集的列表的位置确定下来,缩小采集范围
如要采集刚才提到的DV的25篇文章,
列表开始字符:就是第一条(“全正则的检测IP是否合法的函数”)前的部分字符
列表结束字符:就是最后一条(“MD5算法研究(2)”)后的部分字符
- 设置列表URL开始/结束字符(这个也比较关键,要查看“列表页”原代码)
将标题的所转向页面的URL地址用“列表URL开始字符”和“列表URL结束字符”确定下来,
如“自動化檢查 IIS 5.0 的安全漏洞“是<a href="../infoview/Article_2921.html">
则“列表URL开始字符”是 href="../
则“列表URL结束字符”是 "> ,这样就把URL确定下来了
自動化檢查 IIS 5.0 的安全漏洞“ 内容页URL地址就是
采集站地址(http://news.dvbbs.net/)+(infoview/Article_2921.html)“
- 设置标题开始/结束字符 (这个也比较关键,要查看“内容页”的原代码)
随便打开一个内容页如(http://news.dvbbs.net/infoview/Article_2921.html)
用“标题字符”和“标题结束字符”将标题确定下来
- 设置内容开始/结束字符 (这个也比较关键,要查看“内容页”的原代码)
仍旧在这一页(http://news.dvbbs.net/infoview/Article_2921.html)
用“内容开始/字符”和“内容结束字符”将标题确定下来
- 其他的几项,从"列表开始字符"到"文章关键字",都是一样设置
最后按”设置”按纽保存。设置完毕
就开始采集[ ]
只要你按“开始采集”按纽就可以了,转到一些采集常数的页面,
你可以默认,这样采集完成后的数据就到了采集数据库(Collect.mdb)。
你还要点击“处理采集数据-》入采集库xxx”入库。
如果选“马上入库(不入采集库)”则数据直接进入了你所设置的文章(LZ8_Article)或新闻(LZ8_News)数据表中了
你可以打开“文章管理-》管理”或“新闻管理-》管理”查看,一定在里面。
就开始采集[ ]
不说了,自动进行。