IWMS 网页采集说明
来自站长百科
导航: 上一页
网页采集使用正则表达式提取要采集的内容。后台已提供向导方式采集,请按照提示生成规则。
下载的采集规则在添加规则里导入后修改分类等信息添加即可使用。
如果觉得向导方式比较麻烦可以使用下边的老方法生成采集规则
4.5版以后已可以使用向导模式生成采集规则
新闻链接规则举例
- 第一步查看新闻列表页源码
- 第二步列表页源码中找到一个链接html代码,并复制到向导模式的文本框
· <a href="http://mobile.163.com/04/0920/18/10OAE1DM0011179D.html" target=_blank>
- 第三步
将新闻的url(http://mobile.163.com/04/0920/18 /10OAE1DM0011179D.html)替换为[gt](对新闻内容等规则都是替换需要的部分为[gt])
· <a href="[gt]" target=_blank>
- 第四步:点击生成规则,文本框内就得到生成的新闻链接规则
注意: 如果规则里有图片等链接需要把相对地址改为绝对地址即以http://开始
复制html时要复制获取内容前后的一部分内容才可识别
如果生成的规则有问题并且正则表达式有一定了解,推荐使用正则表达式调试工具Regulator。