火车采集器/循环匹配采集

来自站长百科
跳转至: 导航、​ 搜索

火车采集器 | 安装 | 主程序 | 子程序 | 应用拓展 | 模块开发 | FAQ

循环采集的原理和网址采集部分相似,以论坛主题和回复为例,讲一下循环采集的使用。

以http://bbs.locoy.com/spider-34395-1-1.html为例:

要获得每一楼的作者,写规则 href="space.php?uid=(*)" style="margin-left: 20px; font-weight: 800">开头, <结尾,默认可以获得一 个结果 rq204 ,现在选中该记录循环匹配,看结果

Locoy XHPP1.jpg
rq204|||xiongyujie37|||懷念過去↑文|||懷念過去↑文|||liurenzui|||luring|||ecbbs|||ecbbs|||indiboy|||soarb

这样就获得了第一页的所有帖的作者,使用标签循环匹配里的添加为新记录看下.

Locoy XHPP2.jpg
Locoy XHPP3.jpg

这样的话这个新记录可以作为一个单独的记录发布了.再添加一个字段,发布时间看下效果,也要选中循环.

Locoy XHPP4.jpg

还有个需要注意的功能是该标签在分页中循环匹配,这个选中的话,有分页的话分页中的记录也会循环匹配的.

添加为新记录的话,如果只是部分标签循环,那么其它的标签会默认为空,如果其它某个标签没有内容但选择了循环匹配,那么循环的内容将全部是一样的。



参考来源[ ]

火车采集器使用手册导航

安装

系统安装

主程序

主程序|主菜单|命令行启动|随机文件夹保存数据|正则匹配模式采集数据|采集记录筛选|代理服务器采集数据|POST方式获得网址|拓展插件|分页采集|多页采集|数据导出|多任务多线程|手动链接格式设置|循环匹配采集|网站登陆采集|列表缩略图及标签采集|html标签排除|全局词语替换|首图缩略|FTP文件上传|附件上传|本地数据编辑|下载导出|图片下载|Flash文件下载|任意格式文件下载|采集数据导入数据库|任务定时自动更新|任务运行日志|自动中文分词|自动摘要和拼音|前后截取模式|采集任务新建

子程序

源代码获取与模拟|Web在线发布模块编辑器|Web在线发布配置管理|数据库发布模块编辑器|数据库发布配置管理|工具箱|编程插件管理|翻译测试|中文分词测试|自动运行管理器 任务队列管理器|自动升级程序

应用拓展

数据库发布模块编辑器制作|外部编程插件开发

模块开发

DedeCMS文章模块|PHPWind论坛模块|Discuz论坛模块

FAQ

使用前常见问题|编辑任务中常见问题|发布失败常见问题|使用中常见问题|VIP版本常见问题