火车采集器/采集记录筛选
来自站长百科
有时有些记录不需要,火车采集器的记录筛选功能可以完成这个工作。
火车采集器记录筛选有以下几个处理方法:
- 标签内容不得重复:
该功能可以让某个字段不出现重复内容。该功能在ACCESS,SQLite数据库保存数据时有效。(其它的数据库处理比较复杂。如果需要此功能,请修改字段的类型,该类型必须要可以建立唯一索引。)
- 标签内容不得为空
这个采集器所有版本都支持。只要该标签最后的内容为空,则采集器对该记录进行筛选。
- 标签内容必须包含
- 标签内容不得包含
对于符合筛选结果的数据如何处理,请在选项->采集发布选项->对不符合标签内容包含条件的记录直接删除或是设为未采。