火车采集器/数据导出
来自站长百科
除了能将采集的数据Web发布到网站,直接导入数据库,采集器还可以将数据保存到本地。目前采集器支持的文件格式有
- csv
只需要选择一下csv文件夹的目录,采集器会生成一个csv文件,文件里的标签次序和在任务编辑里的标签排序是一致的。
- html
需要指定html模板,该模板的内容和web发布模块的方式基本一致。比如[标签:标题]将会被替换成实际采集的内容。
- txt
程序将所有的记录保存在一个txt文本里,每个标签之间用换行间隔。
注意:本地文件的编码需要注意,默认的保存方式是和采集源一样的编码。如果指定了某种编码,请将html文件也保存成相应的编码文件。 请按下图进行设置。