火车采集器/任意格式文件下载

来自站长百科
跳转至: 导航、​ 搜索

火车采集器 | 安装 | 主程序 | 子程序 | 应用拓展 | 模块开发 | FAQ

收费版火车采集器的程序支持任意文件的下载。具体是使用时选中探测文件并下载即可。 需要注意的是:

Locoy RYWJXZ1.jpg


Locoy RYWJXZ2.jpg
  • 这个功能可以下载论坛附件或要下载站的文件,比如论坛附件下载地址是d.asp?id=1,那么只要在下载文件地必须包含里写上d.asp就可以下载源码里包含这个字符串链接中的附件了。注意这个在有些站是需要登陆后才可以下载。所以有时下载不了,请注意是否登陆或是有权限下载那些文件。还有的情况是获取的登陆信息不正确,相当于没登陆.也会导致下载不成功。
  • 如果使用单一的地址,比如直接是一个文件的地址,程序会自动去下载并判断文件类型。如果是多个文件实际地址请用分隔符 #||# 相连,程序会分别进行下载.
  • 在下载前请做好测试。具体在规则测试那里可以看到下载结果。
Locoy RYWJXZ3.jpg
  • 文件的命名:为了防止同一目录下保存太多的文件,采集器支持随机目录保存方式,默认按时间按一定的规则生成目录保存文件。

看图2,注意这里的绿色符号都是用特殊含义的,yyyy代表是年,如最后产生的就是2009,MM是月,其它类推,如果要命名为yyyy,则需要对绿色字符进行转义,即\y\y\y\y,前一个斜杠即可.文件保存地址也一样.如下图1,2,3的右边,这里是设定了可以测试目录的.您可以测试好后使用.;

Locoy RYWJXZ4.jpg

有时下载的文件格式很特别,程序无法识别,这时请打开程序目录下的system/config.ini文件,添加要下载的文件的后缀.

Extensions=jpg|png|gif|bmp|tiff|jpeg|mp3|wma|asf|avi|rm|wav|mp4|wmv|css|exe|doc|xls|ppt|mdb|pdf
|3gp|amv|txt|ram|swf|fla|flv|zip|rar|bt|bittorrent|mpeg|m3u|csf|pdg|umd|pdb|wps|gz|7z|bz2|tar|chm|sis|sisx
|cab|rmvb|jar|jad|mid|sch|ljob|lsite|pjob|psite|dll|pxl|iqa|ipa|dmg

程序可以解决大部分的下载问题,有时对于一些防盗链或是使用了一些技术手段的网站,获得不了下载地址,这时,可以使用程序的.net编程插件编写程序处理.




参考来源[ ]

火车采集器使用手册导航

安装

系统安装

主程序

主程序|主菜单|命令行启动|随机文件夹保存数据|正则匹配模式采集数据|采集记录筛选|代理服务器采集数据|POST方式获得网址|拓展插件|分页采集|多页采集|数据导出|多任务多线程|手动链接格式设置|循环匹配采集|网站登陆采集|列表缩略图及标签采集|html标签排除|全局词语替换|首图缩略|FTP文件上传|附件上传|本地数据编辑|下载导出|图片下载|Flash文件下载|任意格式文件下载|采集数据导入数据库|任务定时自动更新|任务运行日志|自动中文分词|自动摘要和拼音|前后截取模式|采集任务新建

子程序

源代码获取与模拟|Web在线发布模块编辑器|Web在线发布配置管理|数据库发布模块编辑器|数据库发布配置管理|工具箱|编程插件管理|翻译测试|中文分词测试|自动运行管理器 任务队列管理器|自动升级程序

应用拓展

数据库发布模块编辑器制作|外部编程插件开发

模块开发

DedeCMS文章模块|PHPWind论坛模块|Discuz论坛模块

FAQ

使用前常见问题|编辑任务中常见问题|发布失败常见问题|使用中常见问题|VIP版本常见问题