火车采集器/FTP文件上传
来自站长百科
对于一些使用服务器的,可以直接将下载地址指定为网站的目录。
但对于对服务器没权限的朋友来说,使用ftp上传可以达到同样效果。具体操作及注意事项如下:
- 设定本地保存的地址和服务器上的文件上传目录。
注意:本地保存目录下的目录结构和文件是原样不动的上传到服务器的文件上传根目录。
- 文件的保存目录
目前可以自己指定目录,还可以用随机目录来设定保存目录,比如上图里的yyyy/MM-dd/HH,比如日期是2008.12.29。那么生成的目录就是2008/12-29/14.其它以此类推。这样就避免了一个文件夹存图片太多的问题。
- 同步和异步
- 同步是指在采集一个页面内容并完成下载该页文件后再去请求下一个页面,下载只在单线程中运行
- 异步是指采集页面信息和下载文件分开操作下载文件被分配到其他线程中运行,可以多线程中运行
- 异步可获得更快的下载速度,但由于部分网站的文件地址在一段时间内自动失效,所以不适合使用异步而必须使用同步下载。而大部分使用文件绝对地址的则不会,并且支持分段下载,所以大多数可选择异步下载.
- 主动和被动模式
和直接上传ftp里的设置一样。具体可以看下ftp里的设置。一般测试时哪一种成功上传就用哪一种。