站长百科 | 数字化技能提升教程 数字化时代生存宝典
首页
数字化百科
电子书
建站程序
开发
服务器
办公软件
开发教程
服务器教程
软件使用教程
运营教程
热门电子书
WordPress教程
宝塔面板教程
CSS教程
Shopify教程
导航
程序频道
推广频道
网赚频道
人物频道
网站程序
网页制作
云计算
服务器
CMS
论坛
网店
虚拟主机
cPanel
网址导航
WIKI使用导航
WIKI首页
最新资讯
网站程序
站长人物
页面分类
使用帮助
编辑测试
创建条目
网站地图
站长百科导航
站长百科
主机侦探
IDCtalk云说
跨境电商导航
WordPress啦
站长专题
网站推广
网站程序
网站赚钱
虚拟主机
cPanel
网址导航专题
云计算
微博营销
虚拟主机管理系统
开放平台
WIKI程序与应用
美国十大主机
编辑“
火车头
”
人物百科
|
营销百科
|
网赚百科
|
站长工具
|
网站程序
|
域名主机
|
互联网公司
|
分类索引
跳转至:
导航
、
搜索
警告:
您没有登录。如果您做出任意编辑,您的IP地址将会公开可见。如果您
登录
或
创建
一个账户,您的编辑将归属于您的用户名,且将享受其他好处。
反垃圾检查。
不要
加入这个!
[[Image:locoy_logo.jpg|right|196px|]] '''火车采集器'''(LocoySpider)由合肥工业大学毕业生,李进斌开发,是一个功能强大的数据采集[[软件]].使用它,可以很容易的从[[网页]]上抓取文字,图片,文件等资源.[[程序]]支持远程[[下载]]图片文件,支持[[网站]]登陆后信息采集,支持探测文件真实地址,支持[[代理]],支持[[防盗链]]的采集,支持采集数据直接入库和模仿人手工发布等.同时,软件具有极高的稳定性,可以多线程,多任务的工作,可以用它进行大批量数据的更新.程序还支持多页和分页的采集,再难的数据格式也可以找到解决方案. ==系统概况== *'''官方地址:'''http://www.locoy.com/ *'''软件类型:'''商业软件 *'''开发环境:'''[[.Net]]/Access/MySQL/MSSQL/Oracle *'''下载地址:'''[http://www.locoy.com/Down/ 下载地址1] ==系统特征== *'''规则自定义''' 通过采集规则的定义,可以搜索所有网站采集几乎任何类型的信息。 *'''多任务,多线程 可以同时进行多个信息采集任务,每个任务可以使用多个线程。 *'''所见即所得''' 任务采集过程所见即所得,过程中遍历的链接信息、采集信息、错误信息等都会及时的反映在软件界面中。 *'''数据保存''' 数据边采集边自动保存到关系[[数据库]]中,并且数据结构能够自动适应,软件可以根据采集规则自动创建数据库,以及其中的表和字段,也可以通过导库方式灵活的将数据保存到客户已有的数据库结构中。 *'''断点续采''' 信息采集任务可以在停止后从断点开始继续采集,从此用不再担心采集任务意外中断了。 *'''网站登录 ''' 支持网站[[Cookie]],支持网站可视化登录,即使登录时需要[[验证码]]的网站也能采集。 *'''计划任务''' 通过这个功能可以让的采集任务定时、定量或者一直循环执行。 *'''采集范围限制 可以根据采集的深度和[[网址]]的标识来限制采集的范围。 *'''文件下载''' 可以将采集到的[[二进制]]文件(诸如:图片、音乐、软件、文档等等)下载到本地磁盘或者采集结果数据库中。 *'''结果替换''' 可以将采集的结果根据规则替换成你定义的内容。 *'''条件保存''' 可以根据某个条件来决定那些信息保存,那些信息过滤。 *'''过滤重复内容''' 软件可根据用户设置和实际情况对重复内容和重复网址自动删除重复内容。 *'''特殊链接识别''' 运用此功能可以将用[[JavaScript]]动态生成的链接或其他更古怪的连接识别出来。 *'''数据发布''' 可以通过自定义接口,将已采集的结果数据发布到任意的内容管理系统和指定数据库中。现在已支持的目标发布媒体包括:数据库([[access]], [[MSSQL|sql server]],[[my sql]],[[oracle]]) ,静态[[htm]]文件。 *'''预留编程接口''' 定义多个编程接口,用户可以在事件中利用[[PHP]],[[C#]]语言进行编程,扩充采集功能。 ==使用手册== ===[[火车采集器/安装|安装]]=== ===[[火车采集器/主程序|主程序]]=== <div style="-moz-column-count:3;column-count:3;" class="sclist"> *[[火车采集器/主程序窗口介绍|主程序]] *[[火车采集器/主菜单介绍|主菜单]] *[[火车采集器/命令行启动|命令行启动]] *[[火车采集器/随机文件夹保存数据|随机文件夹保存数据]] *[[火车采集器/正则匹配模式采集数据 |正则匹配模式采集数据]] *[[火车采集器/采集记录筛选|采集记录筛选]] *[[火车采集器/代理服务器采集数据|代理服务器采集数据]] *[[火车采集器/POST方式获得网址|POST方式获得网址]] *[[火车采集器/拓展插件|拓展插件]] *[[火车采集器/分页采集|分页采集]] *[[火车采集器/多页采集|多页采集]] *[[火车采集器/数据导出|数据导出]] *[[火车采集器/多任务多线程|多任务多线程]] *[[火车采集器/手动链接格式设置|手动链接格式设置]] *[[火车采集器/循环匹配采集|循环匹配采集]] *[[火车采集器/网站登陆采集|网站登陆采集]] *[[火车采集器/列表缩略图及标签采集|列表缩略图及标签采集]] *[[火车采集器/html标签排除|html标签排除]] *[[火车采集器/全局词语替换|全局词语替换]] *[[火车采集器/首图缩略|首图缩略]] *[[火车采集器/FTP文件上传|FTP文件上传]] *[[火车采集器/附件上传|附件上传]] *[[火车采集器/本地数据编辑|本地数据编辑]] *[[火车采集器/下载导出|下载导出]] *[[火车采集器/图片下载|图片下载]] *[[火车采集器/Flash文件下载|Flash文件下载]] *[[火车采集器/任意格式文件下载|任意格式文件下载]] *[[火车采集器/采集数据导入数据库|采集数据导入数据库]] *[[火车采集器/任务定时自动更新|任务定时自动更新]] *[[火车采集器/任务运行日志|任务运行日志]] *[[火车采集器/自动中文分词|自动中文分词]] *[[火车采集器/自动摘要和拼音|自动摘要和拼音]] *[[火车采集器/前后截取模式|前后截取模式]] *[[火车采集器/采集任务新建|采集任务新建]] </div> ===[[火车采集器/子程序|子程序]]=== <div style="-moz-column-count:3;column-count:3;" class="sclist"> *[[火车采集器/源代码获取与模拟|源代码获取与模拟]] *[[火车采集器/Web在线发布模块编辑器|Web在线发布模块编辑器]] *[[火车采集器/Web在线发布配置管理|Web在线发布配置管理]] *[[火车采集器/数据库发布模块编辑器|数据库发布模块编辑器]] *[[火车采集器/数据库发布配置管理|数据库发布配置管理]] *[[火车采集器/工具箱|工具箱]] *[[火车采集器/编程插件管理|编程插件管理]] *[[火车采集器/翻译测试|翻译测试]] *[[火车采集器/中文分词测试|中文分词测试]] *[[火车采集器/自动运行管理器|自动运行管理器]] *[[火车采集器/任务队列管理器|任务队列管理器]] *[[火车采集器/自动升级程序|自动升级程序]] </div> ===[[火车采集器/应用拓展|应用拓展]]=== <div style="-moz-column-count:3;column-count:3;" class="sclist"> *[[火车采集器/数据库发布模块编辑器制作|数据库发布模块编辑器制作]] *[[火车采集器/外部编程插件开发|外部编程插件开发]] </div> ===[[火车采集器/模块开发|模块开发]]=== <div style="-moz-column-count:3;column-count:3;" class="sclist"> *[[火车采集器/DedeCMS文章模块|DedeCMS文章模块]] *[[火车采集器/PHPWind论坛模块|PHPWind论坛模块]] *[[火车采集器/Discuz论坛模块|Discuz论坛模块]] </div> ===[[火车采集器/FAQ|FAQ]]=== <div style="-moz-column-count:3;column-count:3;" class="sclist"> *[[火车采集器/使用前常见问题|使用前常见问题]] *[[火车采集器/编辑任务中常见问题|编辑任务中常见问题]] *[[火车采集器/发布失败常见问题|发布失败常见问题]] *[[火车采集器/使用中常见问题|使用中常见问题]] *[[火车采集器/VIP版本常见问题|VIP版本常见问题]] </div> ==相关条目== *[[SEO作弊]] *[[网赚宝]] ==参考来源== *[http://www.locoy.com/product/ 参考来源1] [[category:采集软件|H]] [[category:商业软件|H]] [[category:火车采集器|H]]
摘要:
请注意,您对站长百科的所有贡献都可能被其他贡献者编辑,修改或删除。如果您不希望您的文字被任意修改和再散布,请不要提交。
您同时也要向我们保证您所提交的内容是您自己所作,或得自一个不受版权保护或相似自由的来源(参阅
Wordpress-mediawiki:版权
的细节)。
未经许可,请勿提交受版权保护的作品!
取消
编辑帮助
(在新窗口中打开)