站长百科 | 数字化技能提升教程 数字化时代生存宝典
首页
数字化百科
电子书
建站程序
开发
服务器
办公软件
开发教程
服务器教程
软件使用教程
运营教程
热门电子书
WordPress教程
宝塔面板教程
CSS教程
Shopify教程
导航
程序频道
推广频道
网赚频道
人物频道
网站程序
网页制作
云计算
服务器
CMS
论坛
网店
虚拟主机
cPanel
网址导航
WIKI使用导航
WIKI首页
最新资讯
网站程序
站长人物
页面分类
使用帮助
编辑测试
创建条目
网站地图
站长百科导航
站长百科
主机侦探
IDCtalk云说
跨境电商导航
WordPress啦
站长专题
网站推广
网站程序
网站赚钱
虚拟主机
cPanel
网址导航专题
云计算
微博营销
虚拟主机管理系统
开放平台
WIKI程序与应用
美国十大主机
编辑“
火车采集器/分页采集
”
人物百科
|
营销百科
|
网赚百科
|
站长工具
|
网站程序
|
域名主机
|
互联网公司
|
分类索引
跳转至:
导航
、
搜索
警告:
您没有登录。如果您做出任意编辑,您的IP地址将会公开可见。如果您
登录
或
创建
一个账户,您的编辑将归属于您的用户名,且将享受其他好处。
反垃圾检查。
不要
加入这个!
{{火车采集器导航}} 分页就是目标[[网站]]上一个文章分为好几页,需要设置规则将其全部采到。采集要点: *采集规则要对每个分页都适用。 *分页规则如果是全部列出,只要第一个页面的分页规则就可以了。如果是上下页,每个页面的分页规则也要都适用。 '''具体操作流程:'''先测试获得所有分页,再对每个分页里的内容进行获取。 下边以<nowiki>http://www.pconline.com.cn/diy/graphics/hq/gz/0802/1226877.html</nowiki>为例来说明一下具体的使用方法。 第一点:采集规则要对每个分页都适用 看一下,这里分页有两个,前一页[1] [2] 下一页 ,要做的是要使所写的规则在两个页面中都可以正常采到内容,写个规则,测试第一页,成功获取内容,然后改写[[网址]]为第二个,测试,同样可以获得要的内容,那么,说明这一步已经成功了。 进入下一步。规则是这样写的,两个页面都通过。 [[Image:Locoy_FYCJ1.jpg|center]] 现在看分页这里的设置,全部列出是在第一页或每一页上都有全部的发布文章的网址,上下页是没有将全部的列出。这个规则里选全部列出。因此,只要在第一页里找好包含所有网址的区域就可以了。 [[Image:Locoy_FYCJ2.jpg|center]] 看一下,上边是有分页网址的区域,选个开头结尾,就可以正常采到分页了。 [[Image:Locoy_FYCJ3.jpg|center]] 火车的新版是可以直观的看到分页网址的,这对做分页规则很有用。 [[Image:Locoy_FYCJ4.jpg|center]] 这样全部采集到了。 '''注意:'''分页设置下边有个分页内容合并连接代码,可以设置成你想要的东西,比如[[CMS]]的手动分页[[标签]]。 下边来讲一个上下页的分页处理方法及如何使用手动链接地地规则. 以 <nowiki>http://www.inpai.com.cn/doc/hard/86643.htm</nowiki> 这个页面为例.来找一下分页的开头和结尾,这个分页很明显. 开始:<nowiki><div id="divSubPageNav" class="doctext08"> </nowiki> 结束:<nowiki></div></nowiki>. 使用上一页,下一页的形式就可以采到所有地址.不过会发现有一个地址是不需要的,看下边: <pre> 此页面包含多个分页: 1:http://www.inpai.com.cn/doc/hard/86643.htm 2:http://www.inpai.com.cn/doc/hard/86643_2.htm 3:http://www.inpai.com.cn/doc/hard/86643_3.htm 4:http://www.inpai.com.cn/doc/hard/86643_4.htm 5:http://www.inpai.com.cn/doc/hard/86643_5.htm 6:http://www.inpai.com.cn/doc/hard/86643_6.htm 7:http://www.inpai.com.cn/doc/hard/86643_7.htm 8:http://www.inpai.com.cn/doc/hard/86643_8.htm 9:http://www.inpai.com.cn/doc/hard/86643_9.htm 10:http://www.inpai.com.cn/doc/hard/86643_10.htm 11:http://www.inpai.com.cn/doc/hard/86643_11.htm 12:http://www.inpai.com.cn/doc/hard/86643_12.htm 13:http://www.inpai.com.cn/doc/hard/86643_13.htm 14:http://www.inpai.com.cn/doc/hard/86643_14.htm 15:http://www.inpai.com.cn/doc/hard/86643_15.htm 16:http://www.inpai.com.cn/doc/hard/86643_16.htm 17:http://www.inpai.com.cn/doc/hard/86643_17.htm 18:http://www.inpai.com.cn/doc/hard/86643_18.htm 19:http://product.inpai.com.cn/Product_default_1041.htm 有分页匹配的标签,比如内容注意选中标签编辑框中的[该标签在分页中匹配] </pre> 最后一个不是,可以看到,前边的网址和后边的是不一样的.现在是使用手动填写[[链接]]地址规则的时候了.在分页链接地址样式里边,写 <nowiki>http://www.inpai.com.cn/</nowiki>[参数].htm 分页网址里写<nowiki>http://www.inpai.com.cn/[参数1].htm</nowiki>,现在看一下,正确了. [[Image:Locoy_FYCJ5.jpg|center]] '''技巧:'''在使用自定义地址样式时,程序会自动补全网址,请看这个规则 [[Image:Locoy_FYCJ6.jpg|center]] ==参考来源== *http://help.locoy.com/2010/ [[category:火车采集器|F]] {{火车采集器使用手册导航}}
摘要:
请注意,您对站长百科的所有贡献都可能被其他贡献者编辑,修改或删除。如果您不希望您的文字被任意修改和再散布,请不要提交。
您同时也要向我们保证您所提交的内容是您自己所作,或得自一个不受版权保护或相似自由的来源(参阅
Wordpress-mediawiki:版权
的细节)。
未经许可,请勿提交受版权保护的作品!
取消
编辑帮助
(在新窗口中打开)
本页使用的模板:
模板:火车采集器使用手册导航
(
编辑
)
模板:火车采集器导航
(
编辑
)