站长百科 | 数字化技能提升教程 数字化时代生存宝典
首页
数字化百科
电子书
建站程序
开发
服务器
办公软件
开发教程
服务器教程
软件使用教程
运营教程
热门电子书
WordPress教程
宝塔面板教程
CSS教程
Shopify教程
导航
程序频道
推广频道
网赚频道
人物频道
网站程序
网页制作
云计算
服务器
CMS
论坛
网店
虚拟主机
cPanel
网址导航
WIKI使用导航
WIKI首页
最新资讯
网站程序
站长人物
页面分类
使用帮助
编辑测试
创建条目
网站地图
站长百科导航
站长百科
主机侦探
IDCtalk云说
跨境电商导航
WordPress啦
站长专题
网站推广
网站程序
网站赚钱
虚拟主机
cPanel
网址导航专题
云计算
微博营销
虚拟主机管理系统
开放平台
WIKI程序与应用
美国十大主机
编辑“
PHP168:如何采集一篇文章中的分页(进阶)
”
人物百科
|
营销百科
|
网赚百科
|
站长工具
|
网站程序
|
域名主机
|
互联网公司
|
分类索引
跳转至:
导航
、
搜索
警告:
您没有登录。如果您做出任意编辑,您的IP地址将会公开可见。如果您
登录
或
创建
一个账户,您的编辑将归属于您的用户名,且将享受其他好处。
反垃圾检查。
不要
加入这个!
<span style="text-align:center; border:1px solid #000; float:right; padding:6px;"><strong>导航: </strong> [[PHP168:数据采集指南|上一级]] | [[PHP168]] | {{Template:php168导航}}</span> <div style="clear:both;"></div> 关于这个问题.相对来说复杂一点.但也并不是很难的. 首先.修改内容规则,然后点击选中: '''显示不常用的高级设置(一般不用)''' 如下图 <div style="border:1px solid #999; width:798px;"> [[{{ns:image}}:php168_21.jpg]]</div> 以上图中标志了三项输入框,需要进行设置. <ul> <li>对于第一项表单而言<br> 比如:<br> 内容的第一页'''<nowiki>http://php168.com/1/index-22.html</nowiki>'''<br> 内容的第二页'''<nowiki>http://php168.com/1/index-22_2.htm</nowiki>'''<br> 那么表单填.html<br> 分析规则就是对比第一页与第二页的[[网址]]从左到右哪个字符出现不同,就把第一页网址之后的字符复制出来 如果是这种情况 '''<nowiki>http://php168.com/1/index.php?id=2&page=1</nowiki>'''<br> '''<nowiki>http://php168.com/1/index.php?id=2&page=2</nowiki>''' 对于这种情况,他后面不同的是一个数字,即是页码数字的话,就不需要填写.留空即可 <li>对于第二项表单而言<br> 第一页'''<nowiki>http://php168.com/1/index-22.html</nowiki>'''<br> 第二页'''<nowiki>http://php168.com/1/index-22_2.htm</nowiki>'''<br> 那么右边的表单填_[page].htm<br> 分析规则就是对比第一页与第二页的网址从左到右哪个字符出现不同,就把第二页的网址之后的字符复制出来,并把变动的页码数字用[page]替换 如果是这种情况 '''<nowiki>http://php168.com/1/index.php?id=2&page=1</nowiki>'''<br> '''<nowiki>http://php168.com/1/index.php?id=2&page=2</nowiki>''' 对于这种情况,他后面不同的是一个数字,即是页码数字的话,更简单,只需要填写[page]即可 <li>对于第三项表单而言<br> 第一页'''<nowiki>http://php168.com/1/index.html</nowiki>'''<br> 第二页'''<nowiki>http://php168.com/1/index_1.html</nowiki>'''<br> 此时属于怪癖的,理论上应该是 第三页'''<nowiki>http://php168.com/1/index_2.html</nowiki>'''<br> 所以表单请选择是,但一般情况都是选否的,也就是说页码数字为1却是第二页.页码数为2却是第三页.就属于特殊现象.需要选则是. [[Category:PHP168数据采集]]
摘要:
请注意,您对站长百科的所有贡献都可能被其他贡献者编辑,修改或删除。如果您不希望您的文字被任意修改和再散布,请不要提交。
您同时也要向我们保证您所提交的内容是您自己所作,或得自一个不受版权保护或相似自由的来源(参阅
Wordpress-mediawiki:版权
的细节)。
未经许可,请勿提交受版权保护的作品!
取消
编辑帮助
(在新窗口中打开)
本页使用的模板:
模板:Php168导航
(
查看源代码
)(受保护)