站长百科 | 数字化技能提升教程 数字化时代生存宝典
首页
数字化百科
电子书
建站程序
开发
服务器
办公软件
开发教程
服务器教程
软件使用教程
运营教程
热门电子书
WordPress教程
宝塔面板教程
CSS教程
Shopify教程
导航
程序频道
推广频道
网赚频道
人物频道
网站程序
网页制作
云计算
服务器
CMS
论坛
网店
虚拟主机
cPanel
网址导航
WIKI使用导航
WIKI首页
最新资讯
网站程序
站长人物
页面分类
使用帮助
编辑测试
创建条目
网站地图
站长百科导航
站长百科
主机侦探
IDCtalk云说
跨境电商导航
WordPress啦
站长专题
网站推广
网站程序
网站赚钱
虚拟主机
cPanel
网址导航专题
云计算
微博营销
虚拟主机管理系统
开放平台
WIKI程序与应用
美国十大主机
编辑“
火车采集器/多页采集
”
人物百科
|
营销百科
|
网赚百科
|
站长工具
|
网站程序
|
域名主机
|
互联网公司
|
分类索引
跳转至:
导航
、
搜索
警告:
您没有登录。如果您做出任意编辑,您的IP地址将会公开可见。如果您
登录
或
创建
一个账户,您的编辑将归属于您的用户名,且将享受其他好处。
反垃圾检查。
不要
加入这个!
{{火车采集器导航}} 何为多页? 本来是从[[网址]]采集那块采集到网址,再对这个网址(也叫默认页)进行采集。但是有时有许多信息他并不在一个页面上,而是和这个默认页有一定的关系,要不网址在默认页里,要不网址和默认页网址有联系。就这个问题来讲一下具体的解决办法。 这里有两种途径获得第三个网址,先讲从默认页网址替换得到新网址。 以<nowiki>http://data.movie.xunlei.com/movie/39843</nowiki> 这个页面为例,比如要获得全部的”剧情简介“,就得进入一下页,刚好这两页有关系,”剧情简介“页面的地址是 <nowiki>http://movie.xunlei.com/movie/39843/introduction</nowiki>,只是多了一个 introduction ,这里可以使用普通替换,也可以使用正则。看一下。 [[Image:Locoy_DYCJ1.jpg|center]] 这样就可以获得所需要的了。当然这里组合也可以有多个$的,比如$1,$2。 下边说一下用默认页源代码中获得网址的方法来处理上边的网址,这样就可以获得和上边一样的效果了。 [[Image:Locoy_DYCJ2.jpg|center]] ==参考来源== *http://help.locoy.com/2010/ [[category:火车采集器|D]] {{火车采集器使用手册导航}}
摘要:
请注意,您对站长百科的所有贡献都可能被其他贡献者编辑,修改或删除。如果您不希望您的文字被任意修改和再散布,请不要提交。
您同时也要向我们保证您所提交的内容是您自己所作,或得自一个不受版权保护或相似自由的来源(参阅
Wordpress-mediawiki:版权
的细节)。
未经许可,请勿提交受版权保护的作品!
取消
编辑帮助
(在新窗口中打开)
本页使用的模板:
模板:火车采集器使用手册导航
(
编辑
)
模板:火车采集器导航
(
编辑
)