站长百科 | 数字化技能提升教程 数字化时代生存宝典
首页
数字化百科
电子书
建站程序
开发
服务器
办公软件
开发教程
服务器教程
软件使用教程
运营教程
热门电子书
WordPress教程
宝塔面板教程
CSS教程
Shopify教程
导航
程序频道
推广频道
网赚频道
人物频道
网站程序
网页制作
云计算
服务器
CMS
论坛
网店
虚拟主机
cPanel
网址导航
WIKI使用导航
WIKI首页
最新资讯
网站程序
站长人物
页面分类
使用帮助
编辑测试
创建条目
网站地图
站长百科导航
站长百科
主机侦探
IDCtalk云说
跨境电商导航
WordPress啦
站长专题
网站推广
网站程序
网站赚钱
虚拟主机
cPanel
网址导航专题
云计算
微博营销
虚拟主机管理系统
开放平台
WIKI程序与应用
美国十大主机
编辑“
ECMS:帝国CMS的采集正则
”
人物百科
|
营销百科
|
网赚百科
|
站长工具
|
网站程序
|
域名主机
|
互联网公司
|
分类索引
跳转至:
导航
、
搜索
警告:
您没有登录。如果您做出任意编辑,您的IP地址将会公开可见。如果您
登录
或
创建
一个账户,您的编辑将归属于您的用户名,且将享受其他好处。
反垃圾检查。
不要
加入这个!
<span style="border:1px solid #000; float:right; padding:6px; margin-bottom:15px; text-align:center;"><strong>导航:</strong> [[ECMS:采集使用篇|上一级]] | [[帝国CMS]] | {{Template:帝国导航}}</span> <div style="clear:both; border:1px solid darkslateblue; background:#f0f0f0; font-size:14px; font-weight:bold; padding:0 5px; margin:20px 0 20px;"> 帝国CMS的采集正则 </div> '''1、作用:通过设置[[采集]]正则以便使系统识别你要采集的内容。''' '''2、帝国[[CMS]]的采集正则是什么样的,下面我们用实例讲解:''' (1)、假如我们要采集页面的内容页为如下页面: 图1:[[HTML]]页面 <div style="border:1px solid #999; width:632px;"> [[{{ns:image}}:cjzz1.gif]]</div> 图2:查看页面源代码为如下: <div style="border:1px solid #999; width:700px;"> [[{{ns:image}}:cjzz2.gif]]</div> (2)、由上图的源代码内容我们可以得出帝国CMS的采集正则: 新闻标题正则: <pre style="border:1px solid #999; background:#f0f0f0; width:600px;"> <td>标题:<strong>[!--title--]</strong></td></pre> 新闻内容正则: <pre style="border:1px solid #999; background:#f0f0f0; width:600px;"> <td>内容:<font color="#FF0000">[!--newstext--]</font></td></pre> 上面中的“[!--title--]”与“[!--newstext--]”分别为“标题”字段与“内容”字段的正则变量。用于指定我们要采集的内容位置。 (3)、由上面我们得出了,帝国CMS采集正则是把正则变量替换要采集内容后的代码内容。格式: <pre style="border:1px solid #999; background:#f0f0f0; width:600px;"> 识别代码头部[!--变量名--]识别代码尾部</pre> <span style="color:red;">注意事项:上面的“识别代码头部”一定是要唯一的标记。</span> '''3、帝国CMS正则还有表示任意内容的字符:“*”''' 如果“识别代码头部”中有内容是变化的,那么我们可以用*代替它。如页面源代码为如下,我们要采集下面的链接地址: <pre style="border:1px solid #999; background:#f0f0f0; width:600px;"> <a title="任意可变内容" href="链接地址">标题</a></pre> 通过使用“*”任意内容表示字符,我们可以用下面的正则忽略可变内容,获得链接地址: <pre style="border:1px solid #999; background:#f0f0f0; width:600px;"> <a title="*" href="[!--newsurl--]"></pre> 附加说明:[!--newsurl--]为页面链接地址的正则变量。 '''4、其它说明:''' <p style="padding-left:15px;"> (1)、正则要找出唯一性的代码。有时候空格都会成为识别的依据。<br> (2)、对于特殊字符请在前面加上“\\”,当然直接将特殊字符改为“*”最合适了。特殊字符如下:<br> “ )”、“(”、“{”、“}”、“[”、“]”、“\”、“?”等等。</p> [[Category:帝国管理系统|D]] [[Category:CMS采集]]
摘要:
请注意,您对站长百科的所有贡献都可能被其他贡献者编辑,修改或删除。如果您不希望您的文字被任意修改和再散布,请不要提交。
您同时也要向我们保证您所提交的内容是您自己所作,或得自一个不受版权保护或相似自由的来源(参阅
Wordpress-mediawiki:版权
的细节)。
未经许可,请勿提交受版权保护的作品!
取消
编辑帮助
(在新窗口中打开)
本页使用的模板:
模板:帝国导航
(
查看源代码
)(受保护)