站长百科 | 数字化技能提升教程 数字化时代生存宝典
首页
数字化百科
电子书
建站程序
开发
服务器
办公软件
开发教程
服务器教程
软件使用教程
运营教程
热门电子书
WordPress教程
宝塔面板教程
CSS教程
Shopify教程
导航
程序频道
推广频道
网赚频道
人物频道
网站程序
网页制作
云计算
服务器
CMS
论坛
网店
虚拟主机
cPanel
网址导航
WIKI使用导航
WIKI首页
最新资讯
网站程序
站长人物
页面分类
使用帮助
编辑测试
创建条目
网站地图
站长百科导航
站长百科
主机侦探
IDCtalk云说
跨境电商导航
WordPress啦
站长专题
网站推广
网站程序
网站赚钱
虚拟主机
cPanel
网址导航专题
云计算
微博营销
虚拟主机管理系统
开放平台
WIKI程序与应用
美国十大主机
编辑“
ECMS:采集实例教程
”
人物百科
|
营销百科
|
网赚百科
|
站长工具
|
网站程序
|
域名主机
|
互联网公司
|
分类索引
跳转至:
导航
、
搜索
警告:
您没有登录。如果您做出任意编辑,您的IP地址将会公开可见。如果您
登录
或
创建
一个账户,您的编辑将归属于您的用户名,且将享受其他好处。
反垃圾检查。
不要
加入这个!
高级
特殊字符
帮助
标题
2级
3级
4级
5级
格式
插入
拉丁字母
扩展拉丁字母
国际音标
符号
希腊字母
希腊字母扩展
西里尔字母
阿拉伯字母
扩展阿拉伯字母
希伯来字母
孟加拉语字符集
泰米尔数字和符号
泰卢固语字符集
僧伽罗语字符集
梵文字符集
古吉拉特语字符集
泰语字符集
老挝语
高棉语字母
加拿大原住民音节文字
卢恩
Á
á
À
à
Â
â
Ä
ä
Ã
ã
Ǎ
ǎ
Ā
ā
Ă
ă
Ą
ą
Å
å
Ć
ć
Ĉ
ĉ
Ç
ç
Č
č
Ċ
ċ
Đ
đ
Ď
ď
É
é
È
è
Ê
ê
Ë
ë
Ě
ě
Ē
ē
Ĕ
ĕ
Ė
ė
Ę
ę
Ĝ
ĝ
Ģ
ģ
Ğ
ğ
Ġ
ġ
Ĥ
ĥ
Ħ
ħ
Í
í
Ì
ì
Î
î
Ï
ï
Ĩ
ĩ
Ǐ
ǐ
Ī
ī
Ĭ
ĭ
İ
ı
Į
į
Ĵ
ĵ
Ķ
ķ
Ĺ
ĺ
Ļ
ļ
Ľ
ľ
Ł
ł
Ń
ń
Ñ
ñ
Ņ
ņ
Ň
ň
Ó
ó
Ò
ò
Ô
ô
Ö
ö
Õ
õ
Ǒ
ǒ
Ō
ō
Ŏ
ŏ
Ǫ
ǫ
Ő
ő
Ŕ
ŕ
Ŗ
ŗ
Ř
ř
Ś
ś
Ŝ
ŝ
Ş
ş
Š
š
Ș
ș
Ț
ț
Ť
ť
Ú
ú
Ù
ù
Û
û
Ü
ü
Ũ
ũ
Ů
ů
Ǔ
ǔ
Ū
ū
ǖ
ǘ
ǚ
ǜ
Ŭ
ŭ
Ų
ų
Ű
ű
Ŵ
ŵ
Ý
ý
Ŷ
ŷ
Ÿ
ÿ
Ȳ
ȳ
Ź
ź
Ž
ž
Ż
ż
Æ
æ
Ǣ
ǣ
Ø
ø
Œ
œ
ß
Ð
ð
Þ
þ
Ə
ə
格式
链接
标题
列表
文件
参考
讨论
说明
输入内容
输出结果
斜体
''斜体文字''
斜体文字
粗体
'''粗体文字'''
粗体文字
粗斜体
'''''粗斜体文字'''''
粗斜体文字
<span style="border:1px solid #000; float:right; padding:6px; margin-bottom:15px; text-align:center;"><strong>导航:</strong> [[ECMS:采集使用篇|上一级]] | [[帝国CMS]] | {{Template:帝国导航}}</span> <div style="clear:both;"></div> '''实例教你使用采集:'''本节通过[[采集]]简单的页面作为采集教程实例。 <div style="border:1px solid darkslateblue; background:#f0f0f0; margin:20px 0 20px; padding:0 5px; font-size:14px; font-weight:bold;"> 采集页面地址 </div> <span style="color:red;">每个系统模型都有自己的采集,无论是内置的还是用户自定义的系统模型,新闻系统有新闻系统采集,[[下载]]系统有下载系统采集等等。</span> 下面讲解新闻系统模型的采集,其它系统模型采集基本雷同,用户可举一反三。 '''本例要采集的页面地址:[http://www.phome.net/tmp/cjpage/list.html http://www.phome.net/tmp/cjpage/list.html]''' <div style="border:1px solid darkslateblue; background:#f0f0f0; margin:20px 0 20px; padding:0 5px; font-size:14px; font-weight:bold;"> 开始采集 </div> '''采集步骤:''' <ol> <li>增加采集节点; <li>预览采集正则是否正确; <li>开始采集; <li>对采集的数据进行审核并入库; <li>生成栏目及内容[[HTML]]页面。</ol> '''一、增加采集节点: ''' 1、登陆后台->点击大菜单“栏目管理”>“增加采集节点”; 2、“选择要增加采集的栏目”(选择终极栏目); <div style="border:1px solid #999; width:700px;"> [[{{ns:image}}:cjexp1.gif]]</div> 3、“选择要增加采集的栏目”后进入增加节点页面; 4、打开要采集的列表页面:[http://www.phome.net/tmp/cjpage/list.html http://www.phome.net/tmp/cjpage/list.html] <div style="border:1px solid #999; width:462px;"> [[{{ns:image}}:cjexp2.gif]]</div> 点击查看“源文件” <div style="border:1px solid #999; width:357px;"> [[{{ns:image}}:cjexp3.gif]]</div> 点击查看,列表页源代码为如下: <div style="border:1px solid #999; width:700px;"> [[{{ns:image}}:cjexp4.gif]]</div> 5、开始设置采集节点及列表页正则: (1)、输入节点名称:采集实例 <div style="border:1px solid #999; width:700px;"> [[{{ns:image}}:cjexp5.gif]]</div> (2)、采集页面地址:<nowiki>http://www.phome.net/tmp/cjpage/list.html</nowiki> <div style="border:1px solid #999; width:700px;"> [[{{ns:image}}:cjexp6.gif]]</div> (3)、由列表页的源代码:“<a href="page1.html" target="_blank">”,我们得出“内容页地址前缀”为:<nowiki>http://www.phome.net/tmp/cjpage/</nowiki> <div style="border:1px solid #999; width:753px;"> [[{{ns:image}}:cjexp7.gif]]</div> (4)、设置“信息页链接正则”:由列表页的源代码得出。 图1:页面[[源代码]] <div style="border:1px solid #999; width:700px;"> [[{{ns:image}}:cjexp8.gif]]</div> 图2:得出的信息页链接正则 <div style="border:1px solid #999; width:748px;"> [[{{ns:image}}:cjexp9.gif]]</div> 6、点击采集的内容页页面并查看源文件:http://www.phome.net/tmp/cjpage/page4.html 图1:内容页页面 <div style="border:1px solid #999; width:704px;"> [[{{ns:image}}:cjexp10.gif]]</div> 图2:内容页源代码 <div style="border:1px solid #999; width:686px;"> [[{{ns:image}}:cjexp11.gif]]</div> 7、设置内容页内容正则:(标题及内容正则) (1)、标题正则:由源代码内容我们得出“新闻标题”正则为: 图1:页面源代码 <div style="border:1px solid #999; width:689px;"> [[{{ns:image}}:cjexp12.gif]]</div> 图2:得出的标题正则 <div style="border:1px solid #999; width:700px;"> [[{{ns:image}}:cjexp13.gif]]</div> (2)、内容正则:由源代码内容我们得出“新闻内容”正则为: 图1:页面源代码 <div style="border:1px solid #999; width:688px;"> [[{{ns:image}}:cjexp14.gif]]</div> 图2:得出的新闻内容正则 <div style="border:1px solid #999; width:700px;"> [[{{ns:image}}:cjexp15.gif]]</div> 8、点击“提交”按钮即可增加节点完毕! '''二、预览采集正则是否正确:''' 1、上面增加采集节点后,我们返回“管理节点”页面,如下: <div style="border:1px solid #999; width:700px;"> [[{{ns:image}}:cjexp16.gif]]</div> 2、点击“预览”采集,进入节点正则预览与验证: 图1:采集页面地址列表 <div style="border:1px solid #999; width:711px;"> [[{{ns:image}}:cjexp17.gif]]</div> 图2:信息链接列表 <div style="border:1px solid #999; width:694px;"> [[{{ns:image}}:cjexp18.gif]]</div> 图3:采集的内容页内容 <div style="border:1px solid #999; width:682px;"> [[{{ns:image}}:cjexp19.gif]]</div> 3、上面链接列表页及内容页内容预览无误后方可进行采集操作。 '''三、开始采集:''' 1、上面的采集节点正则预览无误后,我们返回“管理节点”页面: <div style="border:1px solid #999; width:700px;"> [[{{ns:image}}:cjexp20.gif]]</div> 2、点击上面的“开始采集”链接,开始进行采集; 3、采集信息完成后,系统会转向采集入库页面,如下: <div style="border:1px solid #999; width:700px;"> [[{{ns:image}}:cjexp21.gif]]</div> '''四、对采集的数据进行审核并入库:''' <div style="border:1px solid #999; width:700px;"> [[{{ns:image}}:cjexp22.gif]]</div> 即可完成入库操作: <div style="border:1px solid #999; width:577px;"> [[{{ns:image}}:cjexp23.gif]]</div> 管理栏目信息也可以看到我们刚才入库的信息: <div style="border:1px solid #999; width:700px;"> [[{{ns:image}}:cjexp24.gif]]</div> '''五、生成栏目及内容HTML页面:''' 点击“系统设置”大菜单>“数据更新中心”,进入数据更新中心页面: 1、生成首页:点击“刷新首页”。 <div style="border:1px solid #999; width:516px;"> [[{{ns:image}}:cjexp25.gif]]</div> 2、生成栏目页:“生成多栏目页面”选择“新闻系统”这个栏目,然后点击“开始刷新”。 <div style="border:1px solid #999; width:512px;"> [[{{ns:image}}:cjexp26.gif]]</div> 3、生成内容页:“按条件生成信息内容页面”: <div style="border:1px solid #999; width:700px;"> [[{{ns:image}}:cjexp27.gif]]</div> '''六、预览前台页面''' 首页: <div style="border:1px solid #999; width:700px;"> [[{{ns:image}}:cjexp28.gif]]</div> 列表页: <div style="border:1px solid #999; width:665px;"> [[{{ns:image}}:cjexp29.gif]]</div> 信息内容页: <div style="border:1px solid #999; width:670px;"> [[{{ns:image}}:cjexp30.gif]]</div> 至此本实例讲解完毕。 '''常见问题''' 提示信息:Warning: preg_replace() [function.preg-replace]: Compilation failed: range out of order in character class at offset 83 in 答:你的采集正则变量名写错导致,请检查你的正则变量。 [[Category:帝国管理系统|D]] [[Category:CMS采集]]
摘要:
请注意,您对站长百科的所有贡献都可能被其他贡献者编辑,修改或删除。如果您不希望您的文字被任意修改和再散布,请不要提交。
您同时也要向我们保证您所提交的内容是您自己所作,或得自一个不受版权保护或相似自由的来源(参阅
Wordpress-mediawiki:版权
的细节)。
未经许可,请勿提交受版权保护的作品!
取消
编辑帮助
(在新窗口中打开)
模板:帝国导航
(
查看源代码
)(受保护)