站长百科 | 数字化技能提升教程 数字化时代生存宝典
首页
数字化百科
电子书
建站程序
开发
服务器
办公软件
开发教程
服务器教程
软件使用教程
运营教程
热门电子书
WordPress教程
宝塔面板教程
CSS教程
Shopify教程
导航
程序频道
推广频道
网赚频道
人物频道
网站程序
网页制作
云计算
服务器
CMS
论坛
网店
虚拟主机
cPanel
网址导航
WIKI使用导航
WIKI首页
最新资讯
网站程序
站长人物
页面分类
使用帮助
编辑测试
创建条目
网站地图
站长百科导航
站长百科
主机侦探
IDCtalk云说
跨境电商导航
WordPress啦
站长专题
网站推广
网站程序
网站赚钱
虚拟主机
cPanel
网址导航专题
云计算
微博营销
虚拟主机管理系统
开放平台
WIKI程序与应用
美国十大主机
编辑“
火车采集器/外部编程插件开发
”
人物百科
|
营销百科
|
网赚百科
|
站长工具
|
网站程序
|
域名主机
|
互联网公司
|
分类索引
跳转至:
导航
、
搜索
警告:
您没有登录。如果您做出任意编辑,您的IP地址将会公开可见。如果您
登录
或
创建
一个账户,您的编辑将归属于您的用户名,且将享受其他好处。
反垃圾检查。
不要
加入这个!
{{火车采集器导航}} 使用外部编程插件,可以对数据做任意想要的处理。 处理过程是[[火车采集器]]先获取[[网页]]内容,然后将网页内容,[[网址|网页地址]]等数据传递给[[插件]],插件可以针对传送过来的数据做处理,然后返回一定格式的数据给采集器.目前火车采集器里有四个位置可以使用插件. [[Image:Locoy_WBBCCJKF1.png|center]] *'''采网址:'''是采集器对网址列表里的网址请求完数据未分析源码前给插件使用. *'''采内容:'''采集默认页后返回源代码给插件处理. *'''采多页:'''在多页采集时每个页面都将使用. *'''保存时:'''在采集器处理完数据,保存数据到数据库之前,在网页内容符合排除条件之前处理. 具体的插件开发请配合插件管理器进行开发. [[Image:Locoy_WBBCCJKF2.png|center]] 具体插件的开发,请点击插件管理器里的新建按钮,即可以查看到相应的开发文件和开发示例. 如下是几个简单的[[PHP]]插件中可能使用到的小程序. 第一个,如果标题小于一定字节,就用其它的字符替换掉标题。 <pre> $num=strlen($LabelArray['内容']); if ($num<10) //小于10字节 { $LabelArray['内容']='替换的内容';//如果小于上面设置的多少字节,就替换成这个 } </pre> 第二个:普通地址与[[迅雷]]专用地址互相转化 <pre> $LabelArray['迅雷地址解密']=substr(base64_decode(str_ireplace("thunder://","",$LabelArray['迅雷地址解密'])),2,-2); $LabelArray['迅雷地址加密']="thunder://".base64_encode("AA".$LabelArray['迅雷地址加密']."ZZ"); </pre> 第三个:使用php计算出售价格 <pre> <?php $LabelArray['价格']=$LabelArray['价格']*2+100-90; //价格标签为纯数字,可以执行常规的一些运算,主要用于采集的商品价格自动增加出售价使用 ?> </pre> 第四个:使用标题的[[MD5]]值做随机文件名使用 <pre> <?php $date = date(DATE_RFC822); $file=$LabelArray['标题']; $LabelArray['随机文件名']=MD5($file."$date"); //这样的结果就是标题文字+当前时间的MD5值,做为部分程序的随机文件名使用比较好,重复机率比较小了 ?> </pre> 第五个:随机打乱行号 <pre> <?php $arr = explode("\n",$LabelArray['内容']); //用换行分隔形式一数组 shuffle($arr);//打乱数组 $LabelArray['内容']= implode("\n",$arr);//重新做成字符串 ?> </pre> 这些只做参考,更多功能,请编程实现。 ==参考来源== *http://help.locoy.com/2010/ [[category:火车采集器|W]] {{火车采集器使用手册导航}}
摘要:
请注意,您对站长百科的所有贡献都可能被其他贡献者编辑,修改或删除。如果您不希望您的文字被任意修改和再散布,请不要提交。
您同时也要向我们保证您所提交的内容是您自己所作,或得自一个不受版权保护或相似自由的来源(参阅
Wordpress-mediawiki:版权
的细节)。
未经许可,请勿提交受版权保护的作品!
取消
编辑帮助
(在新窗口中打开)
本页使用的模板:
模板:火车采集器使用手册导航
(
编辑
)
模板:火车采集器导航
(
编辑
)