火车头采集器v8教程怎么使用dll插件

风水堪舆学 | 网络营销 | 住宅风水 | 英文歌曲 | Adobe After Effects | 电脑配置 | 书籍改编电影 | 下载 | Legion | 网络推广 | 动画制作 | 赛事 | PLC | 小说创作 | 虚拟专用服务器 | 成语 | 家庭 | 单反相机 | 电视节目 | 投影机 | 面相 | 香港购物 | 配音 | 文具 | 二次元 | 影视 | 固态硬盘ssd | 虚拟机 | 跆拳道 | r（编程语言） | 秦时明月之天行九歌 | 使命召唤 | 网盘 | 地图 | 琅琊榜（电视剧） | 手机内存 | 角色扮演 | 华硕 | 百度输入法 | 盗墓笔记（小说） | 营销策划 | 化妆品 | Windows | ip地址 | 装修设计 | 齐内丁·齐达内 | 动画电影 | 中国中央电视台 | 罗兰 | 网站优化 | 斗鱼直播 | 冷知识 | 张帅 | 任天堂 | 摄影师 | 三菱商事 | 迅雷（软件） | 计算机病毒 | amd | 屏幕 | 微单相机 | 电学 | qq浏览器 | MacOS | 联赛 | snh48 | 芯片（集成电路） | 后宫·甄嬛传（书籍） | 植物辨识 | 运动 | 大一 | 美容 | 双色球 | 蓝牙音箱 | 楼盘 | 电脑电源 | 采暖 | 显卡驱动 | 体育赛事 | thinkpad | 离婚 | 武侠小说 | 索尼笔记本 | 中国足球协会超级联赛（csl） | youtube | 王力宏（人物） | 外星人 | 努比亚（手机品牌） | 海贼王 | 移动电源 | 完美世界（游戏） | 摩托车 | 编辑器 | 低音炮 | 收益 | 海关 | 徐波 | akb48 | 互联网创业 | 张璐 | 男性 | 性价比 | MacBook Air | 新疆维吾尔自治区 | 插座 | 外汇平台 | 华为Mate30 | 羽毛球技术 | 腾讯 QQ | 蓝屏 | 字幕 | 免费软件 | 电脑故障 | 女生 | 周星驰（人物） | 足球欧洲杯 | pdf | macbook | 直播 | 生活经历 | 骁龙处理器 | 主题曲 | 户外运动 | CPU | 娱乐圈 | 初恋 | 家居 | 流氓软件 | 名言 | 中国足球 | 近视眼 | acg | 一级方程式赛车（f1） | 小品 | 网站运营 | 英格兰足球超级联赛 | 一体机 | 人肉搜索 | 日本电影 | 系统软件 | 人生 | 流星花园 | 电钢琴 | 分辨率 | 迅雷 | 机械设计 | 古典音乐 | 液晶电视 | 睡眠 | 大片 | 资产 | Html/Css | ansys | 天蝎座 | 对联 | 大二 | 吉他学习 | 实习 | uc浏览器 | 计算机科学 | 新华社 | 脱毛 | 视力 | 乐视超级电视 | 大学生活 | 开关电源 | 平面设计 | 音乐版权 | iPhone 11 Pro | 面膜 | 鞠婧祎 | 胡歌（演员） | 郭富城 | 语言 | 赵丽颖（演员） | 意大利 | 电路设计 | 情侣 | NBA篮球 | 蔡徐坤 | 豆瓣电影 | 社交软件 | 微信开发 | 足球彩票 | 电工 | 手机摄像头 | 用户界面设计师 | 华语流行音乐 | 网卡 | 易烊千玺 | 笛子 | 日语学习 | 日语歌曲 | 歌手 | 张子枫 | 搏击项目 | 谭松韵 | 快捷键 | O2O | 移民 |

你的位置：网站首页 >> 频道首页 >>编程语言 >>火车头采集器v8教程怎么使用dll插件

火车头采集器v8教程怎么使用dll插件

来源：蜘蛛抓取(WebSpider) 时间：2015-03-09 12:16 标签：火车头采集器视频教程

2010版采集器插件使用教程
所属分类：
发布用户：火车头
阅读点数：不需要另行扣点
浏览次数：0
更新时间： 10:00:26
下载地址&&
火车采集器2010版增加了插件的使用.用户可以在多个地方使用插件来进行扩展开发.目前插件的使用有如下几个地方
插件的执行是这样的,比如默认页的采集,采集器先获取到网页源码,然后将网页源码交给插件,插件处理完成后,再将数据交给采集器,采集器这时再对插件处理过的数据进行分析处理.提取标签,下载图片等.
我以一个默认页的示例说明一下如何使用PHP插件.我们以采的分页为例.
我们先看一下,这个分页里是用脚本控制生成的.采集器无法接获取的.其中,生成分页的代码有这一段.
//去到第几页
function goto_page(pageno){
pageno = parseInt(pageno);
if((pageno & 1) || (pageno & 9)){
//加入 forward_
if(''.blank()){
window.location.href = '';
window.location.href = '/D5000FEF139_'+pageno+'.html';
这时有一个数字9,代码有多少个分页.而分页的格式为 '/D5000FEF139_'+pageno+'.html';
这时,我们要用插件来生成分页代码,采集器将识别这个代码并获取到分页.怎么来生成分页呢?
很简单,插件首先是获取了当前默认页的地址,如 ,而分页的规则是在.html前加_2,_3等.我们就可以直接用循环和替换生成分页代码了.我写的代码如下.
if($LabelArray['Html']!=&&&&$LabelArray['PageType']=='Content')
$html=$LabelArray['Html'];
& preg_match(&/$pageno & (\d+)$/i&,$html, $matches);
& $pagenum=$matches[1];
& if($pagenum&2)
&& $return=&&locoypages&&;
&& for($i=2;$i&=$$i++)
&&& $url=str_replace(&.html&,'_'.$i.'.html',$LabelUrl);
&&& $return.=&&a href='&.$url.&'&&/a&&;
&& $return.='&/locoypages&';
&& $LabelArray['Html'].=$
echo serialize($LabelArray);
首先,需要注意的是,保存网页源码的是 $LabelArray['Html'] .保存网页类型的是$LabelArray['PageType'].这几个参数在采网址,采内容,采多页处是一样的.我们使用插件测试管理器.得到如下结果.
看采集器里的设置
(58.04 KB)
这样,我们就通过插件改变程序的源代码,从而实现了采集脚本多页的功能.
注意,使用测试版的用户,在当前时间下载前的,请再下载最新版进行测试.
资源详细参数细节预览现在位置： &
emlog火车头采集模块自定义采集标签的...
发布于日　分类：
　浏览：1400 人次　　
首先声明：此功能必须配合笔者发布的《》一文中提供的模块才会有效：
1、在采集内容规则中点击添加按钮添加自定义标签项,如下图所示：
第二、到此可以在提取数据方式中设置需要截取的标签范围或者在数据处理项中添加一个空内容缺省默认标签，都可以的，大家根据自己需要添加吧！
原来，画画也可以画的那么... 01:50
逝者已矣，生者何如？年轻... 22:43
今天很高兴，觉得网站规划... 02:00
维护了下友链，发现有人偷... 22:55
拿着卖白菜的钱，操着卖白... 17:49
垃圾评论又来了啊！ 15:28哪个论坛系统自带采集插件的？火车头那些采集器我都不会用_百度知道
哪个论坛系统自带采集插件的？火车头那些采集器我都不会用
我有更好的答案
按默认排序
//v.youku.html
采集器的相关知识
您可能关注的推广
等待您来回答
下载知道APP
随时随地咨询
出门在外也不愁 下载
 收藏
该文档贡献者很忙，什么也没留下。
 下载此文档
正在努力加载中...
火车头采集器应该如何使用
下载积分：900
内容提示：
文档格式：PDF|
浏览次数：0|
上传日期： 10:05:37|
文档星级：
该用户还上传了这些文档
火车头采集器应该如何使用.PDF
官方公共微信

火车头采集器v8教程怎么使用dll插件

我要回帖

更多关于火车头采集器视频教程的文章

随机推荐

火车头采集器v8教程怎么使用dll插件

我要回帖

更多关于 火车头采集器视频教程 的文章

随机推荐

更多关于火车头采集器视频教程的文章