客户达装修软件怎么没有宝贝分类装修

抓取页面中表格里面的分页数据 - 开源中国社区
当前访客身份:游客 [
当前位置:
一个页面中有一个表格,表格自带分页。如net的DataGrid.如何做到抓取
DataGrid的分页数据.
共有5个答案
<span class="a_vote_num" id="a_vote_num_
引用来自“黄亿华”的评论不熟悉net的
DataGrid,能否给个URL?是一个内部系统
&table cellspacing="0" cellpadding="3" rules="all" border="1" id="DataGrid1" style="background-color:Wborder-color:#CCCCCC;border-width:1border-style:Nfont-size:12width:740border-collapse:"&
&tr align="left" style="color:#000066;background-color:W"&
&td colspan="12"&&span&上一页&/span&&&a href="javascript:__doPostBack('DataGrid1$ctl01$ctl01','')" style="color:#000066;"&下一页&/a&&/td&
&/tr&&tr style="color:Wbackground-color:#006699;font-weight:"&
&td&&&/td&&td&检验单ID&/td&&td&住院号&/td&&td&姓名&/td&&td&性别&/td&&td&年龄&/td&&td&病区&/td&&td&工作组&/td&&td&审核人员&/td&&td&报告时间&/td&&td&
& & & & & & & & & & & & & & & & 多项打印
& & & & & & & & & & & & & & &/td&&td&&&/td&
&/tr&&tr style="color:#000066;"&
&td&&a href="javascript:__doPostBack('DataGrid1$ctl03$ctl00','')" style="color:#000066;"&选择&/a&&/td&&td&0320&/td&&td& & &&/td&&td&陈雪霏 & & & & & & & & & & & &&/td&&td&女&/td&&td&76岁&/td&&td&心血管内科一区&/td&&td&生化组&/td&&td&冯志勇&/td&&td& 11:00:18&/td&&td&
& & & & & & & & & & & & & & & & &input id="DataGrid1_ctl03_CheckBox1" type="checkbox" name="DataGrid1$ctl03$CheckBox1" /&&label for="DataGrid1_ctl03_CheckBox1"& &/label&
& & & & & & & & & & & & & & &/td&&td style="background-color:P"&1&/td&
&/tr&&tr style="color:#000066;"&
&td&&a href="javascript:__doPostBack('DataGrid1$ctl04$ctl00','')" style="color:#000066;"&选择&/a&&/td&&td&0275&/td&&td& & &&/td&&td&陈雪霏 & & & & & & & & & & & &&/td&&td&女&/td&&td&76岁&/td&&td&心血管内科一区&/td&&td&血液血常规组&/td&&td&毛维玉&/td&&td& 10:23:12&/td&&td&
& & & & & & & & & & & & & & & & &input id="DataGrid1_ctl04_CheckBox1" type="checkbox" name="DataGrid1$ctl04$CheckBox1" /&&label for="DataGrid1_ctl04_CheckBox1"& &/label&
& & & & & & & & & & & & & & &/td&&td style="background-color:P"&2&/td&
&/tr&&tr style="color:#000066;"&
&td&&a href="javascript:__doPostBack('DataGrid1$ctl05$ctl00','')" style="color:#000066;"&选择&/a&&/td&&td&0260&/td&&td& & &&/td&&td&陈雪霏 & & & & & & & & & & & &&/td&&td&女&/td&&td&76岁&/td&&td&心血管内科一区&/td&&td&生化组&/td&&td&肖成凤&/td&&td& 12:01:03&/td&&td&
& & & & & & & & & & & & & & & & &input id="DataGrid1_ctl05_CheckBox1" type="checkbox" name="DataGrid1$ctl05$CheckBox1" /&&label for="DataGrid1_ctl05_CheckBox1"& &/label&
& & & & & & & & & & & & & & &/td&&td style="background-color:P"&3&/td&
&/tr&&tr style="color:#000066;"&
&td&&a href="javascript:__doPostBack('DataGrid1$ctl06$ctl00','')" style="color:#000066;"&选择&/a&&/td&&td&1145&/td&&td& & &&/td&&td&陈雪霏 & & & & & & & & & & & &&/td&&td&女&/td&&td&76岁&/td&&td&心血管内科一区&/td&&td&G046&/td&&td&陈卫布&/td&&td& 8:02:30&/td&&td&
& & & & & & & & & & & & & & & & &input id="DataGrid1_ctl06_CheckBox1" type="checkbox" name="DataGrid1$ctl06$CheckBox1" /&&label for="DataGrid1_ctl06_CheckBox1"& &/label&
& & & & & & & & & & & & & & &/td&&td style="background-color:P"&4&/td&
&/tr&&tr style="color:#000066;"&
&td&&a href="javascript:__doPostBack('DataGrid1$ctl07$ctl00','')" style="color:#000066;"&选择&/a&&/td&&td&1129&/td&&td& & &&/td&&td&陈雪霏 & & & & & & & & & & & &&/td&&td&女&/td&&td&76岁&/td&&td&心血管内科一区&/td&&td&G046&/td&&td&陈卫布&/td&&td& 7:49:34&/td&&td&
& & & & & & & & & & & & & & & & &input id="DataGrid1_ctl07_CheckBox1" type="checkbox" name="DataGrid1$ctl07$CheckBox1" /&&label for="DataGrid1_ctl07_CheckBox1"& &/label&
& & & & & & & & & & & & & & &/td&&td style="background-color:P"&5&/td&
&/tr&&tr style="color:#000066;"&
&td&&a href="javascript:__doPostBack('DataGrid1$ctl08$ctl00','')" style="color:#000066;"&选择&/a&&/td&&td&0102&/td&&td& & &&/td&&td&陈雪霏&/td&&td&女&/td&&td&76岁&/td&&td&心血管内科一区&/td&&td&G029&/td&&td&崔红&/td&&td& 11:30:01&/td&&td&
& & & & & & & & & & & & & & & & &input id="DataGrid1_ctl08_CheckBox1" type="checkbox" name="DataGrid1$ctl08$CheckBox1" /&&label for="DataGrid1_ctl08_CheckBox1"& &/label&
& & & & & & & & & & & & & & &/td&&td style="background-color:P"&6&/td&
&/tr&&tr style="color:#000066;"&
&td&&a href="javascript:__doPostBack('DataGrid1$ctl09$ctl00','')" style="color:#000066;"&选择&/a&&/td&&td&1260&/td&&td& & &&/td&&td&陈雪霏 & & & & & & & & & & & &&/td&&td&女&/td&&td&76岁&/td&&td&心血管内科一区&/td&&td&免疫组&/td&&td&陈月&/td&&td& 11:22:06&/td&&td&
& & & & & & & & & & & & & & & & &input id="DataGrid1_ctl09_CheckBox1" type="checkbox" name="DataGrid1$ctl09$CheckBox1" /&&label for="DataGrid1_ctl09_CheckBox1"& &/label&
& & & & & & & & & & & & & & &/td&&td style="background-color:P"&7&/td&
&/tr&&tr style="color:Wbackground-color:#669999;font-weight:"&
&td&&a href="javascript:__doPostBack('DataGrid1$ctl10$ctl00','')" style="color:W"&选择&/a&&/td&&td&0046&/td&&td& & &&/td&&td&陈雪霏 & & & & & & & & & & & &&/td&&td&女&/td&&td&76岁&/td&&td&心血管内科一区&/td&&td&生化组&/td&&td&陈昕&/td&&td& 10:36:29&/td&&td&
& & & & & & & & & & & & & & & & &input id="DataGrid1_ctl10_CheckBox1" type="checkbox" name="DataGrid1$ctl10$CheckBox1" /&&label for="DataGrid1_ctl10_CheckBox1"& &/label&
& & & & & & & & & & & & & & &/td&&td style="background-color:P"&8&/td&
如这个这个是DataGrid在html里面自带分页.如何抓取?
<span class="a_vote_num" id="a_vote_num_
你不手动点那些页面,你是抓不来的,一般分页是单个页面加载,所以你只能单个页面抓取,不然人家服务器的数据一下子让你全拿到了
<span class="a_vote_num" id="a_vote_num_
咱不管它是net还是JAVA,是DataGrid还是XXGrid。。首先它得是页面吧,是页面就得有HTML吧,你直接分析HTML就行
--- 共有 3 条评论 ---
: 好的谢谢
(2年前)&nbsp&
: 一句话,不管是什么,都得走HTTP协议。你抓包看看,然后模拟它的HTTP请求发过去
(2年前)&nbsp&
有html页.但我要抓取表格所有页的所有数据,表格是带分页
(2年前)&nbsp&
<span class="a_vote_num" id="a_vote_num_
不熟悉net的
DataGrid,能否给个URL?
--- 共有 1 条评论 ---
我要抓取的是一个医院内部的网站,不对外开放。他们用的是asp的空间.见引用评论,谢谢
(2年前)&nbsp&
<span class="a_vote_num" id="a_vote_num_
先抓总页数,然后分页抓
更多开发者职位上
有什么技术问题吗?
有点污的...的其它问题
类似的话题后使用快捷导航没有帐号?
查看: 3700|回复: 8
想学习R抓取网页数据、表格,如何入手?
金牌会员, 积分 1220, 距离下一级还需 1780 积分
论坛徽章:7
数据分析首先希望获得数据源,以前粗略学过网络采集器。想用R在网上数据源抓取,比如下面这个数据表的全表抓取,发现好多问题:表头、乱码、翻页,请教高手,大家是用其他采集器还是直接用R。特别佩服包里的股票信息采集函数。
/zhaopin/s?wd=%CA%FD%BE%DD%B7%D6%CE%F6&rn=20&p=mini&type=
高级会员, 积分 793, 距离下一级还需 207 积分
论坛徽章:10
感觉好高端的样子,采集的时候,为什么不统一处理一下数据格式呢?
中级会员, 积分 387, 距离下一级还需 113 积分
论坛徽章:5
高级会员, 积分 735, 距离下一级还需 265 积分
论坛徽章:5
R更倾向于熟悉吧。。其他你如果懂其他语言的话,用其他语言爬不是更好。
论坛徽章:32
中级会员, 积分 474, 距离下一级还需 26 积分
论坛徽章:2
高级会员, 积分 617, 距离下一级还需 383 积分
论坛徽章:4
中级会员, 积分 448, 距离下一级还需 52 积分
论坛徽章:1
网上有现成的代码,貌似你放到后台去就可以了
扫一扫加入本版微信群匿名用户不能发表回复!|
每天回帖即可获得10分可用分!小技巧:
你还可以输入10000个字符
(Ctrl+Enter)
请遵守CSDN,不得违反国家法律法规。
转载文章请注明出自“CSDN(www.csdn.net)”。如是商业用途请联系原作者。『怎样保存网页中的表格』相关搜索
(C) 列表网&琼ICP备号-12&琼公网安备08如何利用Matlab抓取网页数据
%朋友需要做金融方面的分析,要求从网站上下载大量的数据,一个一个复制粘贴太费事。我写了一个简单的网络爬虫,主要用到正则表达式,可以自动下载网页源文件里面的数据。
for year =
for season =
fprintf('%d年%d季度的数据...', year, season)
[sourcefile, status] =
urlread(sprintf('http://vip.stock..cn/corp/go.php/vMS_MarketHistory/stockid/000001/type/S.phtml?year=%d&season=%d',
if ~status
error('读取出错!\n')
'\s+(\d\d\d\d-\d\d-\d\d)\s*';&&&
%获取日期('s'空格字符间的日期数据)
[datefile, date_tokens]= regexp(sourcefile, expr1, 'match',
'tokens');&& %返回正则表达式的两个关键字
'match'和 'tokens'
date = cell(size(date_tokens));
for idx = 1:length(date_tokens)
&&& date{idx} =
date_tokens{idx}{1};&&&
%length(date_tokens)行 1列
expr2 = '&div
align="center"&(\d*\.?\d*)&/div&';
%从源文件中获取目标数据
[datafile, data_tokens] = regexp(sourcefile, expr2, 'match',
'tokens');
data = zeros(size(data_tokens));
for idx = 1:length(data_tokens)
&&& data(idx) =
str2double(data_tokens{idx}{1});&&&&&&
%length(data_tokens)行 1列
data = reshape(data, 6, length(data)/6 )'; %重排
数据表格形式为6列,(length(data)/6)行)
filename =
sprintf('%d年',year);&&&&
pathname = [pwd
'\data'];&&&&&
if ~exist(pathname,'dir')
mkdir(pathname);
fullfilepath = [pwd '\data\' filename];
% 保存数据到Excel
sheet = sprintf('第%d季度',
season);&&&&
%工作表名称
xlswrite(fullfilepath, date' , sheet);&
range = sprintf('B1:%s%d',char(double('B')+size(data,2)-1),
size(data,1)); %从源文件中获取的目标数据的放置范围
xlswrite(fullfilepath, data, sheet, range);
fprintf('OK!\n')
fprintf('全部完成!\n')
已投稿到:
以上网友发言只代表其个人观点,不代表新浪网的观点或立场。

我要回帖

更多关于 如何装修宝贝详情页 的文章

 

随机推荐