工作原因,第一次爬虫任务就是中国裁判文书网,中国裁判文书网是目前全球最大的裁判文书网,网站上公示全国历年的司法数据。这个网站隔一段时间就改一版,为了防爬,哈哈哈,和各大采集大神斗智斗勇,如果感兴趣的朋友可以去看看这个网站,这货连个a标签都加密,呵呵,简直丧心病狂。
这一段,是给新手看的部署环境,高手可自行移步到下文的思路区。
不要嫌弃代码写的烂,谢谢。因为才学的nodejs,回调函数和异步理解的还不是很深刻,有大佬路过可以指点一下,互相讨论讨论哈。过一段时间在github上发布源码和详情页的解密过程。
专业的博客第一次写,nodejs也是,坑有很多,花了不少时间,头发茂盛了不少,肚皮胖了一圈,哈哈,有志者事竟成,程序员的道路,学无止境。
最后看看成功的爬取数据,哈哈哈。
1、打开一个浏览器,在搜索引擎中输入“中国裁判文书网”,单击“搜索一下”按钮
2、单击选择“中国裁判文书网”官网
3、在输入框中输入输入案由、关键词,单击“搜索”按钮进行查询
4、还可以单击“高级检索”按钮,此时出现的界面中,在“全文检索”处输入文字,单击“检索”
5、还可以在案由后面点击,出现的选项中进行选择,单击“检索”按钮
6、出现的案件,单击“下载”按钮进行下载即可
中国裁判文书网简易使用指南
中国裁判文书网,除拥有检索查看收藏分享下载的主体功能外,同时提供用户注册登录,
建议,留言等附加功能,满足用户对裁判文书网多样的使用需求
快捷检索通过在快捷检索文本框输入关键词即可实现
)快捷检索支持关键词联想推荐在快捷检索框中输入关键词后,联想推荐案由关键词
审理法院当事人审理人员律师律所法律依据八个类型的信息
)快捷检索支持拼音检索,包括全拼和简拼
)裁判文书网支持检索记录自动保存裁判文书网可以保存最近五条检索记录
高级检索通过在高级检索窗口中填写多个信息项来实现
高级检索可以实现多个信息项组合检索裁判文书网的高级检索中提供全文案由案件名称案
号法院名称法院层级案件类型审判程序文书类型裁判日期审判人员当事人律所律师法律依
个信息项的检索,从而实现多信息项组合检索功能
裁判文书网支持在结果中无限次检索在列表页检索框中输入或选择新的检索条件,默认在
当前检索结果的基础上检索裁判文书
中国裁判文书网检索结果会展示哪些内容?
中国裁判文书网的检索结果分别在列表页和全文页展现
在裁判文书列表中,除展现符合检索条件的裁判文书外,还有关联文书以及分类引导树
关联文书通过文书案号,将一二审文书关联在一起显示,客观完整的展现案件的最终结果
关联文书会显示文书的审理程序审理法院案号裁判日期结案方式五项信息