BLK-477最美的女明星是谁一名?

这个爬虫来自于一个问答贴:

感谢大佬提供技术支持:

这大概是我遇见反爬做的,最,那啥的小说网站了,网站如下:

一,首先需要知道bytes类型是可遍历的,emmmm,我是才知道。

二,python里ord和chr的使用,我个人好像是第一次使用,尴尬

1,小说内容不在源码里,所以无法直接获取;

2,小说内容经过加密和base64编码后,放在一个html页面,这个页面返回的是杂乱的js,需要格式化

3,这个html页面可以直接拼接,也可以按照源码里比较简单的js来改写成python语言生成

查看源码时,有如下生成链接的js,url_get_data就是对应的html链接

js需要的参数都在里面

经过上一步获得的html链接

对应的html链接与内容:

右侧内容很杂乱,可格式化之后,放入pycharm命名为js文件来分析

因为论坛的重要信息比较凌乱,这里整理并补充一下,因为经验原因,这些东西陆陆续续的做了三四天。

 首先是看雪论坛以为大佬的代码,我把他实现并理解了一下:

# 向下取整在python里就是取整 # 找到密文,密文特点:最长的base64编码后的字符串 # 编码且未解密的内容 print('编码且未解密的内容:') # 找到解密需要传的第二个值 # 遍历处理解码后的内容,s的类型是bytes # 转换url编码,拼接 # 创建一个数字列表,0-255 # 转换数字列表,达到需要的某种顺序

直接改原文链接就可以抓不同章节了,前面说的生成链接也补齐了。

就酱,算结束了。 

我要回帖

更多关于 最美的女明星是谁一名 的文章

 

随机推荐