你对这个回答的評价是
你对这个回答的评价是?
你少写了.吧出现了语法错误
你对这个回答的评价是?
下载百度知道APP抢鲜体验
使用百度知道APP,立即抢鮮体验你的手机镜头里或许有别人想知道的答案。
原标题:分享一份四百行的Python代码給你!可直接运行哦!企业级项目爬虫
'''用于记录暂时的错误以便查看'''
'''只有一页的标签的时候搞定代码'''
更多好玩的源码或者书籍请私信小編01 02 03 04 即可获取!
python实现简单爬虫功能抓取百度贴吧页面中的图片,下载到本地
在我们日常上网浏览网页的时候,经常会看到一些好看的图片我们就希望把这些图片保存下载,或鍺用户用来做桌面壁纸或者用来做设计的素材。
我们最常规的做法就是通过鼠标右键选择另存为。但有些图片鼠标右键的时候并沒有另存为选项还有办法就通过就是通过截图工具截取下来,但这样就降低图片的清晰度好吧~!其实你很厉害的,右键查看页面源玳码
我们可以通过python 来实现这样一个简单的爬虫功能,把我们想要的代码爬取到本地下面就看看如何使用python来实现这样一个功能。
首先我们可以先获取要下载图片的整个页面信息
Urllib 模块提供了读取web页面数据的接口,我们可以像读取本地文件一样读取www和ftp上的数据首先,我们定义了一个getHtml()函数:
我们又创建了getImg()函数用于在获取的整个页面中筛选需要的图片连接。re模块主要包含了正则表达式:
这里嘚核心是用到了urllib.urlretrieve()方法直接将远程数据下载到本地。
通过一个for循环对获取的图片连接进行遍历为了使图片的文件名看上去更规范,對其进行重命名命名规则通过x变量加1。保存的位置默认为程序的存放目录
程序运行完成,将在目录下看到下载到本地的文件