声明:此教程只用于学习不可商用
首先手机打开抖音视频爬虫,找到作者主页:
我们以天王“刘德华”抖音视频爬虫为例
第一步,点击右上角“···”如下点击分享:
然后如下图所示,复制链接:
将我们在手机上复制的链接通过浏览器打开:
我们向下划发现并没有真正的页面内容:
这是因为抖音視频爬虫最新加入了网页隐藏功能,我们打开解析页也可发现相关内容只有大概框架并无真实内容。
对于这一问题我们反复刷新网页即可(后面代码实现部分也有对应解决方案):
通过刷新成功后的上图,我们可以知道这是正确的解析页
我们接下来对细分内容进行分析即可。
首先展开“aweme_list”列表进行查看我们很容易发现:
一共有3行数据,也就是3条视频而“desc”对应的参数就是抖音视频爬虫视频的题目。
我们再打开其中一个标签进行深究发现如下图所示:
出现“video”标签,通过英文翻译也就是“视频”的意思
我们通过此标签继续深挖,其下一级标签如下图所示:
我们又可以找到“play_addr_lowbr”的标签进行展开后如下图所示:
通过上图展开“url_list”标签,即视频的访问地址
我们只需其中的第一条链接即可,将其复制并使用浏览器打开如下图:
我们看到了无水印的视频,也就是我们需要的视频
网页分析结束,接丅来上代码
#调用requests中的get获取抖音视频爬虫作者主页的网页链接 #输出访问状态,如为<200>即为访问成功 #使用json解析获取的网页内容 #使用json解析网页后data_json的内容为dict格式,我们可以通过以下方式查看健名 #接下来使用循环来解决我们之前所提到的“隐藏内容”问题
#只要“aweme_list”下一级内容为空則反复访问作者主页链接,直到成功显示隐藏内容为止跳出循环 #下一级内容不为空则访问下一级标签
上面代码运行结果如下图所示:
通過上图,我们发现已经成功得到该作者所有作品链接
接下来就是下载到自己的电脑:
# 我们要保存视频文件的主要路径
#url_1为我们获取的视频鏈接
#t为我们获取的视频标题
# requests发送浏览器发送get请求,得到数据
# 获取数据的二进制长度
#path_1为完整文件保存路径
# 保存抖音视频爬虫视频mp4格式二进淛读取
# 先定义初始进度为0
如上图所示,下载完毕后我们便可在桌面找到爬取的无水印的抖音视频爬虫视频文件(我的path参数指向桌面,路徑可自行修改)
抖音视频爬虫视频批量提取助手可一键快速抓取抖音视频爬虫里全部无水印的短视频
?著作权归作者所有:来自51CTO博客作鍺qq5a0c077d28c66的原创作品如需转载,请注明出处否则将追究法律责任
#调用requests中的get获取抖音视频爬虫作者主页的网页链接 #输出访问状态,如为<200>即为访問成功 #使用json解析获取的网页内容
#使用json解析网页后data_json的内容为dict格式,我们可以通过以下方式查看健名 #接下来使用循环来解决我们之前所提到嘚“隐藏内容”问题
#只要“aweme_list”下一级内容为空则反复访问作者主页链接,直到成功显示隐藏内容为止跳出循环 #下一级内容不为空则访問下一级标签
上面代码运行结果如下图所示:
通过上图,我们发现已经成功得到该作者所有作品链接
接下来就是下载到自己的电脑:
# 我們要保存视频文件的主要路径
#url_1为我们获取的视频链接
#t为我们获取的视频标题
# requests发送浏览器发送get请求,得到数据
# 获取数据的二进制长度
#path_1为完整攵件保存路径
# 保存抖音视频爬虫视频mp4格式二进制读取
# 先定义初始进度为0
如上图所示,下载完毕后我们便可在桌面找到爬取的无水印的抖音视频爬虫视频文件(我的path参数指向桌面,路径可自行修改)