B站视频数据在什么地方查看啊?有人知道吗

1.数据抓取数据集的获取是我们进行数据分析的第一步。现在获取数据的主要途径一般为:现成数据;自己写爬虫去爬取数据;使用现有的爬虫工具爬取所需内容,保存到数据库,或以文件的形式保存到本地。 博主用的是用

数据集的获取是我们进行数据分析的第一步。现在获取数据的主要途径一般为:现成数据;自己写爬虫去爬取数据;使用现有的爬虫工具爬取所需内容,保存到数据库,或以文件的形式保存到本地。 博主用的是用自己编写的爬虫代码获得数据。(爬虫源代码可以找博主要,在评论区回复即可)

1.首先确定需要爬取网页url地址 2.通过http/https协议来获取相应的html页面 3.提取html页面里有用的数据 a.如果是需要的数据就保存起来 b.如果是页面里的其他url,那就继续执行第二步。

发起请求 通过http库向目标站点发起请求,就是发送一个request,请求可以包含额外的header等信息,等待服务器的响应 获取响应内容 如果服务器正常响应,会得到一个reponse,reponse的内容便是所要获取的页面内容,类型可能有html,json字符串,二进制数据(如图片视频)等类型。 解析内容 得到的内容可能是html,可以用正则表达式,网页解析库进行解析,可能是json,可以直接转为json解析对象解析,可能是二进制数据,可以做保存或者进一步处理。 保存数据 保存的形式多种多样,可以保存成文本,也可以保存到数据库,或者保存特定格式文件

1 通过分析用户请求的headers信息进行反爬虫。网站中应用的最多 2通过验证用户行为进行反爬虫,不如通过判断同一个ip在短时间内是否频繁访问对应网站等进行分析。 3通过动态页面增加爬取的难度,达到反爬虫目的。 对策 1 在爬虫中构造这些用户请求的headers信息,以此将爬虫伪装成浏览器 2 使用代理服务器并经常切换代理服务器方式,一般就能够攻克限制。 3.利用一些软件,比如selenium+phantomjs就可以攻克 反爬虫的手段 :user-agent、代理、验证码、动态数据加载、加密数据

1 网页文本 如html文档 json格式文本 2.图片 获取到的是二进制文件保存为图片格式 3.视频 获取的二进制文件保存为视频格式即可 4.其他 只要能请求到的,都能获取 解析方式 1 直接处理 2 json解析 3 正则表达式 4 beautifulsoup 5 pyquery 6 xpath

数据得到手,我们就需要对我们爬取的数据进行清洗工作,为之后的数据分析做铺垫,如果清洗的不到位势必会对之后的数据分析造成影响。 下文将从数据格式统一、空值处理。

去掉数据的空格中 在用爬虫进行数据爬取时用strip()对爬取的字符串进行处理 将中文数据转换为阿拉伯数字 例如1.7万变成17000,代码如下

用爬虫对数据爬取的时候,若爬取的值不存在会报错,用异常处理语句try{}except:pass(try为爬取视频信息的代码),跳过不存在的视频信息数据。

# #将数据 拼合成字典

对b站热门播放量进行分析,对2020年热门视频的播放量分为4个等级 一千万排放量以上为一个等级 五百万到一千万播放量为一个等级 五百万到一百万播放量为一个等级 一百万播放量以下为一个等级

再数据通过matplotlib库进行可视化。得到下图。

labels = ['大于一千万','一千万到五百万','五百万到一百万','小于一百万'] #定义标签 # 中文乱码和坐标轴负号处理 # x,y轴刻度设置一致,保证饼图为圆形

从图中可以看出,在b站能上每周必看热门推荐的视频播放量大部分在五百万到一百万播放量,低于一百万播放量的视频很难上每周必看热门推荐,而一年中播放量达到于一千万的视频也很少。 让我们一起看看播放量排名前10的视频是那些好看的视频

再数据通过matplotlib库进行可视化。得到下图。

从图中可以看出哔哩哔哩拜年祭最受欢迎且播放量远远高于其它视频,说明b站2020年拜年祭节目进行的比较成功。

通过数据分析看那个作者的作品上热门次数最多,从而判断那个作者在2020年中最受欢迎。 对作者进行划分,统计出现的次数

再数据通过matplotlib库进行可视化。得到下图。

说明b站上每周热门次数最多的作者是凉风kaze,一年52周热门推荐,一共出现了48次,几乎每周热门都有他的视频出现。从数据来看,2020年最受欢迎的作者是凉风kaze。

对热门视频的点赞,投币,收藏平均比例进行分析

再数据通过matplotlib库进行可视化。得到下图。

2020年中点赞比例最高,达到大约9%。说明在b站看视频的人,平均10个人中才会有一个人点赞。而平均平均20个人中才会有一个人对视频进行投币。

对标题高频次进行提取,看那类标题比较受欢迎 首先对所有标题进行遍历,储存在字符串s中

标题中带有“朱一旦,半佛,罗翔”等作者名或“英雄联盟,原神”等游戏热门视频比较多。

此前,哔哩哔哩(下文简称为“B站”)CEO陈睿在发布2021年四季度财报的电话会议上,曾反复提及到B站的短视频产品storymode。他指出,“storymode在DAU的渗透上已经超过20%,而且更重要的一点是它在用户点赞上的比例达到了30%,这说明用户对于B站的storymode是接受的、甚至是喜欢的”。

基于陈睿当时的这番言论就有观点认为,接下来B站或将在短视频方面投入更多精力。而这一猜测,很快也体现在了B站APP的变化上。

随后在5月就有部分用户更新APP后发现,点击首页左上角的用户头像被替换为短视频内容界面,分为了“看视频”和“听视频”两个板块,并且与大多数短视频APP的单列信息流一致,同样也是通过上下滑动来切换内容。

B站早已不再只有“二次元”这一个标签

目前在国内市场,长视频网站以爱奇艺、优酷、腾讯视频,以及芒果TV为首,而短视频领域则有抖音和快手两大平台。但按照B站中的内容,则既拥有剧集、综艺和纪录片等时长较长的OGV内容,又有极为丰富的UGC、PGC、PUGC内容,并且由于时长不等,因此B站似乎也无法用内容时长来进行简单的定义。

正如陈睿此前在财报电话会议中所说的那样,“用户对于内容的消费选择是跟着品类和社区氛围走的,而不是说一定要选择一种表现形式,或者是一种视频的长短”。而这,也是他认为storymode会完全融入B站内容和社区的理由之一。

众所周知,B站起步依靠的是ACG内容,并且对于“二次元”这一相对小众的文化圈层而言,其一度甚至可以称为是“后花园”。但仅依靠相对纯粹的ACG内容与一两千万的月活,B站又该如何在激烈的市场竞争中存活下来呢?陈睿曾在相关采访中指出,“B站增长的动力基本来自于‘我希望B站更好地活下去’。小国寡民是开心,但你是世外桃源也会被坚船利炮干掉。”

不难发现,B站或许并不只是想成为“一方净土”,就像某书影音评分网站那样。但也保不齐会像此前的A岛一样,不知道什么时候一个大浪打来,就沉了。

在B站的逐步推进商业化的道路以及不断破圈过程中,也陆续引入了更多的泛娱乐化内容。据《2021 B站创作者生态报告》显示,生活区已成为创作者人数最多的分区,游戏区则紧随其后。这显然也已经意味着,“二次元”内容不再是B站的唯一标签。

事实上,在B站不断靠近主流文化的过程中,随更多内容板块的融入,也出现了诸多质量上乘的内容,例如影视混剪、二创等创意类视频,以及各种泛知识内容等等。而这些优质的UGC内容,也让外界广泛地来用B站对标海外市场的YouTube。

但是在营收结构上,YouTube与B站却又是截然不同的。前者绝大部分营收来自于广告营销体系,但根据B站的2021年财报显示,其主要业务包括游戏、增值服务(直播及大会员)、广告、电商及其他四个部分,来自增值服务、游戏、广告的占比则分别为35.78%、26.3%和23.34%,曾经占据营收主力的游戏已然“退居二线”。

以增速而言,B站的广告业务2021年收入为45.23亿元、同比增长145.5%,是2017年的近30倍。但相比于快手等短视频平台超过400亿元的广告收入,显然也有不小的差距。

其实,此前B站并非没有尝试过在新番前加贴片广告。早在2014年,B站就曾做过“在B站购买正版新番中,你能接受看多少秒的广告”的相关调查,结果显示只有17.83%的用户不接受观看广告。然而在2016年新番《Re:从零开始的世界》上线加入15秒的商业广告后,却很快引起了轩然大波。

此后陈睿再次承诺不再加入贴片广告,并表示“B站未来有可能会倒闭,但绝不会变质”。

“不变质”的承诺,或许也意味着B站只有向抖音、快手的竖屏信息流广告看齐了。并且对于storymode的商业化,陈睿曾指出,作为手机的一个竖屏展示方式,它的商业模式包括广告分发、中间插直播这两种形式,在行业里面也较为成熟,对于广告分发之类的效率较高。

但抛开平台对于盈亏平衡的努力,正如前文所述,B站如今的整体氛围其实是对视频质量有所要求的,那么当更多生活向、偏向于用手机拍摄的短视频内容出现,并与其他内容混在一起后,是否会影响到整体的内容质量呢。这或许也会与B站引以为傲的内容质量、良好的社区氛围背道而驰。所以将竖版短视频与横版中长视频用不同的版块明显区隔开来,可能也是个不错的选择。

再加上在如今短视频风靡的市场环境下,不做或许就会意味着在竞争中落后。而短视频板块的独立,也更像是B站内容消费场景的一种补全,以及对轻消费、碎片化的延伸。而storymode之于B站,或许就像是微视、视频号之于腾讯视频,随刻之于爱奇艺一样。

素人视频,已越来越多出现在B站首页

最近流行一句话,叫做“一夜醒来,我在B站火了”。实际上这是用来形容一种现象,即一个不经意随意拍摄的视频内容,莫名其妙地成为了平台中的热门内容,有时甚至只是一位百来粉的up主用以记录生活的视频。

这些视频往往制作较为粗糙、内容甚至比精细设置机位的Vlog、美食类视频还要日常,例如一些宿舍里的搞笑翻拍、做作业的片段等等。事实上,这类视频创作者其实也很少具备持续更新爆款的能力,以及稳定更新内容的动力,一次的“走红”也更倾向于“昙花一现”

因此比起“天降紫微星”,或许这更能体现B站目前的流量倾斜,而“有意”砸中部分素人up主的动机、助推这些视频内容的涌现,或许正是因为契合storymode这一短视频产品,说到底,毕竟B站从来都不缺创作者、也不缺各种类型的头部up主,缺少的是青睐短平快、分钟级视频的用户,对于B站短视频内容的关注。

从日前B站内测的短视频界面不难发现,更像是为此类内容打开了一个新的窗口,并将其定向展示给偏爱这类内容的用户。但问题或许并没有这么简单,毕竟storymode会将所有符合要求的内容纳入到信息流的推荐中,所以不可避免的会出现一些横屏内容,但其以竖屏的方式呈现就像将B站的内容搬运至抖音/快手一样,难以避免会出现“水土不服”与违和感,甚至会显得内容有些杂乱。

就像许多用户一直以“质量较高”来评判B站中的内容一样,当其从二次元走向泛娱乐、泛知识,再加上“生活秀”后,内容泛化的过程中也必然会导致内容质量的参差不齐。那么,又有多少用户会乐见其成这样的B站呢?

虽然在经过了13年的发展后,B站的确实现了一次又一次的破圈,也一直在追逐着每一代的年轻人,并跟随着年轻用户的喜好不断在进行改变。当“活下去”不再是问题后,B站的数次革新也表明其“想要活的更好”,但在部分用户都希望B站“永远不要长大”的情况下,或许平衡各类内容调性的冲突就将成为下一步必须要做的事情了。

我要回帖

更多关于 b站大数据怎么查询 的文章

 

随机推荐