B站2000万用户分析
in 数据分析技术 with 4,284 views and 5 comments

B站2000万用户分析

in 数据分析技术 with 5 comments

前言

前两天闲来无事,花了四五天的时间从B站(http://bilibili.com)抓取了其 2000万 全部用户。

代码挂在了Github下:https://github.com/airingursb/bilibili-user,大家可以自己下载爬取。

B站介绍

bilibili弹幕视频网现为国内最大的年轻人潮流文化娱乐社区,该网站于2009年6月26日创建,又称“B站”。

我自己是2013年2月14日注册的用户,隐约记得在2013年暑假之前B站都是限制注册,只有在特殊的节假日才开放注册,后来是验证码注册与答题成为正式会员。

接下来,展示一下B站的用户数据情况。(仅仅做了初步的统计)

用户情况

B站是一个ACG动漫文化很浓厚的场所,与A站(AcFun)共同撑起了中国动漫的一片天。

所以用户嘛……

不说了,简单看看我随便截的图吧,用户签名字段。

用户签名
用户签名
用户签名
用户签名
用户签名
用户签名
用户签名

用户数据初步分析

基本概况

性别

性别统计

这个男女比例是有点出乎个人预料的,接近1:1。其实之前初步抓了2013年暑假之前的数据,男女比例当时还在3:1这样。

性别统计

性别统计

可见明确性别的群体还是比较少的,只占了总数据的 15% 左右。

更多的分析日后再做。

年龄

具体数据不放了,简单看一下统计结果吧。

年龄统计

主要用户分布在93-00年的用户(大概16-23周岁),其中97年(19岁)用户占了绝对的主导地位。

事实证明,B站小学生并不多,而是高中生、大学生比较多。

年龄统计

年龄统计

90后用户占主体,但是用户年龄段正在不断后移。毕竟,是一个年轻人的网站。

地区

地区统计

主要用户分布在:广东、江苏、北京、上海、浙江等地区。都是一些经济很发达的沿海地区。

地区统计

地区统计

注册时间

注册时间统计

由于16年才过去2个多月,所以少一点,不过可以预见其发展必将远超2015年。自2009年开站以来,每年用户几乎都是以指数级增长。

注册时间统计

注册时间统计

活跃度统计

由于B站有经验等级规则,用户的活跃度可以依据等级判断。

等级为0,就是只注册未登陆过的用户。等级为1或2,为非活跃用户。等级为3以上,就是活跃用户。其中等级为5或6的,为投稿数特别特别多、视频特别火爆的用户,为B站的主干用户(约5000人)。

等级统计

等级统计

关于留存率等数据,日后再统计分析。

粉丝统计

粉丝统计

哎- -,我也是有2个粉丝的人!

粉丝统计

以下是B站TOP20用户。很多人都非常的眼熟哈。

粉丝统计


以上,就是对B站2000万用户的初步统计。日后会有更加深入的分析。

Responses
  1. Hi, 您好 , 我是www.codedata.cn 的个人站长, 请问可以连添加友链吗

    Reply
    1. @codedata

      额,已经添加过了…

      Reply
  2. sigma

    哥 数据能分享下吗 老数据也行

    Reply
  3. 博主您好,我想问下你这些可视化是用什么做的?

    Reply
    1. @大圣

      用的这个 https://infogram.com

      Reply