来源:挖数
作者:挖数
互联网行业经常会做用户调研,通过线下访谈和线上埋点等方式收集用户数据后,最终形成产品主流用户的性别、年龄、职业、喜好、城市等标签数据,这个过程称为“用户画像”。
如果蔡徐坤是一款互联网产品,他无疑十分的成功!
他的用户数达到2355万
这个用户数已经远远超过一些二线互联网app,比如世纪佳缘、珍爱网等。
他的日活跃用户数也很猛,平均每条微博有接近100万的点赞和评论,用户粘度极高。
商业价值也很高,虽然没有确切数据,但之前网上流传一份2017年明星收入排行榜,鹿晗位居第二位,年收入1亿8千万。
而目前蔡徐坤的百度指数已经远超鹿晗,按这个流量,他的收入很可能接近甚至已经超越当时的鹿晗。
为了对蔡徐坤进行用户画像,我爬取了他微博下边一万个用户的评论数据,经过统计分析,有以下的结论:
从性别上看,女粉占比拥有压倒性优势
另外1%的用户没有填写性别。
从年龄上看,粉丝占比最大的是1996-2002年出生的人,占整体人数54%。
而其中又以1998-2000年出生的最多,占整体人数32%。
蔡徐坤本人是1998年出生的,跟主流粉丝年龄相符。
从粉丝的地域分布上看,人数Top10省份如下:
蔡本人出生于浙江,籍贯是湖南,他的粉丝没有呈现这两个地方特别多的现象,记得之前分析过王俊凯和王源,他们的粉丝就以他们的出生地重庆居多。
粉丝人数Top10的大学是:
其中清北占到这部分填写大学的粉丝人数的3.6%。
不过这并不能得出蔡的粉都是高学历粉的结论,因为填写了大学的用户仅占总用户的1/10,而大学越牛逼填写的意愿越高,因此这里才会呈现出各种清北的假象,实际是幸存者偏差。
粉丝的职业一栏,有接近5%填写了蔡徐坤工作室或者蔡徐坤旗下这样的标签。
有23%的粉丝昵称里边包含有坤、葵或者kun,死忠粉的比例非常高。
(注:粉丝经常称呼蔡徐坤为蔡小葵)
在来源那里可以抓取到粉丝的手机型号,各大手机品牌的占比分别是
看来vivo找蔡徐坤代言还是有效果的,2018年中国手机市场份额上vivo在oppo和华为之后,而这里跑到了前面。
同时也看出华为和小米还是抓不住年轻人的心。
将粉丝的评论进行分词,词频最高的是以下几个词
把名词取出来,可以看到平常粉丝怎么称呼蔡徐坤,频次Top10的词是:
1蔡徐坤;2哥哥;3宝贝;4坤哥;5宝宝;6ikun;7cxk;8小猫咪;9崽;10帅哥
蔡徐坤最近真的很火,不仅在百度指数上碾压吴亦凡、朱一龙、鹿晗、TFboys等流量大咖
他起诉B站的新闻也在微博热榜和知乎热榜上连续霸榜好几天。
他到底是怎么火起来的呢?从百度指数上可以看出端倪。
在百度指数的关键词上输入“蔡徐坤”,时间范围选全部
可以看到他的搜索热度有4个节点。
第1个节点是他开始被人知道的时候,时间是2015年6月,当时他参加《星动亚洲》时被媒体挖出曾是TFboys原成员的往事,只是后来因学业繁忙选择退团。
第2个节点是他开始爆红的时候,时间是2018年2月,当时参加《偶像练习生》并拿到冠军。
第3个节点是潘长江在录制综艺节目《王牌对王牌》时,误将蔡徐坤认成了李易峰,结果蔡的粉丝瞬间攻陷了潘的微博,各大媒体纷纷报道。
第4个节点,也就是人气最巅峰时,是他打篮球的视频在B站被大量玩梗的时候!
梳理了一下他的用户触达过程,大概是这样的
后面2个群体人数比前面2个多很多,特别是拥有全网最强玩梗能力的B站用户,可以将蔡的梗病毒式传播到全网。
其实这是好事,毕竟触达了更多的用户,可惜蔡的做法是各种声明和律师函。
这样做只会让黑粉更黑,且多了一个新的梗可以玩
其实他大可以学学Skr吴自黑
这样除了再上一遍头条,粉丝更喜欢他之外,还可以让很多黑粉转路人,甚至转粉!
所以用户运营真的是一门艺术!
——————————————
往期精彩:
东哥上热搜的样子,真像蔡徐坤
数据整理—dplyr包(mutate系列)
内推 |阿里大文娱-数据分析(广州/北京)
R语言中文社区2018年终文章整理(作者篇)
R语言中文社区2018年终文章整理(类型篇)