用户画像项目失败的表面原因

▌原因一：混淆了过去和未来

问1：一个用户昨天买了苹果，前天买了苹果，大前天也买了苹果，他今天买不买苹果？

问2：一个用户买了酱油，鸡翅，可乐，请问他是否还需要买竹签去烧烤？

~~思考一秒钟~~，不用思考一秒钟，大家都知道，答案是：不一定，不一定，不一定。连续买苹果，有可能代表他喜爱吃苹果，也有可能已经买了很多了所以不买了。买酱油+鸡翅+可乐，可能是去烧烤，也可能是做可乐鸡翅。

过去的行为不等于未来的行为，未来的行为需要进行预测。无论预测的方法是基于业务逻辑的推理，还是基于算法模型的计算，都需要经过数据分析和试验验证。只有表现稳定的预测方法，才能被采纳。

然而做用户画像的时候，业务方经常混淆这两点。往往对着过去发生的行为贴一大堆标签，对未来预测毫无概念，在预测分析上半点投入没有。看用户画像报告，或者在CDP里设置推送规则的时候，想当然地认为：过去买了以后也买。最后预测不准，反而把锅甩给用户画像系统。结果自然悲剧。

▌原因二：混淆了行为和动机

问一个简单的问题：一个用户在过去30天内，有1天来我们家购买产品，请问该用户是不是我们的产品爱用者？如果有2天呢、3天呢、4天呢……如果有30天呢？30天里天天都来买，肯定是爱用者了吧！

答：不一定。30天里天天都来买，你可以管他叫“高频购买者”，因为购买频率确实是很高。但是是不是人家很爱用我们的产品，不一定，因为你并不知道他到底爱不爱用，甚至不知道他用了没用。

购买频次不能直接等同于用户喜爱。用户喜爱或者不喜爱，需要更多维度的数据进行分析，并且分析结果得有一定概率的稳定性，才能这么叫。

类似的，很多企业里，业务方和数据分析师，对待这种“爱用者”等等名词使用非常随意、粗糙，基本上都是用消费金额、登录频次等等，高了就算“喜欢”、“爱用”，低了就算“边缘”“尝试”。

做出来的结果，自然是毫无准确性可言。不用说，出了问题，比如推荐产品没有人买之类，又算在用户画像头上。

▌原因三：混淆了原因和结果

问：累计消费10000元以上的用户，都购买了5次以上，所以让用户购买5次，用户就会累计消费10000，对不对……

当然不对呀。然而业务方经常这么干！拿着过往消费高的用户行为，往消费低的身上套，认为只要消费低的模拟了某个数字，就能成为消费高的。还没其名曰：“魔法数字”。很有可能从源头上，消费高的和消费低的就是两类人，应该通过深入的分析搞清楚到底驱动行为的原因是什么。

从表面上看，用户画像失败的原因，在于：重数据，轻分析。过分投入精力细化已经发生的行为，贴了太多太多事实性标签。对预测投入力度不够，对因果关系分析不够，对用户需求洞察不够。最后判断全靠业务拍脑袋。

你问他为啥基于这几个标签推产品/活动，他答的都是：

l 我觉得他都买了那么多次，他这次肯定买

l 我觉得他买过相关产品，他这次肯定买

l 我觉得他买了A，怎么也得买B

看了用户画像以后拍脑袋，和看报表拍脑袋都是拍脑袋，没有本质区别，谢谢。基于过去的数据搞一堆标签，很容易；沉淀有预测力、有准确度的用户标签，很难。不但需要深度的数据分析和建模，更需要反复的，多轮的，对比性测试。不是一蹴而就。

所以在业务部门自以为很懂，数据部门喜气洋洋地宣布“打了三万个标签”的时候，祸根就已经埋下来了。

然而，同样是业务期望值太高+数据准备不足的场景，为啥用户画像类项目，比数据模型类项目还要容易扑街呢？

用户画像失败的深层原因

深层地看，因为数据建模的难度高，所以业务方对中间过程无法参与，只能对着结果品头论足。做建模的小哥们，只要自己不作死，不闭门造车，主动降低业务期望，是能够很大程度上避免问题的。所以建模项目失败，基本上是盲人骑瞎马的结果。

但用户画像项目正好相反：业务方以为自己很懂！做数据的小哥也以为自己很懂！几乎所有的业务方一提用户画像，都会说这句：“比如，我知道用户是24岁，女性，我就会推一个XX产品给她”大家都以为：我自己很懂，就差一个数了！快给我数。于是业务不停催着数据把过往数据做得再细、再细、再细，数据则在打标签路上一路狂奔。最重要的预测、分析、实验三件套没人搞。

当然，这种基于过往数据的标签，对有些部门是有用的——对客服、供应链、物流这种支撑部门有用。

比如客户接到一个客户投诉“为啥售后师傅还没上门啊！！！”如果没有打标签，客户得辗转好几个表，确认：客户买的是啥产品、是啥时候，产品机身号、啥时候约的师傅之类细节。光确认过程就把客户气个半死。有了标签，刷刷几下就能定位到问题，能极大提升客户体验。

但悲剧的是，这种有用性，只是让运营、营销、策划、设计等需要动脑子、做创意、想策略的部门更加自负而已。更加强了他们“我真的好厉害，就差一个数了！”的感觉。于是悲剧就源源不断了。

如果说建模是盲人骑瞎马的话，用户画像项目，就是骑着电动车搓着手机逆行闯红灯——电动车自以为自己是个车，骑电动车的自以为自己骑得666。

为了规避这种问题，陈老师经常用这招。当业务方张嘴“如果我知道24岁，女性，我会推A产品”的时候，直接从数据库里查出来最近一个月24岁女性到底有多少人买A，然后怼到业务方脸上：“不需要用户画像，我现在告诉你，购买率就是12%。你还上用户画像干啥，让你的小哥按规则跑数就好了呀”

这时候，但凡靠谱一点的业务方，都会立马清醒过来这里的问题，表示：这么简单的拼接不行，得基于事实标签多分析分析。这样项目后续就走的稳多了。

不过同学们慎用这招，你们的企业环境不见得适合这种硬怼风格哈，总之大家理解到问题关键即可。

问题的关键是：单纯的事实标签预测能力太差，洞察力太差。不足以满足运营、策划、销售、营销们排兵布阵的需求。大量数据+深入分析，才是解决问题之道。