11月13日,以“大数据与智能时代”为主题的第二届万物互联创新大会在杭州召开。当日下午,连续创业者、“51信用卡管家”的创始人兼CEO孙海涛为大会带来了题为《信用卡账单背后的大数据》的主题分享。
孙海涛表示,当前大数据、人工智能和深度学习等词被炒的很热,除了移动互联网领域,几乎各行各业都在往这个方向靠。但作为一个做企业的人,越是这样就越应该保持冷静。
与大部分人一味追着数据本身做文章不同,孙海涛认为应该让数据成为业务的反作用力。他说:“对于大数据这件事,从我们51信用卡这四年的业务成长来看,我的总结是,我们更多的是让产品去驱动数据,数据只是作为一个过程,反过来又驱动了业务。”
以下是孙海涛演讲内容,雷锋网(公众号:雷锋网)作了不改变原意的编辑:
从无到有,仅仅是一个账单管理工具
51信用卡APP是我在四年以前创立的,我前面已经创办过三家公司,也精疲力尽,有了4张信用卡。有一天我在阅读邮箱里的账单,那些账单我平时都不看的,有一天我打开很认真地仔细看了。账单上虽然格式都一样,但信息非常详实,告诉你每张卡什么尾号,额度多少,还款日哪天,本期消费账单多少,以及这个月消费记录,在哪里吃饭,在哪里开房,付了上个月多少利息,等等。
我突然间发现这些数据怎么这么浪费,我平时都不看,我的直觉告诉我应该很有用。从那个时候起,我就决定要做一个APP,让我一键把邮箱和APP绑定,就能够把每天要还多少钱,消费额到底怎么回事等所有数据整理好。我最初出发点就是想把这个事情做成。
在51信用卡APP上线之后,前面两三年时间就是一个工具,帮你管好信用卡账单。今天来看,我们有海量的数据,譬如说每天信用卡的消费记录就有1千万笔的增量,然后还有几万笔征信报告,还有几万笔公积金。当这些数据增长的时候,很多人都在想,用户为什么要给你这么多数据?他不怕数据不安全吗?其实我在想:
用户才不会给我数据,他是想自己看这个数据。这个产品之所以能够驱动数据,就是因为能帮用户提供一种服务。
在51信用卡管家做了三四年时间,积累了大量数据时,我们在业务上面仍然没有大的突破。除了我们之前尝试跟银行、信用卡中心合作,搜索在APP里哪个人已经有两张、三张的信用卡,然后就再推广一下让他有第四张。他开卡了,我们就能赚50块钱的佣金,说白了这个其实是广告业务。当这个业务推广之后,我们才对数据有了一点点的感觉,但那时候我们没有更多精力,因为营业收入才刚够生存。
寻找突破:从数据分析开始
在经营工具和数据的过程中,我们是怎么样找到突破口和驱动力呢,正是来自于对业务数据的一种分析。
在中国信用卡多卡用户的数据统计里,我们是遥遥领先的。我们发现其中大概有8成是男性用户,而且他们开始透支,开始习惯于使用银行的资金,并且开始分期,黏性很大。这一点通过更深入地思考就能理解:你刚毕业有一张卡,两张卡,到顶了,而且额度也很小。到后面随着你的发展,经济情况变好,你欲望的增速会超过消费地增速,总希望有更多的额度。
我们发现:这类人群分布更多是在沿海地区,信用卡比较多的地方。后来分析这些人群的构成——发现比较多的聚焦在一些管理层的高级白领,和个体经营者,这个在中国是特别多的,他们拥有大量的微店、网店,你可能不相信,但其实这个人群在中国非常庞大。我们信用卡管家APP,在这个人群中有非常高的影响力。
随后我们做了一个人均消费比较,发现平均数很高。我们最早统计数据时,投资人都觉得肯定是搞错了。因为我们自己每个月消费都没有两万块钱,结果统计出来发现平均值有四万块,这肯定搞错了。但后来我们发现在人群中,因为基数比较大,有2%、5%的用户消费都是十万以上的,相当于整个平均数被拉高了。
那么怎么样去突破,读懂了用户数据又能做什么事情,这是最关键的一点。我们刚才讲的都是在黑暗中摸索,就像上一位嘉宾讲的,其实很迷茫,城市信用卡消费数据整理出消费的类型,告诉你们家上个月吃花了多少钱,宠物花了多少钱,包括淘宝上消费记录都能很好的整理对应起来,我们做了大量的工作,但究竟怎么把这些结论有效利用起来,谁也不知道。
后来我们尝试把你的消费偏好做出来,比如你喜欢住什么类型的酒店,喜欢吃什么饭店,把所有银行信用卡中心搞的5折美食日之类的信息,都把它整理出来推动给我们认为很精准的用户,但结果发现转化率都非常低。
发力信贷业务:征信与风控为落脚点
一直到一年半之前我们做了一个重要的尝试,基于一站式数据的启发。我们发现后台每个月在信用卡消费账单里产生了将近20亿的数据,按银行利率是15%-18%年化水平计算,意味着这个人群背后在银行所欠的钱,升息的钱,不是每个月账单按时还的钱,整个数额有大概2千多亿,这意味着借贷市场可能存在大量的缺口。
当我们发现这一点时觉得很夸张,也许是机会来临。我们找到业务的突破方向之后,就把前面走的那些弯路很快放弃了,尝试找金融机构,最早是宜信。我们就做了一款基于信用卡在线数据信贷的产品,后来我们花了半年时间又专门组建了一个风控团队,今年整个业务的增长非常快。
在这款产品上市时,我们大概创造了20亿的信贷业务,现在每个月的增长规模都在10亿。它本质上是基于银行资金和个人资金,为信用卡多卡人群提供在线的风险评估和现金支持。
目前我们给的价格还是比较高的,比信用卡价格高出5-10个点。在我们公司所产生的营业收入超过1个亿,我们相当于是中国第一个在线大金额的给信用卡信贷用户提供现金分期的。那时候花呗都没有,仅仅有淘宝卖家阿里小贷服务,我们更多是向消费者提供大金额的现金分期业务。
这个业务目前在中国,我觉得是属于井喷式的增长,由于过去信贷服务是被压抑的。这里每个用户创造的UP值有2千或3千块钱,因为他借了一年或者两年时间。这个也是目前在互联网上大规模UP值最高的人群,金融服务可以把UP值的几百块钱,提高到现在上千块钱。
我们用这些数据为什么能够把信贷服务做好,除了根据互联网的方式给出更高的价格,cover可能产生更高的风险。其实我们参考和分析了大量的账单数据,来判断用户真实的情况,还款的能力,还款的意愿等。
在互联网上借钱最怕的是,对方可能会利用一些假的数据。所以我们最早的时候,做创业的时候已经利用了信用卡的账单实名制,利用了淘宝交易数据里的地址、收货人姓名,还有运营商,你手机运营商的平台,有你实名开户的数据。我们对多方数据源进行了交叉验证,这就能确认你是不是本人,还是不法分子。
此外,技术更多就要评估用户的画像,也就是人口属性,兴趣爱好,社交范围等。其实所有属性里,我们目前的应用级别还是非常浅的,因为必经只有一年的时间。不过它的空间非常大,目前我能讲出的例子,在我们APP里应用比较多的,就是我们的征信判断。如果这个用户在网购记录里有大量购买彩票,或者是说游戏的点卡,那这样的用户的投机性是非常强的。特别是收入比较低的用户,对于这样的消费,他投入过大,那么说明这个用户的风险也极大,就很可能是偏赌博性的借款。
其次,就是在APP里所提供的公积金查询服务,我们发现这个数据还是有突破性的。从同一个用户提交的公积金交易记录来看,虽然是第三方公积金平台所提供的,这里基本上可以看到一个人职业的稳定性,收入的真实性。因为公积金只会交多,不会交低,你让用户看一个收入证明,他肯定往死里开,这是最独到的数据应用。
此外我们还有很多其他的突破,包括在账单上面能计算用户的滞纳金,算出用户历史上欠钱的天数严不严重。比如我们和个推合作,可以知道一个用户手机里装了多少个借贷软件。如果装了很多,说明这个用户经常借钱,最近资金紧张。他如果打开美食、看电影,生活化APP很多,可能这个用户的稳定性就会非常强,很热爱生活。诸如此类的,这些都是我们在信贷领域可以让人大开脑洞的,有很多意想不到的数据源。这些数据特征今天都可以被用来帮助做信用判断。
过去提供信贷服务的是传统金融机构,银行。但其实他们在数据上的使用率是极其低的。假设我在招商银行办信用卡,我可能已经有一张借记卡,我在办信用卡的时候,银行让我把每月的流水数据打印出来,盖上章子,还要传真到招商银行信用卡中心。
其实我做了很傻的事情,通知招商银行私人银行的助理,他打印出来盖好章送到我公司。我在公司里传真到招商银行信用卡中心,这就反映出:虽然是同一家公司,但信用卡中心和银行的数据是不通的,这就是过去在互联网上没有做成金融的原因。
与大数据结合,资产信贷业将井喷
数据源的涌现和数据技术的挖掘,让新的业务框架快速增长。随着业务的提高,我们目前的定价也比较高,累计提供信贷客户80亿了,可见在规模上做信贷服务还是非常有前景。
我们目前也是在构建自己的金融生态,围绕信用卡上下游和网贷的产业。目前APP里面有流量开放给合作伙伴,因为金融业务一家消化不完,每家数据偏好也不一样。资产也开放了,每天我们提供的5千万信贷额度里,有两千万可能是银行提供的,接下来我们会把所积累的数据,对用户的画像和风控也陆续开放给合作伙伴。
除了在上个月拿到很多钱,接下来会成立51成长基金。最近公司也在根据业务背景做一次认真的分析,未来可能会对两个行业非常看好:一个是新兴网贷,因为人群特别广,人群分类也特别细分,包括按城市、收入、蓝领、白领、额度、短期和长期的等等。做资产的信贷业务,我觉得在接下来的两三年将会爆增。今年51已经井喷了,这是我们一个重点领域。
第二是数据,用户数据的大量积累。前几天我看到一家公司做用户人力资源简历的数据,特别牛逼。诸如此类的数据业务是我们的第二个大版块,它能够有效在互联网上提高信贷业务的效率,帮助信贷服务商更快识别出更多的风险和欺诈,实现快速安全的业务增长,这是我们的一个计划。
最后,与大家分享我们的核心愿景:“让有信用的人过得更好”,谢谢。
本文作者:恒亮
本文转自雷锋网禁止二次转载,原文链接