调研 | 张扬
撰写 | 刘馥亮
2017年11月,拍拍贷成功在美股上市,目前市值在20亿美元左右。作为线上消费信贷的排头兵,拍拍贷对金融科技一直很重视。
拍拍贷2007年创立,成立伊始便注重数据积累。2008年上线反欺诈、信用评级和各类认证系统;2015年发布“魔镜”大数据风控系统,智慧风控体系初步成型。
拍拍贷智慧金融还在逐步探索和完善,对金融科技的追求都是立足于自身的业务实践。根据2018年一季报,拍拍贷累计服务了1,128万借款用户和58万投资人,2018年一季度实现放贷量123亿元,同比增长17.1%。
2018年1月,拍拍贷宣布成立智慧金融研究院,下设人工智能、区块链、金融云、大数据四大研究中心。依托拍拍贷的实践经验,研究院通过产学研的合作,探索前沿科技,服务政府、企业和第三方。
据拍拍贷首席风险官兼智慧金融研究院院长顾鸣介绍,拍拍贷逾期10天以内的贷后案件都可以交由机器人催收,从而大幅提升效率和体验;对于逾期10天以上的案件,则通过分析优秀经办人员的数据,利用NLP技术辅助经办人员提高回款率。
除了NLP技术,另一项热门新技术是知识图谱,目前主要用于贷前反欺诈。在这个环节,顾鸣认为有四个方面的条件会是壁垒:一是需要足够大量的数据;二是有强大的业务能力,识别出欺诈标签;三是具备很高的图数据库工程能力,四是图模型算法能力。
从贷后、风控往前延伸到获客,拍拍贷主要通过对渠道的严密监控和先进的风控系统尽可能提升客户转换率来降低获客成本。流量越来越贵,但行业竞争者也有所减少,两方面因素叠加,顾鸣相信拍拍贷的获客成本将继续维持在较低水平。
近期,爱分析专访拍拍贷首席风险官兼智慧金融研究院院长顾鸣,就拍拍贷在金融科技的实践和智慧金融研究院在各项新技术的探索进行了交流,节选部分内容如下。
NLP提升催收体验和效率
爱分析:在贷后催收部分,新技术在哪些方面能发挥作用?
顾鸣:贷后说到底,是一个客户该还钱的时候没有还钱,在时间比较短的时候,比如5-10天以内,更多的是一个提醒的作用。
这里面会有三个维度,一个是用户维度,就是什么样的人逾期了,他是什么学历,是第几次逾期,以前有没有遇过,以前跟经办的交互是什么情况。
第二个维度是我们催收人员,每个催收人员的特质是不一样的。举个简单例子,我们会让四川人去催四川的借款用户。
第三个维度,就是把前面两个结合起来,什么样的用户,用什么样的经办去催,该说什么样的话。比如有些人要在某一点施压,首先看用户对这个施压点是否合适,第二是看这个经办是不是能很好地把压力传递到,这两个结合起来,能够最终优化催收的体验。
我们是尽可能在控制用户投诉率的前提下提高回款率。虽说催收体验不会太好,但我们不想让这个体验太差。这里面会有一系列模型,会给进来的用户做各种各样的有区分度的模型,给催收经办人员做模型,然后基于这些做匹配。
爱分析:技术对于催收的改变,一个是体验,另一个是效率,拍拍贷是更重视前者?
顾鸣:都会有,比如说逾期十天以内的借款用户,我们有一半是用机器打电话催收的。
爱分析:机器的语音技术是自己做吗?
顾鸣:我们会跟别人一起合作。机器人会有交互,比如说支付宝可以还吗?明天可以还吗?后天发工资可以吗?这种他都能相应回复,不管是效率还是体验上都是非常大的提升。
首先机器人说的话都是算法决定的,因此可以保证体验。
效率就不用说了,本来是需要两个人,现在就只需要机器了。我们看到,十天以内逾期靠机器催的回款率,跟从头到尾都由人工催,几乎是差不多的。
爱分析:十天以内的逾期,如果只是一个提醒的作用,为什么不是所有案件都用机器去催呢?是因为能提前判断出来某些人肯定不是提醒一下就还,所以不用机器吗?
顾鸣:更多的是我们要做一些A-B test,其次是会有一些模型评分,评分出来就是会分类为容易还的,难度中等的,不容易还的。不容易还的就直接由人工去催收,前两类基本是由机器。
爱分析:逾期十天以上的案件,机器有可能在里面发挥一些作用吗?
顾鸣:在短期内不大会由机器来催。但是我们在做的是,用户说一句话,我这里能够自动生成怎么来回答,至少会有一些施压点来帮助经办跟用户做谈判,会做到这样。相当于是适时提醒催收人员应该怎么讲,这个可以用NLP处理历史数据来得到。
因为我们发现,催得好的经办根本没有投诉,而且回款率非常高,人跟人的区别很大,但是去问催得好的经办,首先他不一定跟你说,因为有绩效排名,第二就是他也说不清楚,所以只能通过他的录音来分析他的比较隐性的一些能力,把它系统化、数据化,使得每一个人都能跟催的最好的那个人一样。
爱分析:用什么指标去衡量催收人员的效率?
顾鸣:回款率,每个月会做一个预估,这个月会有多少进件量,基于这个安排人力,最终会看过去几个月的回款率大概是多少。
爱分析:催收有内催和外催,银行可能是三个月以上才会做外催,互联网消金是逾期一个月以上就做外催了吗?
顾鸣:其他家不是很清楚,我们会很后面才委外,因为外面的人没有办法控制用户体验。
爱分析:拍拍贷的催收人员从长期看是会下降?
顾鸣:长期来看是会,至少从效率上来说会提升,更多地是要看我们的成交量和进件量。如果成交量保持平稳不变的话,人力肯定要降下来,有几方面原因:一方面是因为征信的完善,包括互金协会,或者是说一些数据打通了,在这个行业里面会对老赖形成震慑力,所以说逾期率自然就会降下来,需要被催的应该会减少。
第二就是我们效率会提高,比如说我们某一天可能就不是50%,而是90%都是机器催,可能是逾期十天以上都由机器催,这个会有很大的帮助。
但总的来说,催收在现在这个阶段,大多数公司还是一个重人力的活。
爱分析:拍拍贷目前与互金协会有开始合作了吗?
顾鸣:我们已经上传一段时间了,上传一条数据,隔月可以查询十次,传的多就查的多。比如1月份上传一条数据,3月份就可以查十次。
爱分析:上传的数据字段有哪些要求?
顾鸣:字段要求由互金协会定,要求还是很细的,一个用户所有的还款记录都要上传。
爱分析:AI在催收里主要是语音相关的技术?除了这个以外,还有哪些AI技术在发挥作用?
顾鸣:最难的是语义理解。
语言相关的技术分成几个,一个是语言转文字,这个不是太难,有标准解决方案,百度、科大讯飞都能做。
第二个是文字转成语音,也不是核心的,但有做得好和不好之分。
当中很大的空间主要是NLU,NLU就是这段话说的是什么,我要把它理解了,然后我再想怎么回答。
爱分析:前两个技术是通用性的,NLP有很强的行业属性,这是核心壁垒吗?
顾鸣:我们肯定是希望能够做到通用,我们会和一些高校做NLP方面的教授深度合作。最简单的就是抓关键字,比如对方说支付宝,你就说支付宝该怎么还,实际上这根本就没有理解这句话,如果他说的是我没有支付宝怎么办,抓关键字的答案就完全错了。
爱分析:NLP需要各个行业专有的语料库,如何变成一个通用的、适用每一个场景的技术?
顾鸣:现在情况还是很难很难的,现在看到的相对通用的,比如苹果siri,小米音箱,都是一个个场景硬写出来的。
比如说问siri一个问题,可能是问天气的场景,可能是订餐的场景,它肯定是主要抓关键字,算出来你大概是在哪个场景里,后面的那些东西就完全是分开按场景来了,现在基本上都是这么做。
爱分析:对于拍拍贷来讲,现在做催收的NLP,如果去延伸,会往前端的获客延伸,还是跳出整个借贷领域去延伸?
顾鸣:对于新技术,一般会在我们的借贷或理财场景里面找一个问题,找出解决这个问题需要哪些技术,然后我们会想各种方法,或自研,或采购,或跟高校、跟外部合作,把技术做出来,把这个问题解决。
通过这个过程,会掌握一个解决方案、一个产品和一些核心技术,产品我们是可以对外输出的,比如催收有机器人帮忙催的服务,可以对外输出。另外一块是这些技术整合起来,是可以做很多其他事情的,如果有可能延伸,我们肯定不会只在金融里面。
爱分析:小额贷款逾期十天以内的可以用机器替代人,对于大额贷款,机器能做些什么?
顾鸣:挺难的,现在更多的是效率的提高。比如说逾期六个月以上的案件,回款率本来就不高,更重要的是知道哪些号码打过去是有人接的,这个可能是最大的有用的地方,他接了可能后面就好办多了。
知识图谱在反欺诈作用大
爱分析:知识图谱对反欺诈的改变有多大?
顾鸣:非常大,反欺诈最终目的是识别坏人,把坏人跟其他的未知人群的关系找出来,从而认定其他未知人群是否是坏人,这个跟信用模型是很不一样的,如果原来只能看一层的关系,现在可以看两层三层四层,效果就完全不一样了,很多团伙、中介实际上是要看很大规模的一张网,看很多层关系,关系之间还有强关系、弱关系。
我们实际上在业务中已经在用了,这里面有几个挑战。一个是数据量要很大;第二个是需要有标签;第三是需要有很强的工程能力,最后是需要很强的复杂网络算法技术。
在一般传统数据库里,数据量不大的话,可能勉勉强强可以看两层,但要同时看到三层五层,而且是大面积的、每个节点都算一遍的话,是搞不定的,所以是要有很强的工程能力。实际上真正的图数据库技术壁垒很高,如果用开源图数据库,数据量到千万级就崩掉。
爱分析:知识图谱在金融行业之外,现在会去考虑一些应用吗?
顾鸣:至少目前没有考虑太多,因为金融行业反欺诈已经很有意思了。而且现在外部说的非常多的做反欺诈的知识图谱,大多数我觉得都还不成熟,主要是因为一个数据量不够,还有一个是数据库工程能力不行。
爱分析:在风控的算法这块,现在有很多人提弱监督和半监督,这些在实践中,拍拍贷应用得多吗?
顾鸣:我们会做,比如说很多时候要看outlier,检测不寻常值,这些基本上都会用到,因为没有标签,都是弱监督做的。
爱分析:在信用评分这个模块,有新技术出现吗?
顾鸣:会有一些,打分的难度在我们这里是时效性要求非常高,用户进来之前,我是不认识的,而且可能就给我两分钟,两分钟之内不能告诉用户借不借,用户就走了,那这个流量的钱就浪费掉了,所以这个对工程上和算法上的挑战非常大。
对我们来说,模型需要平衡,就是不能太复杂,不能算太久,但是也要够准,因为这是一个风险业务。
获客成本低核心是渠道和转化率高
爱分析:拍拍贷的获客成本很低,消费金融获客的模型和传统电商之间的区别会在哪?在转化过程中,拍拍贷用到哪些新技术去提升转化效率?
顾鸣:流量本身是没有太多文章可以做,就是越来越贵。我们有两点,一个是渠道,我们会有非常严密的监控,然后是转化率,一直到后面的风险,我们都会看。
有的渠道投1万块钱获取100个用户,再投1万块钱只能拿到30个用户,所以不存在一个无限的方式这么做,这是一个最优化的问题。电商是用户进来了买没买,马上就有反馈,可以做出调整,但在我们这实际上要看很后面,甚至要看到这个人第二次有没有复借,所以说这个很难做,但我们会尽量往那个方向走。
拍拍贷获客成本比较低的主要原因是转化率比较高,我们有一套流程转化的系统,就是我们的风控系统。举例说如果这个人挑的是大额借5万块钱,我们跑完风控模型之后,觉得他借5万块不行,我可以让你借15,000,不行的话借5千,甚至1千,这是整个一套流程和系统,但对用户来说是几乎没有感知的。
因为借5万要的资料,跟借1万要的资料,都是不一样的,这是一个产品、业务、风控的合作,就是让用户在无感知的情况下把整个流程很顺地跑完,最终保证能够尽可能高的转化。
爱分析:获客成本从长期角度看,是会下降还是基本维持在这个水平?
顾鸣:总的来说,流量是越来越贵了,但是做这一行的跟去年比应该是少了很多。所以我觉得差不多会基本持平。
爱分析:除了转化率提高,营销未来还有哪些改进的方向?
顾鸣:我们跟一些线下、线上的场景会有合作,我觉得在线上做信贷业务的人会越来越多,我们看好这个大势,而且现在真的要借钱,基本上没人真去用信用卡了,信用卡往支付宝后面绑了那张卡而已,他用的可能就是支付宝了。
爱分析:区块链技术,现在在借贷领域的应用有多大价值?
顾鸣:长期看有一块是可以的,就是用户信息可以通过区块链的方式来做,这个难点不是在区块链技术,而是要把很多人说服,其他的暂时没有看到太多价值。