1. 首页
  2. 科技部落

“手把手教你读懂智慧金融系列3”:不只是支付 “扫一扫”还能反欺诈

引言

在人工智能的时代,自动化的普及不仅降低了日常作业中的繁琐程序,也让机器具备了“智能”的特征。随着移动设备快速迭代更新,以及移动互联网快速发展,光学字符识别(Optical Character Recognition; OCR)技术的使用场景也更为广泛。本文中,我们将就光学字符识别如何在智慧金融流程中扮演重要角色进行介绍。

作为人工智能时代普及度极高的一项技术,我们在搜索引擎上输入OCR便能搜索到许多免费的OCR软件。此外,当手机普遍配置有两个甚至三个摄像头时,人们通过拍照来记录信息或者提取信息的需求也快速涌现:如何通过人工智能提取信息,逐渐放弃效率低下的人工录入,转而借助OCR技术来解决身份识别环节中的关键问题。

“手把手教你读懂智慧金融系列3”:不只是支付 “扫一扫”还能反欺诈
早在1929年,奥地利科学家Gustav Tausheck(1899-1945)便提出了OCR的概念。通过设计一套以打孔机原理为基础的计算系统,机器初步具备图像识别功能(见下图)。Tausheck设计的机械型阅读识别机虽然只具有辅助性功能,却意外开启了机器对图像识别领域的探索。
“手把手教你读懂智慧金融系列3”:不只是支付 “扫一扫”还能反欺诈

到了上世纪70年代,各国开始就机器识别图像展开研究。在研究初期,机器仅能对0至9的数字进行识别,而识别的格式也仅限于印刷文字的邮政编码识别系统,对邮政编号的机械性识别也让OCR技术首次被应用在特定场景之中。

直到90年代以后,平台式扫描技术的广泛使用,OCR的技术才从以往机械化的识别平台转移至信息化的识别平台。而以深度学习的崛起为时间分割点,近五年来,业界开始在传统的OCR识别框架下引进一种新的方法来突破原有技术瓶颈(文字定位、二值化和文字分割等)。再则,应用场景的涌现更开启了对OCR技术的研发升级,对身份证、银行卡、门牌、票据甚至手写内容的识别都加快了OCR技术的应用开发。目前,市面上流通的OCR软件种类很多,有兴趣的读者只要在百度上输入OCR就能轻松找到各种功能不一的OCR软件。随着OCR技术的逐步成熟,OCR软件识别正确率已能达到了99%以上;对于手写体汉字识别的研究也取得了很大进展,正确识别率已达到了70%以上。

对OCR而言,主要目的在于将影像进行转换,在保存影像内图形的同时,将字符类资料转换成计算机文字。转换的作用在于减少影像信息储存量,而被识别出的文字则可重复使用及分析,同时也节省了手动输入信息的时间与人力。

“手把手教你读懂智慧金融系列3”:不只是支付 “扫一扫”还能反欺诈

就OCR的识别程序来说,从影像到结果输出,须经过影像输入、影像前处理、文字特征抽取、比对识别、最后经人工校正将认错的文字更正,将结果输出。在上述自动化流程中,通过对身份证件以及银行卡数据的识别,不仅能降低手动输入出错的可能性,搭配人脸识别的功能也能大幅提升反欺诈的有效性。在智慧金融平台上,OCR成为了不可或缺的技术环节。接下来,我们将从身份识别的应用出发,针对OCR在身份证件、银行卡识别功能进行介绍,帮助读者了解智慧金融平台上这项通过“扫一扫”验明正身的黑科技。

传统OCR基础上的技术创新
与传统的OCR相比,用于身份证件、银行卡识别的OCR技术有很大的不同,主要出于以下几个原因:

  • 图像背景非常复杂;
  • 卡片种类多,卡号的位置和长度(16至19位)也是不固定的;
  • 金融卡的压印字符同其他字符相比区别较大,生成样本因此存在一定难度。

在识别前,OCR需要先对文本进行全景识别,从哪里有字体、哪些字体需要识别入手。在识别并提取数据字体后,再对字体进行切割,并通过卷积运算(Convolution)展开识别。具体识别流程如下:

1. 图像获取:目前主要采用视频预览方式,对视频进行抽帧,取一帧清晰的彩色图像。也就是手机相机扫描界面在实时取图,目前主要是通过检测边框来判断银行卡是否已经放到指定框内,借以确保能提取出质量较好的图片。

2. 预处理:在完成图片提取后,随即就各项成像噪声进行排除(这里的噪声是指在拍照过程中出现的非均匀光照、局部失焦等),通过灰度处理和二值化,最终只留下黑色和白色。随后再定位到所需识别、提取的卡号部分。

3. 字符切分:将银行卡号单个数字进行切分(切分是OCR技术中一大难点)。

4. 字库比对识别:这一步是将切分完成后的单数字与字库中的数值模版进行比对,取置信度最高值。

在我们早先发布的“只需扫一扫 你也能披上智慧金融的反欺诈铠甲”一文中,我们就对OCR的运作原理做了详尽介绍,在此就不展开了。随着互联网金融的快速普及,OCR技术已成为互联网金融中“验明正身”的最可靠解决方案之一。“手把手教你读懂智慧金融系列3”:不只是支付 “扫一扫”还能反欺诈

从各项参数来看,OCR对于银行卡识别速度小于0.5秒/张,对于身份证的识别则小于1秒/张;而在识别率方面,身份证识别率已达到99.8%,银行卡识别率也已达到99.5%上。极高的识别能力并支持包括Android、iOS、Windows、Linux等作业系统,OCR已经内化为智慧金融解决方案中不可或缺的重要环节。“手把手教你读懂智慧金融系列3”:不只是支付 “扫一扫”还能反欺诈

结束语

对习惯通过“扫一扫”进行支付的你来说,赶紧找机会玩玩这项内建在各家智慧金融平台上的黑科技吧~