“手把手教你读懂智慧金融系列3”:不只是支付 “扫一扫”还能反欺诈
引言
在人工智能的时代,自动化的普及不仅降低了日常作业中的繁琐程序,也让机器具备了“智能”的特征。随着移动设备快速迭代更新,以及移动互联网快速发展,光学字符识别(Optical Character Recognition; OCR)技术的使用场景也更为广泛。本文中,我们将就光学字符识别如何在智慧金融流程中扮演重要角色进行介绍。
作为人工智能时代普及度极高的一项技术,我们在搜索引擎上输入OCR便能搜索到许多免费的OCR软件。此外,当手机普遍配置有两个甚至三个摄像头时,人们通过拍照来记录信息或者提取信息的需求也快速涌现:如何通过人工智能提取信息,逐渐放弃效率低下的人工录入,转而借助OCR技术来解决身份识别环节中的关键问题。
到了上世纪70年代,各国开始就机器识别图像展开研究。在研究初期,机器仅能对0至9的数字进行识别,而识别的格式也仅限于印刷文字的邮政编码识别系统,对邮政编号的机械性识别也让OCR技术首次被应用在特定场景之中。
对OCR而言,主要目的在于将影像进行转换,在保存影像内图形的同时,将字符类资料转换成计算机文字。转换的作用在于减少影像信息储存量,而被识别出的文字则可重复使用及分析,同时也节省了手动输入信息的时间与人力。
传统OCR基础上的技术创新
- 图像背景非常复杂;
- 卡片种类多,卡号的位置和长度(16至19位)也是不固定的;
- 金融卡的压印字符同其他字符相比区别较大,生成样本因此存在一定难度。
在识别前,OCR需要先对文本进行全景识别,从哪里有字体、哪些字体需要识别入手。在识别并提取数据字体后,再对字体进行切割,并通过卷积运算(Convolution)展开识别。具体识别流程如下:
1. 图像获取:目前主要采用视频预览方式,对视频进行抽帧,取一帧清晰的彩色图像。也就是手机相机扫描界面在实时取图,目前主要是通过检测边框来判断银行卡是否已经放到指定框内,借以确保能提取出质量较好的图片。
2. 预处理:在完成图片提取后,随即就各项成像噪声进行排除(这里的噪声是指在拍照过程中出现的非均匀光照、局部失焦等),通过灰度处理和二值化,最终只留下黑色和白色。随后再定位到所需识别、提取的卡号部分。
3. 字符切分:将银行卡号单个数字进行切分(切分是OCR技术中一大难点)。
4. 字库比对识别:这一步是将切分完成后的单数字与字库中的数值模版进行比对,取置信度最高值。
结束语
对习惯通过“扫一扫”进行支付的你来说,赶紧找机会玩玩这项内建在各家智慧金融平台上的黑科技吧~