本文来源于:2022第三届中小金融机构数智化转型优秀案例评选 ,作者:苏州银行

苏州银行:基于深度学习的智能OCR识别平台

2022-06-08 关键词:人工智能,全国性商业银行,数据智能应用3706

一、项目方案


苏州银行智能OCR识别平台基于光学字符识别技术和深度学习等技术手段,实现对各类财报、票据、证照的高精准识别,简化录入操作和办理流程,有效提升信息识别、转化、采集的效率,显著提升业务处理的自动化和智能化水平。


平台建立小步迭代的循环模式,扩大适用范围,增加适配及自动审核交易,优化OCR模型,拓展智能识别应用,完善丰富系统功能,挖掘系统效率和控险优势,实现运营集约化质的飞越。

在以集中运营业务开题破局、积累经验的基础上,充分利用OCR智能识别技术,逐步复制应用于全行多产品线的图像审核类业务,取代大量简单、重复性工作,实现强有力的服务输出和技术支撑,助力资料审核类业务的数字化转型。


充分应用智能识别、机器学习、数据挖掘等技术,简化交易环节,开辟触达客户全新途径。探索人工智能技术在客户身份识别、语音识别、票据识别、营业执照识别、智能输入、数据分析等方面的应用,多方促进业务办理移动化、简约化,构建全流程智能金融服务模式,推动金融服务向主动化、个性化、智慧化发展,为金融业转型升级持续赋能。


二、创新点


传统的OCR基于图像处理(二值化、连通域分析、投影分析等)和统计机器学习(Adaboost、SVM),过去20年间在印刷体和扫描文档上取得了不错的效果。传统的印刷体OCR解决方案整体流程如图1所示。


135.png

图1.传统的印刷体OCR解决方案


从输入图像到给出识别结果经历了图像预处理、文字行提取和文字行识别三个阶段。其中文字行提取的相关步骤(版面分析、行切分)会涉及大量的先验规则,而文字行识别主要基于传统的机器学习方法。随着移动设备的普及,对拍摄图像中的文字提取和识别成为主流需求,同时对场景中文字的识别需求越来越突出。


因此,相比于印刷体场景,拍照文字的识别将面临以下三方面挑战:

成像复杂。噪声、模糊、光线变化、形变。

文字复杂。字体、字号、色彩、磨损、笔画宽度任意、方向任意。

场景复杂。版面缺失、背景干扰。


对于上述挑战,传统的OCR解决方案存在着以下不足:


1.通过版面分析(连通域分析)和行切分(投影分析)来生成文本行,要求版面结构有较强的规则性且前背景可分性强(例如黑白文档图像、车牌),无法处理前背景复杂的随意文字(例如场景文字、菜单、广告文字等)。另外,二值化操作本身对图像成像条件和背景要求比较苛刻。


2.通过人工设计边缘方向特征(例如方向梯度直方图)来训练字符识别模型,在字体变化、模糊或背景干扰时,此类单一的特征的泛化能力迅速下降。


3.过度依赖于字符切分的结果,在字符扭曲、粘连、噪声干扰的情况下,切分的错误传播尤其突出。


为了改进以上不足,基于深度学习的OCR识别技术通过改进LSTM+CTC算法,在CNN一侧,通过在卷积层采取类似VGG网络的结构,减少CNN卷积核数量的同时增加卷积层深度,既保证精度又降低时耗,同时加入BatchNorm机制。在RNN一侧,针对LSTM有对语料和图像背景过拟合的倾向,在双向LSTM单元层实现Dropout。在训练阶段,针对CTCloss对初始化敏感和收敛速度慢的问题,采用样本由易到难、分阶段训练的策略。在测试阶段,针对字符拉伸导致识别率降低的问题,保持输入图像尺寸比例,根据卷积特征图的尺寸动态决定LSTM时序长度。


三、技术实现特点


基于深度学习的OCR定位与识别通过卷积神经网络CNN、循环神经网络RNN、长短期记忆网络LSTM等技术实现,可在灰度图像上实现文字区域的自动定位和整行文字的识别,解决了传统OCR技术中单字识别无法借助上下文来判断形似字的问题。此外,基于深度学习的OCR识别技术在低质量图片的容忍能力和识别准确率方面得到了显著的提升,可在印刷体低分辨率与模糊字符识别、印刷体复杂或者非均匀背景识别、印刷体多语言混合识别、印刷体艺术字体识别、手写小写数字识别、手写大写金额识别、手写通用文本识别等场景下实现高效的识别和分类。基于深度学习的智能OCR识别技术支持移动设备拍摄的图像识别,可适用于对焦不准、高噪声、低分辨率、强光影等复杂背景。


四、项目过程管理


为推进智能OCR识别平台项目落地,成立了智能OCR识别平台项目专项小组,以保障项目顺利建设实施。设立领导小组和工作小组,工作小组下设规划与创新、科技实施、业务拓展三个实施小组。由领导小组牵头,实施小组通过下述责任要求,积极推进项目工作。


1.落实推进项目具体实施内容。各小组应研究方案细则、积极推进落实,从业务层面着眼,使项目尽快落地生效。同时,各实施小组应做好事后跟踪管理工作。


2.定期汇报项目进展情况。各实施小组应每周填写项目进度表,向领导小组汇报项目进展情况,包括解决方案、落实情况、所需支持、收益分析和协调事项等。


3.积极落实后续跟踪及项目推广。各实施小组要深挖业务场景需求、创新金融产品,项目开发与建设中要全方位嵌入金融服务功能,不断完善、升级和优化初始方案。同时,应积极推进其标准化、模式化。


五、运营情况


基于CNN+LSTM+CTC深度学习模型的智能OCR平台,身份证识别准确率在99%以上,银行卡识别准确率在98%以上,达到金融级安全水平,且识别速度均低于1秒。已在手机、自助设备、网银和各类APP等20多个服务渠道进行应用,日请求交易量超过3000笔,提升了客户服务的智能化水平,大大降低了业务运营成本,同时保障了线上业务的安全高效。


六、项目成效


苏州银行在不断探索智能OCR技术与金融业务场景的有效融合的历程中,总结出一条具有精准营销、产品创新、反欺诈等数字化服务的特殊金融科技道路,持续以技术保障交易安全,以功能助推业务效率,以产品提升客户体验,助力苏州银行数字化转型。


1.业务处理效率更快:平台通过模拟人工审核操作,自动识别、比对审核要素,实现业务繁简分流。简单业务系统比对正确后直接完成授权,实现无人工干预的自动审核,审核时间达到毫秒级。复杂业务将系统比对结果以可视化标记方式推送给授权人员,提供辅助参考,助力审核提速。上线交易平均审核时间缩短至18秒,审核效率较传统人工审核提升25%。


2.风险控制能力更强:平台根据固定规则进行凭证智能识别和比对,实现了风险点从“人控”向“机控”的转变,有效防范纯人工操作时因疏漏等原因造成的录入错误、资料不全等操作风险,实现操作风险自动控制和刚性制约。项目上线后,质检差错率降低至万分之一,智能授权业务成功率达到99.47%。


3.客户服务水平更高:随着业务审核效率提升及系统自动审核分流,后台业务峰值处理能力大幅提高,缓解了业务高峰期因人员紧张造成的授权排队问题,平均排队时间由上线前的4秒缩短到1秒,有效提高了柜面业务整体处理效率和前台业务响应速度,减少了客户等待时间,带来更加便捷、高效的客户体验。


4.员工工作体验更优:智能OCR技术让机器具备了“人眼”识别能力,将业务审核人员从单一、重复的比对工作中解放出来,上传资料的完整性、系统录入与资料影像的一致性等主要审核要点由平台校验、把关,单笔业务的人工审核点由平均10个以上缩减到1~2个,有效减轻了审核人员工作负荷,缓解了审核心理压力。


七、经验总结


与传统OCR相比,基于深度学习的OCR识别技术在识别率方面有了大幅上升。但对于特定的应用场景(营业执照、银行卡等),条目准确率还有待提升。一方面需要融合基于深度学习的文字检测与传统版面分析技术,以进一步提升限制场景下的检测性能。另一方面需要丰富真实训练样本和语言模型,以提升文字识别准确率。

未来平台将在模型优化和能力输出方面持续深耕,探索更多业务场景,持续助力业务创新,打造“金融+科技”智慧服务模式。 


本网站案例,除特殊标明来源的,版权归金科创新社所有,未经许可不得转载,否则将视为侵权,对于不遵守此声明或者其他违法使用本文内容者,本网站依法保留追究权。另,本网站部分案例、观点文章来源于网络素材,如有侵权,请邮件联系 fenglei@fintechinchina.com 处理!
特别提示: 本网站免费为广大金融企业提供IT选型咨询服务,详情点击 【 需求提交 】

推荐阅读

更多

安徽农信:基于人工智能的滨湖数据中心基础设施能效优化

数据中心基础设施能耗巨大,数据中心节能能够带来显著的经济和社会效益。而在数据中心基础设施中,空调能耗又占到全部能耗的70%,本项目通过将人工智能应用到数据中心基础设施空调系统运行控制中,为安徽省联社乃至金融行业数据中心基础设施节能降耗探索一条智能化创新的道路。

2018第二届农村中小金融机构科技创新优秀案例评选 安徽农信 2022-06-08

云南红塔银行:“香叶智农”——一站式烟农服务平台

云南红塔银行结合国家烟草专卖局《关于建设现代化烟草经济体系推动烟草行业高质量发展的实施意见》和云南省《云南省数字烟草农业发展总体规划》的相关要求,结合人民银行普惠金融的相关政策规定,配合南省烟草专卖局(公司)搭建了“香叶智农——一站式烟农服务平台”,结合烤烟生产全流程,在平台上为种植主体、第三方供应、服务商等提供多样化的场景金融服务,提供安全、便捷、高效的线上烟农支付结算服务,助力乡村振兴。

2022年度城市金融服务优秀案例评选 云南红塔银行 2022-06-08

乌鲁木齐银行:个人消费贷款(雪莲E贷-精英贷)

该产品充分利用科技手段开展产品营销和服务,客户通过线上渠道申请贷款,客户经理通过移动办公线下补充资料,无需抵押、操作便捷,一经投产就获得了客户的热烈欢迎与认可,不仅提升了我行信贷业务办理效率,让更多的客户感受金融科技的力量,还促进了当地的经济发展。

2022年度城市金融服务优秀案例评选 乌鲁木齐银行 2022-06-08

九江银行:授信审批工具及调查报告智能化系统

“授信审批工具及调查报告智能化系统”是我行围绕信贷业务“贷前调查、贷中审查、贷后检查”三阶段,提升贷款三查报告(贷前调查报告、风险审查报告、贷后检查报告)“撰写、审查、修订”过程的智能性、专业性、效率性设计开发的系统工具,是我行“授信业务全流程线上化”工程主力系统之一。 该系统主要通过“报告模板创建、报告撰写、智慧审批、结构化数据搜集”四个功能模块,为信贷业务“营销尽调、审查审批、风险控制”人员提供业务支撑及决策管理服务。

2022年度城市金融服务优秀案例评选 九江银行 2022-06-08

日照银行:“黄海之链”供应链金融服务平台

黄海之链”平台于2021年8月18日上线,是日照银行推出的首个To B端金融服务门户网站。平台全面融合区块链、物联网、人工智能、大数据等智慧科技,将金融科技成果与实体经济场景有机结合,实现对产业链全链条、全周期、多维度金融服务需求覆盖,加速产业运行效率;通过数据要素全面运用,实现信息化、数字化和智慧管理;通过与商贸物流平台、交易市场、电子仓单系统等特色场景对接,打造“产业经济+金融服务”的数字化生态闭环,实现产业链交易全流程业务可视、数据可信、资产可控,有效解决上下游中小微企业融资难、融资贵问题。

2022第三届中小金融机构数智化转型优秀案例评选 日照银行 2022-06-08

贵阳银行:烟草e贷(烟商)

为进一步支持小微客户的稳定发展,精准支持小微客户稳定就业,提升小微客户金融服务质量和效率,贵阳银行通过引入省烟草局的烟草数据,采集多方数据信息进行比对,自建风控模型决策体系,2021年8月推出了针对烟草商户的自助贷款-“烟草e贷(烟商)”。“烟草e贷(烟商)”借助多方技术支持,实现贷款全流程线上化,大大降低小微企业融资成本,有效解决广大小微客户的融资难题,实现小微零售贷款业务“提速、增质、降价”。

2022年度城市金融服务优秀案例评选 贵阳银行 2022-06-08

选型库

金融行业全面的数智化创新解决方案,涵盖历届“鑫智奖”参评方案及选型库会员机构提交的金融行业解决方案

  • 全国性商业银行
  • 人工智能
  • 数据智能应用

微信
咨询

微信咨询

扫码添加金科小助手微信号
咨询案例和解决方案相关信息
或联系对应机构