本文来源于:“鑫智奖”第四届金融数据智能优秀解决方案评选 ,作者:易道博识
易道博识:赛博学习平台解决方案
2022-03-09 关键词:数据治理,数据平台
2550
一、解决方案简介
智能结构化平台(简称平台)是赛博学习平台的一个子平台,能够基于深度学习的自然语言处理技术,自动从非结构化数字信息中抽取目标数据。模板定制过程简单、直观,无需硬编码,全程可视化操作。只要将需要提取的信息选出加入训练即可,一个版式5-10分钟可完成,并且根据答案进行模板自行调整,不断提升结构化水平。解决银行90%以上的固定格式业务凭证 OCR 识别结构化自主定制和训练,为银行已搭建的识别平台提供结构化方法,实现有效降低信息提取和录入的人力成本,帮助银行专注于上层业务重塑。
二、应用场景痛点简介
随着银行业务的发展,越来越多的业务线中涉及的纸质凭证影像需要用到OCR自动处理,来进一步提升业务办理的效率。
这些凭证影像按照格式可以分为两类:一类是固定格式的凭证(户口本、港澳台身份证、外国人永久居留证等);一类是非固定格式的凭证(银行流水等)。其中固定格式业务类凭证占银行90%以上,这些凭证存在以下特点:
种类多:银行在各个业务受理过程中涉及到的凭证都在百种以上,甚至多达几百种;
更新频繁:不少凭证会随着业务需求或者监管制度的变化而调整格式。

基于以上特点,对凭证的OCR识别工作就特别复杂。目前存在两种解决方案:
一种是委托技术提供商做定制开发:按照凭证种类委托OCR厂商进行定制开发,逐一支持各类凭证;
另一种,是基于OCR底层能力进行自研:基于OCR厂商提供的底层识别能力(文字、表格、手写体、印章等识别能力),自己投入研发力量从代码层面开发针对各类票据的OCR功能。

不过,以上两种方式均存在一些缺陷:*****种方案,持续投入高,需要厂商就每一种凭证进行定制化开发。第二种方案,成本投入更高,不仅需要采购厂商底层能力,而且需要OCR专家团队的支持。因此,银行迫切需要一个能够减少后续投入,自主可控的解决方案。
三、解决方案亮点介绍
银行在各个业务受理过程中涉及到的凭证都在百种以上,甚至多达几百种。且更新频繁,不少凭证会随着业务需求或者监管制度的变化而调整格式。
建设智能结构化平台可为银行带来以下几点收益:
1、持续投入成本大幅减少,银行新增票据
2、新增凭证的开发投产时间大大缩减,以往银行新增项目的从采购、厂商入场开发、到上线,整个流程需要2个月以上。上线智能结构化平台后,5-10分钟完成新增凭证模板定制,当天就可完成模型的投产使用。
银行完全自主可控,使用平台开发的OCR凭证模型可以形成自有知识产权。
OCR智能识别平台上线后,陆续有多个业务系统与OCR智能识别平台对接,各系统应用OCR前后对比如下:
1、事后监督系统
集成OCR智能识别之前,事后监督共10人平均每天录入9138次数据,耗时长、效率低、出错率高;在集成OCR智能识别之后,日均降低92.7%的人工录入量,目前每天只需2人即可完成数据录入及校对工作,极大节省业务录入工作量,提高业务处理的效率,降低了人工成本及操作风险。
2、财务管理系统
在集成OCR之前,业务人员日均录入量4203次数据,工作量大、人工成本高、体验差;在集成OCR智能识别之后,只需要将电子凭证上传至OCR系统,OCR可直接将电子化信息转换为可编辑数据并返回至业务系统,日均降低99%的人工录入量,节省了录入工作量,提高业务处理的效率,降低了人工成本及操作风险;
3、供应链系统
在集成OCR之前,客户需要根据发票内容进行逐一录入,平均每月需要人工录入7120次数据;在集成OCR智能识别之后,月均降低99.6%的人工录入量,为客户节省大量时间,客户体验得到显著提升;
4、互联网金融服务平台
目前通过互联网金融服务平台开立三类账户时,客户日均录入3301次数据;在集成OCR智能识别之后,实现了录入信息的自动化,完全替代人工录入,提高了信息录入效率,并节省了客户的时间成本;
5、信用卡网申平台
目前客户平均每天通过信用卡网申平台录入7192次数据;在集成OCR智能识别之后,可*****时间识别出客户证件信息,实现自动化录入的效果,完全替代人工录入,极大改善客户体验。

在集成智能结构化平台之前,很多业务系统需要多人录入数据,耗时长、效率低、出错率高;在应用平台之后,只需要将电子凭证上传至平台,平台可直接将电子化信息转换为可编辑数据并返回至业务系统,实现了录入信息的自动化,几乎完全替代人工录入,极大改善客户体验。
而且,平台通过对银行凭证的定制化训练,实现数据结构化目的,生成的模型仍在原OCR平台运行,架构保持不变。流程及步骤如下:

智能结构化平台流程架构图
在智能结构化平台中,智能模板管理系统的主要功能是快速生成目标版式的结构化模板,为识别平台提供结构化方法,并在本系统中存储和管理这些模板。通过智能模板系统的可视化界面,可以定义模板的输出字段,并进行必要的图像标注工作,从而为智能模板算法提供元数据。
步骤一:模块配置界面
模块配置界面可以增加/删除模块,也能为模块增加/删除版式。

一个模型下可以定义任意数量的模块,单个模块下又可以包含数个版式。需要特别说明的是,模型的概念相当于一个统一的接口,通过固定的接口满足自己的识别需求。
模块的概念相当于样本的类别,如身份证、军官证、结婚证、完税证明、营业执照等。版式的概念相当于样本类别下不同的样式,如营业执照下有横版格式和竖版格式。
步骤二:标注页面
每一个版式都需要上传样本并标注,将需要提取的数据标记出来。

步骤三:模型构建-生成模型界面
所有样本标注完成后,便可以生成模型。

步骤四:模型的部署和测试界面
模型构建完成后,可以部署该模型到识别平台,并测试模型的效果。

智能结构化平台用于训练产生针对各种不同版式的OCR识别引擎,满足银行自动化、专业化、模块化、高性能等业务及技术要求,支持身份证、银行卡等固定版式的结构化,营业执照等多版式的结构化,银行回单、长途客运票等非固定版式的结构化,支持银行单据分类+识别等分类结构化。

目前平台已支持身份证、银行卡、增值税发票、营业执照、出租车票、火车票、事后监督类(业务凭证、现金交款单、放款收回凭证、借款收据、通用记账凭证等185种凭证)、机票行程单、定额发票的OCR识别;同时,也将支持转账支票、财政专用缴款单、电汇凭证、税收通用缴款书、进账单、特种转账传票、提回业务补录单的识别。
四、金融行业客户名单
中国银行、招商银行等。
五、客户评价
智能结构化平台可实现行内新增业务凭证的OCR识别自主可控,从新增一个凭证模板定制、自训练到测试上线,完全可由行内人员自主完成,无需厂商干预。解决了行内新增板式OCR识别需要重新采购或厂商定制开发的工作和费用投入问题。
智能结构化平台可实现行内90%以上的固定版式业务凭证的自主定制,构建的OCR凭证模型识别率可达98%以。系统成熟且实施可行性高,系统开发完成后,将为各业务系统提供支撑服务,实现降低人工成本、提高工作效率的目标。
本网站案例,除特殊标明来源的,版权归金科创新社所有,未经许可不得转载,否则将视为侵权,对于不遵守此声明或者其他违法使用本文内容者,本网站依法保留追究权。另,本网站部分案例、观点文章来源于网络素材,如有侵权,请邮件联系 fenglei@fintechinchina.com 处理!
特别提示: 本网站免费为广大金融企业提供IT选型咨询服务,详情点击 【 需求提交 】。
推荐阅读
更多
中国邮政储蓄银行 陈震宇:聚势赋能,推进大数据能力高质量发展
数据作为新资源、新资产,在数字化建设浪潮中起着核心关键作用。近年来,加快建设“数字中国”,更好发挥数据要素重要价值,多角度、深层次助推经济社会转型发展,已成为国家战略。中共中央、国务院于2023年2月印发《数字中国建设整体布局规划》,明确指出建设数字中国是数字时代推进中国式现代化的重要引擎,是构筑国家竞争新优势的有力支撑。借助数据要素的巨大驱动力,构建强大的数据能力,已成为各行各业进入“大数据时代”的必由之路。 中国邮政储蓄银行(以下简称“邮储银行”)深入贯彻党中央、国务院决策部署,强化顶层设计和整体统筹,以“十四五”IT规划和大数据五年发展规划为蓝图,以“构建同业先进的数据能力”为战略目标,强化核心数据能力建设,提升总分各级用数体验,深挖业务条线数据场景,不断释放数据内在价值,为打造数字邮储提供全方位数据服务支撑。
金融电子化
陈震宇
2022-03-09
宇信科技:一站式数据开发平台
一站式数据开发平台集成项目管理、数据建模、数据清洗加工、任务开发、任务发布、数据探索等数据能力,提供可视化开发主界面,赋予用户智能代码开发、规范化任务发布能力,高效完成大数据离线加工计算的核心业务开发。
“鑫智奖”第四届金融数据智能优秀解决方案评选
宇信科技
2022-03-09
东方国信:企业级数据平台建设方案
基于东方国信自主研发产品用于建设银行等金融机构的企业级数据平台,整合了传统的ODS、数据仓库、数据集市、分析类应用系统,实现面向全企业的统一储算平台,并在此基础上建设全企业的数据服务平台,为全企业提供标准的数据服务。
“鑫智奖”第四届金融数据智能优秀解决方案评选
东方国信
2022-03-09
刘昇晔:关于商业银行分行数据治理与应用的思考
自2018年银保监会发布《银行业金融机构数据治理指引》以来,商业银行数据治理工作便进入了快速发展阶段。各家商业银行已基本建立企业数据治理体系,成立专业化数据部门牵头推进数据治理制度规范编制、流程机制设立、系统平台建设等工作。与此同时,各行纷纷建设企业级数据平台,将治理后的数据汇聚融通后对外提供应用服务,为业务发展和经营管理提供了重要的数据支撑。
数据治理周周谈
刘昇晔
2022-03-09
数巅科技:AskDI银行业解决方案
数巅科技AskDI银行业解决方案基于数据虚拟化技术,实现跨多数据源的高效统一管理和利用:通过业务虚拟表建模,满足银行各类业务场景需求,灵活处理数据。该方案支持指标和流式事件消息应用,助力银行提升数据处理效率,降低数据的存储成本,显著加速数数据资产的查询速度和效率,适用于客户关系分析、业务效率提升等场景。
2024年“鑫智奖”第六届金融数据智能优秀解决方案评选
数巅科技
2022-03-09
上讯信息:数据交付流程编排自动化解决方案
数据交付流程编排自动化解决方案主要适用于银行业数据从生产域到测试域的交付流转场景,通过CDM技术、静态数据脱敏技术实现从数据采集、传输、存储、脱敏、交付、销毁各个环节的自动编排,保障数据安全的同时降低人力运营成本。
2024年“鑫智奖”第六届金融数据智能优秀解决方案评选
上讯信息
2022-03-09
微信
咨询
微信咨询
扫码添加金科小助手微信号
咨询案例和解决方案相关信息
或联系对应机构