本文来源于:“鑫智奖”第五届金融数据智能优秀解决方案评选,作者: 易道博识
易道博识:赛博智能学习平台
2023-03-07 关键词:金融大数据平台,数据治理,数据平台
1707
一、解决方案简介
易道博识基于深度学习技术,自主研发了一站式机器学习训练平台——赛博智能学习平台,为客户提供OCR、CV、结构化提取和NLP领域数据驱动模型应用的现场高效解决方案。客户通过该平台可自主完成数据标注、模型训练、推理、部署、应用全过程。
赛博智能学习平台拥有预置通用智能文字识别、预置场景文字识别、预置智能图像处理、智能数据管理与标注、文档图像智能结构化模板、机器学习算法开发与模型训练以及模型编排与应用、AI能力管控七大核心能力,并在算法、数据、训练、部署层面的多个方面拥有独特的技术竞争优势。
赛博智能学习平台不但能应用于文本检测、OCR识别,还可应用于实体提取、表格提取、关系抽取、文本分类、命名体识别、图像分类、图像检测、对象分割等图像处理及NLP领域。目前该产品已在国内多家大型银行、保险、证券机构部署应用,深入金融领域集中运营、切片识别、智能审核、柜面业务等业务场景中,帮助客户打造并管控AI能力,满足客户对样本数据安全安全可控要求,从真正意义上实现降本增效。
二、应用场景痛点简介
随着金融业务的发展,越来越多的业务线中涉及的纸质凭证影像需要用到OCR自动处理,来进一步提升业务办理的效率。这些凭证影像按照格式可以分为两类:固定格式的凭证和非固定格式的凭证,其中固定格式业务类凭证占90%以上,在具体业务中会面临如下痛点:
1.凭证种类多
在各个业务受理过程中涉及到的凭证都在百种以上,甚至多达几百种;
2.格式更新频繁
不少凭证会随着业务需求或者监管制度的变化而调整格式,导致需要重新定制;
3.长尾凭证“鸡肋”
存在很多使用频率低,但总体数量大的凭证,这些凭证单独采购识别的价值不大但又无法解决;
4.数据安全
大多数情况下,隐私数据是无法对外的,如何在这种情况下做模型训练是客观需要面对的问题;
其中,固定格式凭证中不同样本中锚点元素之间几何图形位置相对固定及文字内容固定,需要提取的信息范围相对固定如身份证、户口本、行驶证等等;而非固定格式凭证具有文本不定长(可变长文本),锚点排版不固定或者不存在所谓的锚点,或者具有可伸缩的流水式的数据,如银行流水等。

基于上述情况,业务中的OCR识别工作十分复杂。目前存在两种解决方案,但两种方式均存在一些缺陷:
一种是委托技术提供商做定制开发:按照凭证种类委托OCR厂商进行定制开发,逐一支持各类凭证;另一种,是基于OCR底层能力进行自研:基于OCR厂商提供的底层识别能力(文字、表格、手写体、印章等识别能力),自己投入研发力量从代码层面开发针对各类票据的OCR功能。

不过,以上两种方式均存在一些缺陷:*****种方案,持续投入高,需要厂商就每一种凭证进行定制化开发。第二种方案,成本投入更高,不仅需要采购厂商底层能力,而且需要OCR专家团队的支持。因此,银行迫切需要一个能够减少后续投入,自主可控的解决方案。
此外,深度学习在实际应用中条件很苛刻。人工智能模型的开发与上线应用需要经历从业务理解、数据采标及处理、模型训练与测试到运维监控等一系列流程。过程中需要大量的AI算力、高质量数据源、Al应用算法研发及Al技术人员的支持。
而事实上,大部分中小企业用户并不具备在“算力、数据、算法”三维度从0到1部署的能力,而财力雄厚的大型企业亦需高性价比的AI开发部署方案。
假如,每次开发模型都需要算法工程师单独完成从生产到上线的全流程招建,就会导取很多时间的耗损与AI模型开发成本的浪费。所以集标注、训练、推理于一体的赛博智能学习平台应运而生。
三、解决方案亮点介绍
赛博智能学习平台可有效缓解B端、G端逐渐增长的、从感知到认知多类型的AI应用模型开发、训练到部署的完整需求,输出AI技术服务能力,提高AI应用模型在各行业的渗透速率与价值空间。在需求传导链中,需求端与供给端的传导链并不完全独立,可同时共存,易道博识就有能力充当AI技术层供应和AI基础层供应的双重角色。

赛博智能学习平台与AI开放平台均开放API接口,将能力输出给应用开发企业,并吸收下游更新的产品与技术,从横向与纵向拓展业务的广度与深度;同时,两个平台之间也会进行能力的互换,共同促进技术积累与迭代升级。

在人工智能产业发展的过程中,智能模型敏捷开发工具可持续拓宽与深挖AI业务的广度和深度。从广度讲,AI开放平台形成平台效应,调用平台API的开发者聚集创新,针对不同业务场景的开发成果数量逐渐增多,提高了技术产品的利用率,打造出轻量化的输出模式、降低单位开发成本,并且构建出动态更新的服务池;与此同时,一站式AI应用模型效率化生产平台逐步填充因场景多元化而衍生出的长尾业务模型,丰富模型供应市场的种类与数量。

从深度讲,二者均从业务前端发掘潜在或外显的市场需求,针对刚需应用与高价值环节延伸出多条增量建设与运行需求业务线,瞄准市场风口的同时,敏捷、经济地消化个性化或碎片化需求,根据需求柔性匹配生产。
四、金融行业客户名单
中国银行、浦发银行、华夏银行、厦门国际银行、大连银行、渤海银行、汉口银行、渣打银行、上海农商、江西农信、人保集团。
五、客户评价
大连银行:
为有效降低信息提取和录入的人力成本,并且能实现减少后续投入,自主可控,我行与易道博识合作上线赛博智能学习平台,涉及事后监督、信用卡、财务、互金、供应链等业务场景,其中凭证模型数十种。包含目前已支持身份证、银行卡、增值税发票、营业执照、出租车票、火车票、事后监督类等十几种成熟凭证、十几种定制训练凭证,从入场到实施上线共计一个月时间。项目上线运营后,行内评价报告显示:上线该平台之前,事后监督共10人平均每天录入9138次数据,耗时长、效率低、出错率高;上线之后,日均降低92.7%的人工录入量,目前每天只需2人即可完成数据录入及校对工作。该系统为我行极大程度上节省了业务录入工作量,提高了业务处理效率,降低了人工成本及操作风险。
本网站案例,除特殊标明来源的,版权归金科创新社所有,未经许可不得转载,否则将视为侵权,对于不遵守此声明或者其他违法使用本文内容者,本网站依法保留追究权。另,本网站部分案例、观点文章来源于网络素材,如有侵权,请邮件联系 fenglei@fintechinchina.com 处理!
特别提示: 本网站免费为广大金融企业提供IT选型咨询服务,详情点击 【 需求提交 】。
推荐阅读
更多
中国邮政储蓄银行 陈震宇:聚势赋能,推进大数据能力高质量发展
数据作为新资源、新资产,在数字化建设浪潮中起着核心关键作用。近年来,加快建设“数字中国”,更好发挥数据要素重要价值,多角度、深层次助推经济社会转型发展,已成为国家战略。中共中央、国务院于2023年2月印发《数字中国建设整体布局规划》,明确指出建设数字中国是数字时代推进中国式现代化的重要引擎,是构筑国家竞争新优势的有力支撑。借助数据要素的巨大驱动力,构建强大的数据能力,已成为各行各业进入“大数据时代”的必由之路。 中国邮政储蓄银行(以下简称“邮储银行”)深入贯彻党中央、国务院决策部署,强化顶层设计和整体统筹,以“十四五”IT规划和大数据五年发展规划为蓝图,以“构建同业先进的数据能力”为战略目标,强化核心数据能力建设,提升总分各级用数体验,深挖业务条线数据场景,不断释放数据内在价值,为打造数字邮储提供全方位数据服务支撑。
金融电子化
陈震宇
2023-03-07
宇信科技:一站式数据开发平台
一站式数据开发平台集成项目管理、数据建模、数据清洗加工、任务开发、任务发布、数据探索等数据能力,提供可视化开发主界面,赋予用户智能代码开发、规范化任务发布能力,高效完成大数据离线加工计算的核心业务开发。
“鑫智奖”第四届金融数据智能优秀解决方案评选
宇信科技
2023-03-07
东方国信:企业级数据平台建设方案
基于东方国信自主研发产品用于建设银行等金融机构的企业级数据平台,整合了传统的ODS、数据仓库、数据集市、分析类应用系统,实现面向全企业的统一储算平台,并在此基础上建设全企业的数据服务平台,为全企业提供标准的数据服务。
“鑫智奖”第四届金融数据智能优秀解决方案评选
东方国信
2023-03-07
刘昇晔:关于商业银行分行数据治理与应用的思考
自2018年银保监会发布《银行业金融机构数据治理指引》以来,商业银行数据治理工作便进入了快速发展阶段。各家商业银行已基本建立企业数据治理体系,成立专业化数据部门牵头推进数据治理制度规范编制、流程机制设立、系统平台建设等工作。与此同时,各行纷纷建设企业级数据平台,将治理后的数据汇聚融通后对外提供应用服务,为业务发展和经营管理提供了重要的数据支撑。
数据治理周周谈
刘昇晔
2023-03-07
数巅科技:AskDI银行业解决方案
数巅科技AskDI银行业解决方案基于数据虚拟化技术,实现跨多数据源的高效统一管理和利用:通过业务虚拟表建模,满足银行各类业务场景需求,灵活处理数据。该方案支持指标和流式事件消息应用,助力银行提升数据处理效率,降低数据的存储成本,显著加速数数据资产的查询速度和效率,适用于客户关系分析、业务效率提升等场景。
2024年“鑫智奖”第六届金融数据智能优秀解决方案评选
数巅科技
2023-03-07
上讯信息:数据交付流程编排自动化解决方案
数据交付流程编排自动化解决方案主要适用于银行业数据从生产域到测试域的交付流转场景,通过CDM技术、静态数据脱敏技术实现从数据采集、传输、存储、脱敏、交付、销毁各个环节的自动编排,保障数据安全的同时降低人力运营成本。
2024年“鑫智奖”第六届金融数据智能优秀解决方案评选
上讯信息
2023-03-07
微信
咨询
微信咨询
扫码添加金科小助手微信号
咨询案例和解决方案相关信息
或联系对应机构