本文来源于:2022年度城市金融服务优秀案例评选,作者:广东华兴银行

广东华兴银行:金融业知识图谱于账户风险监测领域的探索及应用

2022-10-03 关键词:全国性商业银行,风险管理,实时业务监控系统3864

一、项目背景及目标


1. 项目背景:

以习近平新时代中国特色社会主义思想为指导,纵深推进电信网络诈骗和跨境赌博“资金链”治理工作。党中央、国务院高度重视打击治理电信网络诈骗和跨境赌博工作,要求坚决遏制电信网络新型犯罪案件高发多发态势。2022年1月4日,中国人民银行发布《金融科技发展规划(2022-2025年)》,提出“数字驱动、智慧为民、绿色低碳、公平普惠”的发展原则,强调将数字元素注入金融服务全流程,将数字思维贯穿业务运营全链条,注重金融创新的科技驱动和数据赋能。在这双重形势的推动下,随着知识图谱技术的广泛落地应用,银行业越来越重视大规模图数据的融合、治理和应用。图模型的可视化优势、贴近业务的模型表达、强大的深度关系分析和模式匹配能力将是助力数据赋能的重要方面,越来越多的数据将以图模型的方式存储、计算、展示。然而由于目前数据来源多、数据异构碎片化,结构、半结构、无结构的数据共存,且数据规模日益增多,导致内部形成了图谱数据孤岛,点、边数据在多业务场景中重复建设,管理人员难以有效地组织、管理和挖掘海量信息间的内在联系。为深入推进电信网络诈骗和跨境赌博“资金链”治理,切断不法分子涉诈涉赌资金转移链条,进一步提高数据的可解释性和分析效用,将表分析和图分析融为一体、实现外部数据与行内数据相结合的全景视图,本行搭建了全行级的统一知识图谱平台及图谱数据全生命周期体系。


2. 项目目标:

(1)整合客户及账户相关基础数据、管理数据、风险数据,构建数据关联的可视化图谱,对关联数据之间进行信息挖掘、推理、模型计算,进而更准确地甄别业务中的潜在风险,识别诈骗团伙、网络赌博和洗钱等违法犯罪行为背后的关联交易关系,切实严控账户风险,落实账户管理主体责任。

(2)基于银行全行级图谱平台的建设和图谱应用落地的经验,构建用于存放图谱的数据标准,描述设计适用于金融行业的知识图谱体系建设实施方案,并建设图数据仓库,实现图数据生产、治理、挖掘、分析、服务的全生命周期体系。建立“业务实体”和“关系”的分析视角,对涉赌涉诈等电信网络新型违法犯罪行为的分析能力进行有益补充。

(3)在全行级图谱平台的基础上,引入内外部数据,充分利用司法查冻扣信息、企业异常经营信息、受益人关系等外部数据与行内征信数据、代理业务关系、客户信息、模型分析结果等内部数据有效结合,实现自动化、智能化、多维度展示、识别与挖掘,大幅提高跨境赌博、电信网络诈骗等违法犯罪团伙识别的精准度与效率,提升业务专家规则预警账户的线索价值。


二、项目/策略方案


1.采用的技术原理

构建体系化的适用于金融行业的知识图谱应用,必不可少分几步走,*****步建设全行统一的知识图谱平台,第二步建设图数据仓库体系,第三步建设基础应用大图,第四步完善图谱数据的全生命周期体系,现在就四步分别介绍其技术原理。


(1)建设全行统一的知识图谱平台

建设全行统一的企业级知识图谱平台,通过对行内业务系统数据及行外接入的外部数据加工、分析,在平台上构建各个业务部门的关系图谱,基于数据、模型分析结果,在反洗钱、反欺诈和智能运维等方向落地应用,赋能给业务部门。

系统架构设计从下到上分为数据层、图谱层、应用层,数据层对接数据源,支持多种数据接入方式,支持数据etl和调度工作,批量提供数据供图谱建设。图谱层又分为图数据库、计算能力及知识计算,图数据库分为开源及商用图数据库,根据具体业务性能需求选择特定的图数据库支持图谱上层应用,计算能力由大数据平台支持,通过spark分布式图计算引擎提供图算法算力,知识计算是图查询及图算法,实现图谱在业务场景的落地应用。应用层是通过知识图谱支持的业务场景,分为融合方案和对外提供服务,融合方案是结合规则、机器学习等方法在业务场景落地,发挥不同方法自身优势,服务是知识图谱提供对外服务,支持业务系统的决策分析。


29.png


知识图谱平台的基本功能清单如下表:


30.png

(2)建设图数据仓库体系

在建设完基础应用平台-知识图谱平台后,要构建图数据仓库。本课题首次提出图数据仓库的概念,是指对知识图谱数据的架构、管理和图数据治理方案,区别于“全行一张图”、“全行级图平台”的概念。全行一张图是指从全局的业务视角出发看图谱,是一套体系工程,指对图谱实施的软件工程,采用自上而下的共建机制,建立全行一张基础图谱。全行级图平台是指从需求实现的技术视角出发看图谱,全行级图平台是一个应用系统软件,采用先技术后业务的建设机制,一般都是由科技牵头实施的项目。图数据仓库是从图谱数据资产视角出发看图谱,是一类数据资产的管理方式,采用自下而上的共享机制,属于在“全行一张图”下的“数据部分”管理项目。


当前,金融行业应用知识图谱技术的痛点问题一是存在图数据孤岛,点、边数据重复建设现象严重,二是图本体定义没有一致的规范。这种情况导致了图数据往往难以融合、复用等问题。图数据仓库概念的提出,进一步明确图数据仓库的建设目标,一是在数据上统筹银行全行级标准规范,将通用的图谱关系沉淀到图数据仓库,作为“数据资产”的重要一环。二是在技术上提供统一的图谱加工管理平台,遵从统一开发框架,提供数据接入、图谱加工、图谱服务的能力,各应用团队可依托此平台在各自子图空间构建子图。


① 首先区分图数据仓库在银行数据体系中与传统数仓区分,图数据仓库的定位如下图所示:


31.png


图数据仓库是对传统数仓的补充,增强数仓在部分OLAP场景中的关联分析能力,如资金流向分析等。补充数仓不能直接在OLAP系统中高效实时的关联分析的要求,如申请团伙反欺诈等。图数据仓库也是一种新的数据分析视角,图数据仓库并不能取代传统的数据仓库,而是与传统数据仓库并存。结合图库特点,图数据仓库提供了一个丰富的用户视角,区别于数仓的“维度”数据视角,图数据仓库以“关系”数据视角为核心。


32.png


 在传统数仓的主题域模型中,采用主题域导向设计,分解银行业务流程,多采用星型或雪花型数据结构,数据间键值采用隐式链接。常用于指标统计加工和提供数据分析服务。在图数据仓库的关系网络模型中,抽取银行业务关系数据,统一实体分析对象,构建复杂层次结构的关系网络模型,采用点边属性图本体数据结构,常用于业务关系计算分析和子图挖掘服务。


 33.png

    

② 图数据仓库的分层架构:基于在金融行业的大规模知识图谱落地经验,知识图谱在不同的场景下有截然不同的技术要求和建模要求。在知识融合和管理的角度,集成企业数据到图谱中,建模上体现业务概念和知识体系,技术上重点在图数据标准化和融合。而在图应用角度,建模上尽可能简单、直接、同构,以面向图算法、图嵌入和机器学习应用。


34.png


在这种矛盾下,设计图数据仓库架构时,需进行分层管理。


主要分为以下几层:

基础大图:主要用于图数据标准化、融合,数据模型是属性图但在技术上以Hive表离线存储,通过Spark大数据框架定时更新。该图融合了全行范围业务数据,不直接提供在线图数据和分析服务。

领域图谱:基于基础大图构建的业务领域子图,在技术上存储于图数据库,同时包含了业务领域共享的挖掘关系,可以提供在线图数据服务,主要用于一般性的可视化探索。

应用图谱:基于通用图谱实例,通过图项目的方式,控制一部分子图为业务应用访问,主要满足特定业务场景下,解决具体问题的图谱。这时的图本体设计会尽量简化,剔除不必要的实体、字段和间接关系,面向挖掘、图算法和复杂查询,以性能为*****考虑。


③ 数据仓库加工管理平台功能架构,作为图数据库仓的基础支撑平台,是图仓团队为主要的日常工作抓手和平台,起到图数据“全生命周期”的核心功能。图数据仓库加工平台在图仓的落地实施中承担了重要的作用,是全行图谱共建共享平台。图仓加工平台具备统一的知识构建、知识存储、知识挖掘功能,除了提供基础的知识检索能力外,还可结合业务深度挖掘图能力,提供知识服务,发挥数据大价值。


35.png


数据存储与计算层:数据的层次存储采用索引数据库ElasticSearch,HBase、Hive大数据混舍存储数据。采用Spark分布式计算框架进行大数据计算。

知识存储层:在知识存储层,分为分布式图存储、分布式数据仓库、分布式列数据库交互使用,提供全文检索引擎。

知识构建层:在知识构建层支持本体模型管理、知识抽取、知识数据检验等。

知识挖掘层:提供场景开发、场景管理、知识推理、子图抽取、自定义工作流算法功能,同时也整合抽取通用算法,集成通用算法库,业务算法库。

知识分析层:提供基础图谱操作、路径分析、关系拓展、图谱设置等功能。

知识服务层:集中对外服务层,提供服务API、服务发布、服务控制、调用统计等功能。

系统模块层:提供基础系统功能,如用户管理、登录、权限管理、业务监控、日志管理、访问控制等。

知识应用层:知识终应用于图仓知识的搜索、分析,提供场景探索能力,开成成体系的知识库。


(3)建设基础应用大图

设完知识图谱平台,构建完图数据仓库体系,在业务上需要覆盖银行全行各条线、全领域,构建“全行一张图”体系。将通用关系进行加工处理成为通用图谱,全行共用一张图。


36.png


基础应用大图层主要完成三个方面的工作。*****方面是指定统一的数据建模规范和命名规范,借鉴语义网(Semantic Web)RDF体系的建模理论,实现了基于类型继承的本体定义方式,避免大量重复字段,同时体现了业务语义;实现了属性字段的全局***,避免了一词多义、一义多词等在关系建模中常见的错误。第二方面是业务实体ID治理,将分散在不同数据源的表内业务对象的ID统一到基础大图的实体***ID,从而实现了全行统一的ID体系。第三方面是数据标准化工作,例如地址标准化、公司名称标准化、日期时间标准化、金额标准化等基本服务,并对入仓数据进行标准化处理和字典归一,实现了基本的图数据质量保障体系。


基于上述工作,能够将银行全行数据进行基于属性图模型的大规模集成,形成了基础大图。基础大图逻辑上是一张标签属性图,物理上可以转换为关系模型离线存储(例如Hive库),提供跟数仓良好交互性的基础上,支持大规模数据的水平扩展。它主要作为上层图构建的高质量数据底座,避免之前图数据ETL爆炸、图模型定义不规范、图质量参差不齐等问题。


(4)图谱数据的全生命周期体系

图谱数据的全生命周期体系是指图谱数据可管理、可维护,在生产、治理、挖掘、分析、服务等各个阶段,都有完善的理论、架构、工具支撑,从而能够形成统一的、闭环的图谱能力体系。


37.png


图谱生产能力:a)知识报告是一份文档,描述了本体建模规范和逻辑定义;b)关系-图映射规范指定了关系数据和图谱数据的映射规范,是图谱数据加工的标准;c)增量/全量混合ETL工具实现了关系-图映射规范;d)基于基础大图构建领域图谱、应用图谱的图-图ETL工具,这里的数据输入和输出都是图谱。

图谱治理能力:a)图本体定义和校验工具可视化地编辑查看本体、导入导出本体文件、校验本体正确性;b)实体解析工具实现ID映射(Entity Resolution);c)标准化能力是指对公司名称、地址、日期、时间、金额、数字等进行标准化和归一的服务;d)图谱数据资产管理系统是综合图谱数据治理的可视化展示平台和流程、审批工具。

图谱挖掘能力:可视化、低代码的知识挖掘工具(全行级图平台组件)。

图谱分析能力:图算法、时序视图、地理视图、图BI工具、图模式匹配、可视化探索(全行级图平台组件)。

图谱服务能力:基于API的图谱数据服务、可嵌入其他应用的图谱分析页面、面向业务人员的图谱应用服务(全行级图平台组件)。


2.技术架构


知识图谱系统总共分为权限管理、数据管理、知识构建、项目空间、知识分析、知识挖掘、知识应用、系统模块总共八大模块。


(1)权限管理


38.png

图-系统登录界面


系统登录、权限设计。知识图谱平台的权限体系是基于传统的RBAC模型的权限设计,即是基于角色的访问控制。在这基础上我们加入了项目机构的概念,贴近业务,更利于数据权限的控制。


(2)数据管理

数据的层次存储采用索引数据库ElasticSearch,HBase、Hive大数据混舍存储数据。采用Spark分布式计算框架进行大数据计算。该模块在知识存储层,分为分布式图存储、分布式数据仓库、分布式列数据库交互使用,提供全文检索引擎。数据管理模块主要提供数据管理功能,分布式图存储、分布式数据仓库、分布式列数据库交互使用,提供全文检索引擎。


例如外部数据列表展现平台上面所有的外部数据源基本信息,并以列表的形式进行展现。用户通过输入筛选条件,可以快速查找符合条件的数据源。外部数据源列表作为环境管理和新建数据源的功能入口,可以实现外部数据源的编辑和删除操作。


当用户在数据源列表点击新建数据源按钮时,弹出新建数据源新建页面窗口。通过此功能,用户可以创建包括ORCALE、MySQL、Hive及DMC等多种类型的数据源,用户需要在新建界面中填写连接对应数据源的各类基本信息。其它图表详见附件六科学技术报告。


39.png

图-数据源管理


(3)知识构建

知识构建模块提供图实例管理、本体模型管理、知识抽取、知识数据接入、检验等。以图实例管理举例,其它模块图表详见附件六科学技术报告。


本模块可以实现对图谱数据的配置化构建,通过可视化的方式构建本体模型。图元数据信息的定义,可以实现对“实体点”和“边关系”的定义,从而构造整个图逻辑关系。系统支持自上而下的本体模式定义方式,亦可以从数据源角度出发,自下而上进行模型的定义。“实体点”定义时,需要确定实体的主键标识以及需要增加的属性信息,属性信息可以作为展示或后续图挖掘的信息使用。“关系边”定义时,需要确定边的主键标识以及边的起始点、终点、方向以及其他所需的属性信息。


图实例管理包括图实例列表及本体设计两部分。图实例列表用来展现已经建立好的图实例信息。在列表页面操作人员可以进行新建图实例的操作,每一个图实例都对应一个本体,并且可独立配置数据源。


40.png

图-图实例列表示例


新建图实例的实体与边,用户可在本体设计中进行可视化的实体和关系管理,新建实体和关系,并进行对应的字段和样式管理,允许用户新建、编辑、删除字段,修改展示颜色、尺寸等信息。


41.png

图-新建实体示例


42.png

图-本体样式示例


在图实例中新建关系边,关系边分有方向/无方向,边的类型分四种:普通边、挖掘边、明细边、汇总边。

① 普通边: 一般的业务关系数据,需要显示在图谱中,如“居住、拥有、购买”等关系。建议导入到GDB中即可。

② 挖掘边:基于一些已有数据和特定业务规则,进行一定计算后输出的关系数据,需要显示在图谱中,如“一致行动人、同地址”等关系。建议导入到GDB中即可。目前在使用上,与普通边没有差别。

③ 明细边:一般的原始业务关系数据,数据量较大,不需要直接显示在图谱中,如“转账明细、通话明细”等关系,此类关系如果数据量一般(几千万或几亿级别),如果不想引入HBase增加系统复杂性,可以直接存储在GDB甚至ES中,如果数据量达到几十亿几百万亿的海量级别,建议存储在Hbase中。

④ 汇总边:基于明细边汇总出的统计关系,需要显示在图谱中,如“转账汇总、通话汇总”等,建议导入到GDB中即可。在图谱中点击汇总边查看其详情时,会根据detail_schema和detail_ids查找到其对应的明细边数据。在汇总边的左侧详情面板上以分页表格的形式展现其关联的明细边信息。


43.png


字段管理:用户可对实体的字段进行管理,内链配置决定在首页搜索出来的内容能否跳转图析或者档案。例如,在公司中内链配置了图析和档案,在首页搜索时,可点击公司跳转到图析或档案。

 

44.png

45.png

(内链配置-图析/档案)


字段管理中的实体标识与图析-高级搜索有关,在图析中展开实体搜索时,根据在字段管理中设置的实体标识,自动选择所要搜索实体的属性字段。


46.png

47.png

图-本体模式示例


(4)项目空间

项目空间用于管理在图平台中进一步控制功能和数据权限,一个项目包括的成员、角色和数据,图平台中的大多数功能都要基于项目才能使用。以项目列表管理为例,其它模块图表详见附件六科学技术报告。

用户可在项目列表创建新的项目,可以对已有项目进行编辑和删除,也可选择项目管理,对所选项目进行进一步管理,系统也会自动切换到所选项目。项目列表分为两个标签,“我管理的项目”展示了用户本人拥有管理权限的项目,可对项目的成员和角色进行管理。“其他项目”展示了平台中当前用户无法直接管理的项目,此标签的展示及相关操作取决于用户权限的配置。


48.png

图-项目列表


(5)知识分析

提供基础图谱操作、路径分析、关系拓展、图谱设置等功能。以图析为例,其它模块图表详见附件六科学技术报告。

图析功能为用户提供基本的图析操作,当前可以支持图谱展开、短路径、所有路径查找,也支持用户通过输入图析语言进行查询的图语言查询功能,当前图语言查询支持的语言为Arango的AQL。

在查询生成的图上,支持图探索功能,例如图内的短路径、所有路径查找,图内标记、图内筛选、根据体或关系进行筛选等。


49.png


(6)知识挖掘

知识图谱平台图挖掘模块提供了综合的图挖掘能力,集成了通用图算法,可封装的业务图算法,自定义算法工作流,提供了从数据处理、定义算法管理与发布、场景调度等功能,与其他平台配合完成从数据到应用的一站式图谱构建服务。在整个知识图谱构建中,挖掘平台起到承上启下的作用,针对特定场景发现底层数据中的业务价值,为后续的分析和应用提供基础数据,消除数据与业务的隔阂。以场景模板管理为例,其它模块图表详见附件六科学技术报告。

基于知识图谱平台的场景积淀,平台内置丰富的场景模板,在前端界面提供拖拉拽的可视化操作环境,使数据挖掘的创建过程大幅简化。提升数据挖掘工具的易用性,降低操作门槛,让数据挖掘近在咫尺。

 

50.png

图-场景模板列表


在可视化场景中,用户可通过点击和拖住等方式,对场景工作流中的组件进行配置,修改输出输入、算法参数等各项配置。图挖掘后生成的数据可以回写到图数据库,以供前端展现。


51.png


(7)知识应用

知识终应用于图仓知识的搜索、分析,提供场景探索能力,开成成体系的知识库。以前台应用-首页-检索为例,其它模块图表详见附件六科学技术报告。

检索支持三种类型:全文检索、标签检索、批量检索,支持搜索标签独立配置。点击搜索名称可切换类型。三种类型都需要通过项目管理下的首页检索配置单独进行配置才能展示,配置详见前文。


52.png


① 全文检索

全文检索可根据配置提供所有业务数据表的检索,支持根据业务数据分类进行快捷检索。在输入框下方展示了搜索历史,可点击直接进行该关键字的检索。同时可通过右侧的高级检索功能对多个关键词进行检索。


53.png


用户输入关键字后,会在下方展示类型为实体的模糊匹配的结果,点击可快捷跳转到该实体的图析界面。

当需要多条件搜索时,可使用右侧的高级检索功能,在高级检索弹窗内输入或选择相应的条件。


54.png


② 标签检索

标签检索实现了对单个或批量实体标签的检索,通过预先配置好的标签字典,快速选择需要搜索的标签。在选择标签的基础上,也可以添加搜索关键字,实现“标签+关键字”的检索。

点击输入框可以看到各组的可选标签,可快速选择所需标签。也可以通过输入关键字模糊匹配标签字段,选择的标签将展示在输入框下方。若在搜索的同时需要包含关键字信息,在输入框中搜索所需的关键字再点击搜索即可。


③ 批量检索

批量检索通过空格分隔搜索关键字,一次性完成对批量关键字的检索。完成首次检索后,还可以通过开启追加模式进一步添加检索关键字。

全文检索的高级检索是组合检索and的关系,批量检索是组合检索or的关系


④ 检索结果展示

检索结果主要分为结果分类和结果卡片两个部分。结果分类可以快速切换检索的类型,结果卡片则展示了配置好的搜索结果概览。


55.png


顶部可通过标签筛选对结果中的标签进行筛选。


56.png


修改当前排序字段,切换正序/倒序排列


57.png


点击数据导出,可对当前页或所有搜索结果进行导出。


58.png


点击结果卡片左侧按钮可以查看更多详情信息,详情在项目-项目空间-首页检索中配置。


59.png


若相关字段配置了图析或档案的内链,呈可交互状态,悬浮展示操作按钮,跳转到对应模块。


60.png


点击批量档案可将所有搜索结果在新的档案页面中展示


61.png


点击批量图析可将所有搜索添加到图析中,并自动进行一度全路径展开,揭示这一批实体中存在的关联关系。


62.png


(8)系统模块

提供基础系统功能,如用户管理、登录、权限管理、业务监控、日志管理、访问控制等。以业务监控为例,业务监控模块展示了图平台内各项服务访问情况的汇总数据。用户可根据时间段筛选查看某个固定时间范围内,服务的访问总量、耗时、成功率等信息。下方的服务列表展示了具体服务的访问数据,支持使用服务英文名进行搜索。若要进一步查看服务的相关访问信息,可点击查看详情。其它模块图表详见附件六科学技术报告。


63.png


三、创新点


1. 技术创新点

(1)覆盖全行数据的基础大图:基于银行全行多年的全量交易流水、全量登录流水、全量账户数据、全量客户数据,建设起数十亿级节点、数百亿级关系的基础大图。制定了完整的标准规范,建设了多种数据标准化服务,构建了人员关系、交易关系等数据的可视化高质量基础图谱数据。

(2)图谱数据全生命周期体系:基于图数据仓库的分层架构,结合现有全行级图平台的图挖掘、图分析、图可视化、图应用服务等可复用工具,实现了图数据生产、治理、挖掘、分析、服务的全生命周期体系,进一步增强了图谱对业务风险识别、风险决策的支撑能力。

(3)图谱应用开发降本增效:基于基础大图高质量的标准化图谱数据,领域图谱和应用图谱不再需要重复ETL,就可以快速构建并提供服务,极大提升了图谱应用的整体开发效率和开发质量。


2. 业务创新点

(1)分析模式的转变:通过在基础大图之上各业务领域的知识图谱落地,准确完整构建了底层全行级客户关系网络图、账户关系网络、资金流向网络图、集团派系网络图等等,融合图析、图模式、人工智能图算法三阶递进数据分析方法论,改变单层客户、账户与专家规则预警的传统思维,以共同电话、IP地址、登陆设备等多维度追溯三层以上成员关系,直观展示各风险团伙全貌,可宏观分析上下游,也可微观网络团伙某一环节账户。通过以图的异常形态识别、人工智能图算法形成有效预警模型,高效从客户群组中以团伙识别视角抓取涉嫌洗钱团伙,涉赌涉诈团伙、风险集团客户等等。实现自动化、智能化、多维度展示、识别与挖掘,大幅提高风险团伙识别的精准度与效率。

(2)风险政策闭环调优:在传统风控系统的基础上,通过图谱的补充,帮助业务更全面的直观展示风险团伙,可视化的提练团伙风险特征,加深对客户数据的挖掘,可以不断的调整、优化策略体系,形成风控决策全流程闭环,提升攻与防可持续对抗的能力。   


四、项目过程管理


本案例采用迭代的方式进行,结合行内外数据构建图数据仓库,应用图分析、图模式及图算法技术,从关联关系的角度分析图数据,识别风险案例、关系及团伙。首期实现反洗钱预警团伙挖掘,本行运用该平台,完整、准确展现某团伙共用设备关系、账户资金分层结构与流向轨迹、手机银行登陆时所处地区等信息,有效助力警银联动,强化联防联控机制。在验证知识图谱系统无限扩展、关系挖掘、集团挖掘的效果后,逐步扩展到适合知识图谱系统的更多场景。


64.png


五、运营情况


通过基于图数据仓库构建的账户图谱分析中心,集成图谱领域新算法及规则模型,可以挖掘依靠专家规则难以识别的风险事件,对抓取到的符合疑似跨境赌博、电信网络诈骗、地下钱庄洗钱等可疑特征的模型数据进行深层次挖掘及反欺诈、反洗钱调查,以准确甄别疑似违法犯罪资金链路,从原来的横向排查进一步扩展到横纵向双向挖掘,切实防范电信网络诈骗、网络赌博和洗钱等违法犯罪行为,严控账户风险。主要应用情况如下:


1.通过充分运用该平台,实施账户风险排查工作,对涉案账户或行内风控系统监测预警的可疑账户线索开展拓展排查,持续分析、总结、发掘涉赌涉诈可疑资金特征及账户线索,不断完善账户全生命周期风险管理体系,调整账户风险监控模型,提升关联数据之间信息挖掘能力,进而更准确地甄别、定位业务中的潜在风险,识别诈骗团伙、网络赌博和洗钱等违法犯罪行为背后的关联交易关系,切实严控账户风险,落实账户管理主体责任。


65.png


2.曾经根据当地人民银行提供的32个账户,运用该平台,完整、准确展现某团伙共用设备关系、账户资金分层结构与流向轨迹、手机银行登陆时所处地区等信息。在当地人民银行原有调查名单基础上,额外追踪定位疑似涉案团伙成员37人,挖掘团伙成员境外作案证据,相关调查材料作为案件线索由当地人民银行移送当地公安部门,助力破获该跨境赌博案件。本行运用该平台已多次成功挖掘数十人至上百人的疑似洗钱团伙,分别涉嫌电信诈骗、经营虚拟货币、非法经营外汇期货等,并及时向中国反洗钱监测分析中心报送可疑交易报告,部分作为重点可疑交易报告报送当地人民银行。


66.png


目前,本行持续增加企业图谱关系,例如:企业受益人关系,司法查冻扣信息、企业异常经营信息、企业注销吊销信息、征信信息等,将全行外部数据应用起来,充分结合客户信息、行内交易数据,通过知识图谱系统的关系及知识分析能力为可疑账户加工风险类型标签,供给账户风险监测系统开展风险排查,以科技驱动和数据赋能筑牢防范账户管理风险防线。


六、项目成效


1.社会效益

(1)形成一套可供金融行业参考的知识图谱应用落地方案。

本课题实践了金融行业如何落地知识图谱应用,构建用于存放图谱的数据标准,描述设计适用于金融行业的知识图谱体系建设实施方案,并建设图数据仓库。在不同层次上,解决了大规模图数据集成、基础图数据治理的问题,结合低代码的图构建、图挖掘、图分析、图可视化工具,形成了完善的图应用和图数据服务体系。首次实践覆盖银行全行数据的图建模和数据集成,有效支撑了反洗钱、反欺诈、风险监测、集团派系挖掘等风险场景的排查及风险决策方向,提供了创新的基于图的解决方案,体现了图数据仓库应用价值。随着图数据渗透到业务的方方面面,图应用的建设效率和质量有了根本保障。


(2)率先提出图数据仓库概念并落地,完成从学术界研究到工业界的应用。

本课题首次提出图数据仓库的概念,区别于“全行一张图”、“全行级图平台”的概念。全行一张图是从全局的业务视角出发看图谱,是一套体系工程,对图谱实施的工程,是一种顶层设计的概念,采用的自上而下的共建机制,建立全行一张基础图谱。全行级图平台是指从需求技术执行出发看图谱,是一个应用系统软件,属于“银行数据化转型”范畴,采用自技术而业务的建设机制,一般由科技牵头的项目。图数据仓库是从图谱数据资产出发看图谱,是一类数据资产的管理方式,属于“银行知识化转型”范畴,采用自下而上的共享机制,属于在“全行一张图”下的数据部分管理项目。亲历实践解决知识图谱应用存在图数据孤岛,点、边数据重复建设现象严重,图本体定义没有一致的规范,导致图数据难以融合、复用等等问题。


(3)率先在反电信网络新型违法犯罪领域建设图谱,效果显著,具有同业参考意义。

随着电信网络新型违法犯罪形势日趋严峻的情况下,新型违法犯罪活动更加专业、复杂、隐蔽,而常规技术下,风险监控系统产生专家规则可疑预警案例多、人工甄别工作量大、涉嫌洗钱团伙展示不够直观、较难甄别资金之外的关系。如何在海量数据下,精准、快速抓取分析可疑交易,成为亟待解决的一道难题。本课题完成了反赌反诈及反洗钱领域知识图谱的落地应用,准确完整构建了底层领域全行级客户关系网络图,融合图析、图模式、人工智能图算法,建成知识图谱风险监测平台。改变一层资金链条追踪团伙成员与涉赌涉诈专家规则预警的传统思维,以共同电话、IP地址、登陆设备等多维度追溯三层以上成员关系,直观展示涉嫌赌博、诈骗、洗钱等违法犯罪团伙全貌,可宏观分析上下游,也可微观定位资金链路某一环节账户。通过以图的异常形态识别、人工智能图算法形成有效预警模型,高效从客户群组中以团伙识别视角抓取涉嫌犯罪团伙,实现自动化、智能化、多维度展示、识别与挖掘,大幅提高识别的精准度与效率,有效降低漏报率,提升了可疑交易报告的案件线索价值。


(4)多业务领域覆盖,扩充可解释人工智能技术的业务科技价值赋能。

该项目应用于营运账户监测领域,整合行内外相关系统,打通信息孤岛,实现账户信息共享,建立客户统一视角的可视化关系网络,极大地提升了账户管理效率及风险识别能力,更好地实现了账户风险分级分类管理。应用于交易反欺诈领域,通过知识图谱进行风险判断,分析是否存在团伙类特征,对存在团伙类特征的元素进行跟踪挖掘。应用于集团派系挖掘领域,逐步代替人工排查集团派系的情况,结合集团派系的结果优化现有行内企业的集团派系,并逐步代替人工操作节约人力,通过集团派系模型精准识别贷款企业的集团及贷款额度,有效防止贷款超出监管要求。应用于零售信贷业务的信贷资金流向监测领域,解决目前本行对零售信贷资金用途监测的难点和瓶颈。在全行多领域落地并逐步取得应用效果,实现了多部门多领域的联防联控,成为银行防范账户风险的一大利器。


2.经济效益

(1)节省多部门的人力支出费用,提升风控效率。

通过该平台构建账户及资金流向关联关系的知识图谱,同时结合行内智能风控平台-天威账户风险监测模型对风险账户进行多重识别,建立客户统一视角的可视化关系网络,进一步提升了本行账户管理效率及风险识别能力,以更好地实现账户风险分级分类管理。对于传统模式下的账户拓展排查工作,同一IP、同一设备指纹、同一MAC地址、同一客户注册信息等维度的人工排查难度大、过程繁复、效率低,平均每人每户3小时,知识图谱投产后,本行通过充分运用图谱关联技术,大大提升了对涉案账户或行内风控系统监测预警的可疑账户线索的挖掘能力,拓展排查能力提升至10分钟/每户,是传统人工排查效率的20多倍,平均每月节省人力4人月,年节省120万元。而且更准确地甄别、定位业务中的潜在风险,对识别诈骗团伙、网络赌博和洗钱等违法犯罪行为背后的关联交易关系,切实严控账户风险、落实账户管理主体责任工作带来巨大的积极推动效用。


(2)基于全行一张图架构,节省部门级图谱重复开发费用。

同业建设一个业务领域图谱费用约100万元,本行基于全行一张图架构思想,统筹全行底层数据,统一规划,提升使用图谱的效率,提炼共性数据减低需求成本,进一步提升图谱系统的普及程度。项目自初建至今总计投入约200万元,覆盖交易反欺诈图谱、账户关联关系图谱、反洗钱图谱、资金流向图谱、集团派系图谱、审计图谱6个领域图谱,节省费用约400万元。


七、经验总结


近年来,随着人民银行“放管服”政策的不断推进落地,银行业认真贯彻落实党中央、国务院“放管服”改革、助力优化营商环境,坚持“两个不减、两个加强”原则优化银行账户服务,提升银行账户管理质效。与此同时,当前电信网络诈骗和跨境赌博等违法犯罪活动高发多发,党中央、国务院要求坚决打击治理非法资金转移链条,切实加强银行账户风险防控账户分类分级、加强涉诈涉赌模型运用、银警联动等,实现多部门多领域的联防联控。银行全行级知识图谱项目以优越的可解释性,坚持场景+技术+数据有机结合,基于大数据分析,知识图谱技术,覆盖交易反欺诈场景、信贷风险决策场景、反洗钱场景、账户风险监测等全流程事前、中、后风控,通过可视化的图型界面直观展现诈骗、跨境赌博、洗钱等新型违法犯罪疑似账户风险发生的资金传导路径、关联关系及预警规则内容,很好地支撑了银行内多部门的风险排查工作,有效提升银行业反赌、反欺诈、洗钱团伙及集团派系挖掘能力并且取得了显著的银警联动效果。


本行的知识图谱场景探索应用首先是让风险监测效果先行,积极探索业务场景应用,在账户风险监测领域进行知识图谱落地应用的尝试,当在这个应用领域取得良好效果后,行里提高重视,开始小步快跑的发展,建设全行级知识图谱平台,在各个业务部门的各个领域逐步探索应用,例如对公知识图谱、零售知识图谱、反洗钱知识图谱等等。点、边数据在多业务场景中重复建设,图本体定义缺乏统一规范,缺少基本的治理过程。基于银行全行级图谱平台的建设和图谱应用落地的经验,本行开始构建用于存放图谱的数据标准,描述设计适用于金融行业的知识图谱体系建设实施方案,并建设图数据仓库。区别于以“主题”和“维度”为视角的传统数据仓库,图数据仓库强调“业务实体”和“关系”的分析视角,是对企业数据分析能力的有益补充。同时,构建多层次数据架构并集中治理图谱数据,使得扩充图谱数据覆盖银行全行数据成为可能,以满足银行各业务部门对图谱数据的迫切需求。以数据赋能的体系化建设理念,形成了图谱数据生产、治理、挖掘、分析、服务的全生命周期支持,将表分析和图分析融为一体,将数字元素注入金融服务全流程,将数字思维贯穿业务运营全链条,以科技驱动和数据赋能促进金融创新。

本网站案例,除特殊标明来源的,版权归金科创新社所有,未经许可不得转载,否则将视为侵权,对于不遵守此声明或者其他违法使用本文内容者,本网站依法保留追究权。另,本网站部分案例、观点文章来源于网络素材,如有侵权,请邮件联系 fenglei@fintechinchina.com 处理!
特别提示: 本网站免费为广大金融企业提供IT选型咨询服务,详情点击 【 需求提交 】

推荐阅读

更多

云南红塔银行:“香叶智农”——一站式烟农服务平台

云南红塔银行结合国家烟草专卖局《关于建设现代化烟草经济体系推动烟草行业高质量发展的实施意见》和云南省《云南省数字烟草农业发展总体规划》的相关要求,结合人民银行普惠金融的相关政策规定,配合南省烟草专卖局(公司)搭建了“香叶智农——一站式烟农服务平台”,结合烤烟生产全流程,在平台上为种植主体、第三方供应、服务商等提供多样化的场景金融服务,提供安全、便捷、高效的线上烟农支付结算服务,助力乡村振兴。

2022年度城市金融服务优秀案例评选 云南红塔银行 2022-10-03

乌鲁木齐银行:个人消费贷款(雪莲E贷-精英贷)

该产品充分利用科技手段开展产品营销和服务,客户通过线上渠道申请贷款,客户经理通过移动办公线下补充资料,无需抵押、操作便捷,一经投产就获得了客户的热烈欢迎与认可,不仅提升了我行信贷业务办理效率,让更多的客户感受金融科技的力量,还促进了当地的经济发展。

2022年度城市金融服务优秀案例评选 乌鲁木齐银行 2022-10-03

九江银行:授信审批工具及调查报告智能化系统

“授信审批工具及调查报告智能化系统”是我行围绕信贷业务“贷前调查、贷中审查、贷后检查”三阶段,提升贷款三查报告(贷前调查报告、风险审查报告、贷后检查报告)“撰写、审查、修订”过程的智能性、专业性、效率性设计开发的系统工具,是我行“授信业务全流程线上化”工程主力系统之一。 该系统主要通过“报告模板创建、报告撰写、智慧审批、结构化数据搜集”四个功能模块,为信贷业务“营销尽调、审查审批、风险控制”人员提供业务支撑及决策管理服务。

2022年度城市金融服务优秀案例评选 九江银行 2022-10-03

日照银行:“黄海之链”供应链金融服务平台

黄海之链”平台于2021年8月18日上线,是日照银行推出的首个To B端金融服务门户网站。平台全面融合区块链、物联网、人工智能、大数据等智慧科技,将金融科技成果与实体经济场景有机结合,实现对产业链全链条、全周期、多维度金融服务需求覆盖,加速产业运行效率;通过数据要素全面运用,实现信息化、数字化和智慧管理;通过与商贸物流平台、交易市场、电子仓单系统等特色场景对接,打造“产业经济+金融服务”的数字化生态闭环,实现产业链交易全流程业务可视、数据可信、资产可控,有效解决上下游中小微企业融资难、融资贵问题。

2022第三届中小金融机构数智化转型优秀案例评选 日照银行 2022-10-03

贵阳银行:烟草e贷(烟商)

为进一步支持小微客户的稳定发展,精准支持小微客户稳定就业,提升小微客户金融服务质量和效率,贵阳银行通过引入省烟草局的烟草数据,采集多方数据信息进行比对,自建风控模型决策体系,2021年8月推出了针对烟草商户的自助贷款-“烟草e贷(烟商)”。“烟草e贷(烟商)”借助多方技术支持,实现贷款全流程线上化,大大降低小微企业融资成本,有效解决广大小微客户的融资难题,实现小微零售贷款业务“提速、增质、降价”。

2022年度城市金融服务优秀案例评选 贵阳银行 2022-10-03

重庆银行:乡村振兴青年贷

乡村振兴青年贷是重庆银行在共青团重庆市委、重庆市财政局、人民银行重庆营业管理部联合推出的“乡村振兴青年贷”项目基础上通过拓宽申请渠道、简化办理手续、丰富担保方式推出的重庆市首款专属青年人才“乡村振兴青年贷项目”特色信贷产品,具有资料简、额度高、利率低、审批快、担保方式灵活多样等优势。乡村振兴青年贷的推出,为投身乡村振兴、农业农村现代化发展的青年提供有力的信贷支持,助力农村人才振兴、产业振兴。

2022年度城市金融服务优秀案例评选 重庆银行 2022-10-03

案例库

金融行业全面的数字金融创新案例,涵盖历届“鑫智奖·金融机构数智化转型优秀案例评选”、“农村金融机构科技创新优秀案例评选”、“城市金融服务同业案例征集活动”等科技创新参评案例

  • 全国性商业银行
  • 风险管理
  • 实时业务监控系统

微信
咨询

微信咨询

扫码添加金科小助手微信号
咨询案例和解决方案相关信息
或联系对应机构