本文来源于:鑫智奖·2025第六届金融机构数智化转型优秀案例评选,作者:四川银行

四川银行:新一代工程基于云平台分布式架构下的核心系统测试实践

2025-06-12 关键词:数字化转型,科技管理,金融服务4438

一、项目背景及目标


随着四川银行在高层领导下银行业务快速发展、规模激增以及响应时代号召大力推进本行数字化转型,行内的新一代工程核心系统采用了先进的云平台分布式架构(微服务+中台化)进行全新重构,以支撑至少千万级用户量以及亿万级业务交易量、以支持不同并发下资源自动扩缩、以及按企业级架构设计可灵活配置来作为建设目标。


新一代核心系统架构设计复杂,对质量保证提出了全新要求,给测试带来了全新挑战。比如,业务服务依赖数据流传导网状化导致故障发生时路径隐蔽难于明确;分布式事务、幂等防重控制等机制若失效引发资损风险增大;交易与核算异步分离时效一致性、正反场景下处理预期多样化;端到端全链路压测模拟真实真实生产流量形态困难等。


测试目标:验证四川银行云平台分布式架构下核心系统高稳定、高可用,在亿万级交易容量下各业务功能完整性和账务数据正确性,在异常环境或条件下系统及数据的容错性和一致性,确保系统高质量顺利投产。


二、创新点


四川银行基于云平台分布式架构下的测试创新性设计了三个维度的测试框架实践。


1. 平台及底座测试


对APASS交易服务平台深度测试 : 全链路业务场景覆盖,构建涵盖存款、贷款、资金往来及清算、分录计账等200+核心业务场景类关联系统的业务测试用例库,通过实际业务发起端场景分析、转化成精准系统信息、模拟生产情况下技术底座处理信息的全过程。图一中为测试分析框架可以参照:


imageimage1_1749691392.251852.png


图一、全链路业务场景分析和apass交易服务平台测试分析框架


故障注入与韧性验证:集成混沌工程平台,重点验证核心应用在高可用、自愈能力、节点故障、告警能力、资源弹性伸缩能力等是否满足设计规范。同时设计验证交易服务平台在注入扰动后发生系统接口不稳定或者接口不通的场景对核心应用系统各业务的影响程度。针对非本体系统,包括注册中心、配置中心、文件传输系统、COS对象存储、OB数据库、密管系统注入网络故障,以此验证这些应用系统对核心业务的影响程度。


imageimage2_1749691392.4013314.png

图二、故障注入验证测试流程图


2. 技术及中间件测试


1)分布式核心机制专项测试 :


a)幂等防重机制验证:设计高并发重复请求测试脚本,通过工具模拟高并发下,如1000+TPS的重复请求,覆盖短时高频(如10s内重复提交)、分布式节点并发(跨3+节点同时发起)等极端场景;注入Redis集群主从来回切换、Token过期时间漂移等故障,验证全局流水号(如雪花、时间戳、随机值组合算法)与Redis Token机制的协同容错能力;设计数据库唯一索引冲突、幂等组件异常等边界case,检查拦截日志与业务数据一致性。确保高并发重复请求100%拦截,业务零资损、拦截日志无漏判、系统吞吐量波动<5%等指标达到要求。


imageimage3_1749691392.4536998.png

图三、核心机制专项测试流程框架图


b)分布式事务健壮性测试:模拟TCC阶段故障,强制注入30% Confirm/Cancel失败、协调者节点宕机、网络分区,观察事务悬挂检测器(事务状态表+定时补偿)与空回滚拦截策略(前置业务检查)等生效情况;制造资源锁定冲突,在全局锁生效期触发并发事务,验证锁竞争处理机制及事务回滚效率;压测场景下统计事务恢复时效(SLA≤3s),检查事务监控大盘的异常告警覆盖率。验证事务最终一致性及异常防护,确保无脏数据、事务恢复符合SLA、异常捕获率100%。


c)单元化能力验证:通过注入自定义路由策略(如强制跨单元路由),验证ZoneID路由精度及故障隔离(单元宕机自动切流);在单元内制造200%负载进行闭环验证,检测服务调用链路闭环率(要求≥99.9%)及本地化数据访问比例;进行容灾演练,模拟同城双活数据中心50ms网络延迟,验证业务容忍度(支付类业务成功率>99.5%),切断单元间数据同步通道,检查降级策略(如本地读优先)与数据修复一致性。保障单元封闭性与异地多活可靠性,确保路由准确率100%、单元故障自动隔离≤30s、数据延迟容忍符合业务阈值。


2)关键组件健壮性测试:


a)序列号生成器:通过10万级TPS压测及节点宕机故障注入,验证雪花算法在时钟回拨、WorkerID冲突场景下的ID唯一性,要求重复率为零且性能波动≤5%。


imageimage4_1749691392.5419.png

图四、中间件部署模式测试设计流程图


b)分布式锁:模拟锁持有节点宕机、网络分区场景,测试锁自动释放机制与死锁检测效率,要求锁失效防护率100%,故障恢复时效≤1秒。


c)消息队列:制造Broker宕机与网络抖动,验证事务消息二次投递、死信队列管控及消费端幂等拦截能力,消息零丢失且重复消费拦截率100%。


d)应用监控:在资源过载(CPU>90%)及网络延迟(500ms+)场景下,验证指标采集延迟≤3秒,多维度告警(如超时率突增)准确率≥99.9%。


3. 业务及账务测试


交易核算分离下的专项核算测试:


准实时对账引擎:构建独立核算流水与业务流水准实时比对测试框架,采用全局流水号精准匹配,识别差异并提交缺陷跟踪。 具体可参照图五中测试框架流程:


imageimage5_1749691392.626059.png

图五、准实时对账引擎测试框架流程


2)大数据量批量核对:测试基于Spark的离线核对任务,处理T+1日亿万级流水,支持多维差异分析(渠道、产品、账户)。


3)核算规则引擎验证:覆盖复杂利息计算、手续费分摊、多维度账簿(如客户账、内部账)的准确性测试,验证2000+会计科目逻辑,确保会计准则符合性。整体核对规则按照如下列举矩阵实施(下图为样例,科目及数据不代表真实情况):


规则类型验证场景数会计科目案例说明
利息计算1206011利息收入等额本息罚息复利计算
手续费分摊802241应付手续费多机构按比例分摊(银联/收单方)
多账簿协同601002银行存款/3010实收资本客户账与内部账同步过账
。。。。。。。。。。。。


4)数据一致性穿透校验:使用跨微服务、跨数据库的实时数据比对工具,基于全局流水号为相关信息关联性来精准核对上下游金额数据,确保交易链路上各环节状态与账务数据强一致。具体执行过程拓扑图可参照图六信息:


imageimage6_1749691392.7126513.png

图六、全链路核对拓扑图


三、项目技术方案


1.  测试策略与方法


1)耦合分层测试策略:构建四级递进式验证框架:单元-> 集成 -> 系统-> 混沌,实现从代码开发到生产环境的全栈质量防护。


a)单元测试:覆盖核心逻辑分支(覆盖率≥85%),聚焦代码健壮性。


b)集成测试:验证微服务接口契约,故障隔离能力。


c)系统测试:端到端业务流验证(存款/贷款全链路),满足200+业务场景覆盖。


d)混沌测试:注入基础设施宕机、网络隔离、数据混乱等故障,验证RTO≤30s/RPO=0。


2)版本迭代测试策略:深度集成DevOps平台,形成“开发-测试-发布-监控”闭环,发布效率提升50%。


a)自动化触发:代码提交/合并请求自动触发P0级用例集(单元+接口测试)。


b)质量门禁:构建环节嵌入测试报告分析(通过率100%准入),拦截缺陷渗漏。


c)环境协同:对接K8s动态生成测试沙盒,自动部署版本并执行系统测试。


d)混沌自治:生产环境灰度发布后自动触发混沌实验,监控业务指标波动。


3)条件分类测试策略:


a)类生产配置:对照生产上的资源配置、部署配置、技术参数、业务参数开展混沌工程。例如,对基础设施、操作系统、数据库、容器和中间件、网络传输、业务应用处理的配置,以及信创设备和环境兼容性测试。


b)时间一致配置:与核心关联200+业务系统、数据加工和数仓系统、集中批次处理系统保持日期一致性下开展技术标准一致性、跑批计结息测试、业务流水和技术标准一致性测试 。


c)数据容量配置:迁移后存量数据和新增数据,在亿万级交易下数据的完整性、容错性、一致性测试,保证交易信息和核算金额在端到端链路上的实时分离性和正确性。


四、项目过程管理


1. 测试框架范围  


imageimage7_1749691392.777767.png


图七、测试范围全景框架图


基于设计的三个测试框架,根据核心系统云平台分布式架构分析后确定测试范围:


1)平台及底座测试范围


a) 全链路业务场景覆盖,测试范围:存款、贷款、支付、清算等200+核心业务场景的生产级流量模拟,端到端交易链路可靠性、业务逻辑准确性、资损风险拦截。


b) 故障注入与韧性验证,核心应用:高可用(AZ级宕机切换)、自愈能力(进程/容器自动重启)、资源弹性(CPU/内存动态伸缩)、告警时效(故障发生→告警≤10s)apass交易服务平台:注册中心/配置中心网络隔离、文件传输/COS存储访问中断、OB数据库主从延迟注入、密管服务异常熔断,确保核心业务SLA稳定性(成功率≥99.99%)、故障爆炸半径控制。


2)技术及中间件测试范围


分布式核心机制专项测试,主要基于以下标准进行测试范围覆盖:


组件测试场景验收指标
幂等防重机制高频重复请求+Redis集群故障+索引冲突拦截率100%,资损=0
分布式事务(Seata)TCC阶段失败+协调者宕机+全局锁竞争事务恢复≤3s,脏数据=0
单元化能力(LDC)跨单元路由+数据延迟50ms+同步通道切断路由精度100%,闭环率≥99.9%



关键组件健壮性测试,主要基于以下标准进行测试范围覆盖:


组件故障注入场景韧性要求
序列号生成器时钟回拨+节点宕机+10万TPS压测ID重复率=0
分布式锁(RedLock)锁节点宕机+网络分区死锁解除≤1s
消息队列(RocketMQ)Broker宕机+消息重复投递消息零丢失,拦截率100%
应用监控资源过载(CPU>90%)+采集延迟告警准确率≥99.9%


业务及账务测试范围


交易核算分离专项测试,主要基于以下标准进行测试范围覆盖:


模块验证内容关键指标
准实时对账引擎业务流vs核算流秒级匹配(全局流水号)差异捕获延迟≤3s,漏检率=0
批量核对(Spark)亿万级流水T+1核对(渠道/产品/账户维度)处理时效≤4h,准确率100%
核算规则引擎复利计算、手续费分摊、多账簿协同符合IFRS9准则,误差≤0.01元
数据一致性穿透校验跨5+微服务+异构DB的账务状态强一致断裂点定位≤1分钟


2. 测试环境规划


imageimage8_1749691392.9401212.png


图八、测试环境规划框架图


依照测试框架的测试范围需要,整体做了如图八的测试环境规划,区分为功能测试环境、非功能测试环境、数据测试环境,具体各环境使用目的可参照以下表格信息内容:


16.png


3. 工具应用规划  


1)测试工具一体化平台:统一纳管所有测试框架案例,支持耦合分层、版本迭代、条件分类执行策略在不同测试阶段下的智能应用和执行,借助工具实现测试方案自动设计、测试任务自动下发、结果数据自动统计。


2)混沌测试Mock平台:动态对云平台、中间件、数据流、第三方服务等故障注入(响应超时5000ms+、错误码注入、报文篡改),借助工具实现银行核心系统端到端业务下的(如银联/人行支付)的异常级Mock。


3)环境运维监控平台:在测试环境接入可观测平台,对测试环境实时监控与告警验证,借助工具实现全链路数据流指标采集以及缺陷问题精准定位。例如,智能基线告警:自动学习流量模式,突增/暴跌精准识别(误报<0.1%),混沌实验联动故障注入期间自动监控业务SLA衰减,触发熔断决策位点。


五、运营情况


本测试实践已在四川银行核心系统升级项目中推广使用,累计支撑数次重大版本发布。核心经验形成相关内部标准,并通过技术社区分享辐射同业。自研的测试工具一体化平台已荣获鑫智奖。实践期间累计发现深层次架构缺陷100+,其中高可用设计缺陷占比15%,有效拦截了潜在资损与故障风险。


六、项目成效


1、经济效益:


借助测试框架设计,将发现的缺陷和修复缺陷局限于有限的范围,借助于耦合分层、版本迭代、条件分类测试策略将发现的缺陷和修复缺陷局限于有限的阶段,后期回归测试人力成本大幅度降低,开发修复缺陷技术成本大幅度降低,缺陷在项目早期发现和修复为系统版本迭代发布周期平均缩短30%。


2、社会效益:


经过充分测试的高质量系统投产,能有效支撑千万级用户交易使用稳定性与资金安全,提升客户对银行系统的信任度;云平台以及基础资源、分布式架构国产信创后的稳定运行进一步为金融同业夯实了技术国产化信心;为金融业数字化转型及新技术应用树立了标杆以及为社会培养了测试综合型人才。


七、经验总结


本次测试实践成功验证了 “深度架构认知 + 高效工具链 + 真实生产仿真 + 规范流程管控 + 跨域协同” 五位一体测试体系的有效性。深度剖析分布式架构事务、幂等、单元化等核心机制,是精准设计验证方案的前提。自研全链路追踪、混沌测试等工具,大幅提升测试效能。1:1 生产仿真环境结合真实流量注入,高效挖掘复杂系统问题。同时,严格的质量门禁、缺陷分级处理流程,为系统零故障上线筑牢防线。测试、开发、运维、业务多部门深度协同,打破信息壁垒,保障项目高效推进。未来将聚焦 AI 技术应用,在测试用例生成、异常预测、根因分析等环节发力,加速智能化、自动化测试转型,持续提升项目质量与效益。


本网站案例,除特殊标明来源的,版权归金科创新社所有,未经许可不得转载,否则将视为侵权,对于不遵守此声明或者其他违法使用本文内容者,本网站依法保留追究权。另,本网站部分案例、观点文章来源于网络素材,如有侵权,请邮件联系 fenglei@fintechinchina.com 处理!
特别提示: 本网站免费为广大金融企业提供IT选型咨询服务,详情点击 【 需求提交 】

推荐阅读

更多

胡震:构建数字金融服务生态,探索数字化转型新路径

为贯彻落实《国务院关于全面推进乡村振兴加快农业农村现代化的意见》总体部署,全面推进乡村振兴,进一步加大支农惠农力度,有效支持当地畜牧业发展,切实解决畜牧经营主体融资难、融资贵及担保难问题。

金融电子化 胡震 2025-06-12

中信建投证券:基于AI大模型的多智能体技术在投顾领域的应用案例

该案例以大语言模型为核心,融合 RAG、Agent技术,构建“主 Agent+子Agent”架构,覆盖投顾全场景,包含个股分析助手、策略分析助手、产品分析助手。亮点包括:技术上实现知识可溯源与复杂任务规划;业务上赋能B端投顾效率、C端个性化服务;实施上分阶段落地,配套三级评测与合规体系;商业模式探索C端增值服务与B端技术输出。重点打造可信可控的智能投顾平台,推动证券投顾AI智能化转型,该平台服务于总部投资顾问,为行业首批实现案例。

鑫智奖·2025第六届金融机构数智化转型优秀案例评选 中信建投证券 2025-06-12

贵阳银行:写好“数字金融”大文章,赋能高质量发展新活力——“超级APP”体系打造

在全国大力发展数字经济,中央对数字金融高质量发展提出新要求,银行业全力推动数字化转型的背景下,贵阳银行聚焦零售线上渠道服务能力的全面升级,围绕“方便、快捷、吸引、依赖、获得”五大核心要求,整合零售条线流量,构建统一获客、统一营销工具,着手打造“线上场景+客户权益+金融服务”的“超级APP”体系,为客户提供触手可及的智能化、一站式综合金融服务。 “超级APP”作为贵州省内首批实现鸿蒙原生应用上架的城市商业银行应用,用户无论在安卓、iOS还是鸿蒙版手机银行上,都能享受到规则一致、体验一致的金融服务。

2024年度城市金融服务优秀案例征集活动 贵阳银行 2025-06-12

北银金科:金融操作系统智能化软件测试体系建设

智能化软件测试基于金融操作系统"五个统一"原则的系统设计,深度整合测试资源,构建全链路测试流程与资产复用体系,在保障系统稳定性的同时显著降低测试成本,形成可插拔的智能测试组件生态。

鑫智奖·2025第七届金融数据智能优秀解决方案评选 北银金科 2025-06-12

南京银行:AI应用探索与创新实践

近年来,伴随AI技术的快速发展,智能化为推动银行业务变革与数字化转型提供了全新动力,尤其在优化业务流程、提高运营效率、提升客户体验、强化风险防控等方面发挥着重要作用。例如,基于智能化的算法设计、AI技术广泛应用于电话银行、网上银行、手机银行等渠道,甚至在某些特定场景中,智能客服机器人已基本可实现对答如流。顺应这一趋势,南京银行在全方位强化AI布局的基础上,深入开展了数字员工营业厅建设实践,并终取得了良好成效。

中国金融电脑+ 张银川 王桂庆 2025-06-12

国元证券:企业综合金融服务协同系统建设项目

国元证券通过建设企业综合金融服务协同系统,构建“场景+数据”营销服务体系,实现数据驱动->场景应用->业务一线的数字化支撑。实现对销售人员从拓客、展业到业务协同一站式支持,助力管理层进行有效的经营决策。 本项目在信创化、数字化、智能化等几大维度创新实践。在业务上,实现智能化的企业全生命周期管理与多端协作模式实现业务场景化适配。在技术上,融合低代码技术快速开发与微服务技术深度治理,并顺应国产化的创新实践。

鑫智奖·2025第六届金融机构数智化转型优秀案例评选 国元证券 2025-06-12

案例库

金融行业全面的数字金融创新案例,涵盖历届“鑫智奖·金融机构数智化转型优秀案例评选”、“农村金融机构科技创新优秀案例评选”、“城市金融服务同业案例征集活动”等科技创新参评案例

  • 数字化转型
  • 科技管理
  • 金融服务

微信
咨询

微信咨询

扫码添加金科小助手微信号
咨询案例和解决方案相关信息
或联系对应机构