本文来源于:2022年第六届农村中小金融机构科技创新优秀案例评选,作者:福建农信

福建农信:手机银行移动端性能监测服务

2022-10-10 关键词:农信/农商行,手机银行,数据平台与数智应用 2392

一、项目背景


随着互联网金融平台的普及以及银行向移动数字化转型的推进,近年银行业务的开展逐步由线下向线上平台转移,特别是受到新冠肺炎疫情影响,越来越多的用户更倾向于在手机银行完成支付、转账、理财等业务,手机银行APP的重要性日益增强。自2016年起,银行业平均业务离柜率呈上升趋势。移动互联网时代,手机银行APP作为银行终面客的主要载体,已经成为银行数字化经营的关键发力点和竞争主战场。


132.png


至2022年9月末,福建农信手机银行客户1286万户,每日接待超过40万客户,日处理交易笔数近50万笔,交易金额90亿元,其中月度有登录客户近350万户,交易客户数近240万户。根据规划,下一阶段福建农信手机银行将紧紧围绕开放化、智能化、情感化、精细化和互动性原则,努力实现场景获客、内容聚客、互动活客、生态留客目标,打造为福建农信业务的中心枢纽,促进手机银行逐步从交易支付的工具向着广泛连接的场景服务平台转型。


133.png


为了在手机应用转型,版本不断迭代过程中,保障业务可靠平稳,同时,也需要从客户真实使用的体验中发现APP性能体验洼地,找到优化的点。所以,启动了此项目,对互联网银行客户端(含福建农信手机银行、村镇版手机银行)进行应用数据的监测统计,监测应用运行情况,分析用户使用情况,按需导出统计报表。通过移动端数据分析,以达到监控业务数据、辅助崩溃定位、分析受众行为、促进产品优化升级的目的。


二、项目方案


手机银行APP整个监测属于被动式监测,需要将SDK包植入到APP中,当用户开启APP后,性能数据将会被自动抓取,并根据预设的数据采集规则自动回传到监测平台进行分析。


134.png

监测平台分为应用概述、性能分析、关键元素、问题分析、体验大屏、客服检索、仪表盘、应用设置、智能报警、自动报告和系统管理等多个功能模块。管理人员通过丰富的报告查看监测结果,对APP运行中的性能状态进行分析;也可对每一个APP进行多维度的智能报警设置,降低由性能因素带来的损失。除此之外,灵活的过滤器设置,既可按APP运行需要进行数据多维度过滤,作针对性优化。


135.png


1.“应用概览”模块,宏观掌握App质量,判断问题归属


“应用概览”模块,帮助平台使用人员宏观掌握App质量,判断问题归属。该模块展示是当前账号下所有APP应用性能、问题数据信息。涉及概览和拓扑两部分,包括:

概览:展示App的活跃会话数、活跃设备数、响应时间、下载速度(CDN)、请求错误率、应用崩溃率等关键指标,并可进一步钻取。 

拓扑:透视前端代码、网络性能(自身、CDN及第三方服务)及错误。


136.png


2.“性能分析”模块,全面了解APP性能情况,及优化环节


性能分析主要服务于运维人员,通过对网络请求、H5页面、设备、版本及流量等多维度统计分析,了解APP 整体性能,掌握慢请求及其分布规律,定位影响性能的环节。


137.png


同时,通过CDN 性能、解析建连、地区组合等分析模块,帮助运维了解支持APP 的网络运行情况,了解承载业务的机房、云主机及CDN 等第三方的服务质量及业务部署情况,为运维人员排障、优化提供参考建议;通过视图分析模块,帮助研发人员,直观掌握视图启动效果及视图启动分布情况,便于视图优化和问题处理。


138.png


3.“问题分析”模块,复现异常问题,快速排查并处理


将APP涉及的问题实现集中管理,帮助研发人员快速发现、定位问题,并及时优化,提升APP应用的可用性。涉及的问题包括:应用崩溃、卡顿、慢交互、ANR、请求错误、劫持分析、JS错误等七个模块,如下图所示:


139.png



4.“在线诊断-问题检索”模块,对终端环境或异常问题进行信息检索,提高问题排查速度及服务主动性


通过设置查询条件对不同的功能模块中的数据项进行查询。支持对慢请求、错误请求、应用崩溃、自定义异常、卡顿、ANR、JS错误、关键元素性能、关键元素错误进行检索。

 通过使用客户ID(设备***ID或通过SDK接口对接的用户信息)、用户ID、用户信息、请求URL检索条件进行检索,通过性能和问题的检索条件,快速查找问题点,便于研发人员快速检索解决问题。


140.png


三、创新点


1.技术创新获取网络层数据


监测平台,同时获取HTTP和TCP通讯协议的性能数据,了解整个请求过程中每一个阶段的耗时情况,如DNS耗时、TCP建连耗时、请求耗时、响应耗时、传输耗时,真正做到APP“全方位”监测,从而帮助运维人员快速定位故障点,减少故障历时和运维成本。


141.png


2.获得性能和行为数据


监测平台,融合了性能和行为数据,并进行实时交叉分析,寻找性能指标和行为指标联动性,便于问题定位及影响范围和影响的用户行为。


3.支持移动端混合式应用


支持原生和混合式开发模式,完全做到Android和iOS同时支持,而且指标一致,完全满足市面混合式应用开发的行业主流开发方式。


4.支持移动端混合式应用


通过平台的应用性能数据监控,性能监测可视化平台可以清楚地了解从支持应用到终端用户体验的系统行为,可以有效的帮助改善应用的用户体验,提升业务转化,提高用户粘性,减少用户流失,提高手机银行运营效率。


四、技术实现特点及优势


系统主要由前端数据采集SDK Agent、Controller集群、数据预处理ETL集群,数据聚合、存储及在线查询Zeus集群、Web集群及其依赖的Redis、Kafka、Druid、HDFS、Mysql、NFS(HBase)等核心组件组成。各组件服务均采用集群部署,支持横向扩展。


142.png


部署方案上,数据采集Agent以SDK方式部署于外网终端用户手机目标APP中,前端负载均衡设备和Ngnix转发集群部署于DMZ区域,其它服务和组件均部署在内网环境中。部署于内网各集群节点须开启ntpd时间同步服务,保证系统内部整体时钟一致性。


系统能在部署上复用现有大数据平台的相关组件,且支持采集后的数据转发到行内大数据平台,提供对导出的数据进行定制化二次开发。


143.png


1.同时支持HTTP、HTTPS(1.0/1.1,2.0版本协议)、WEBSOCKET、SOCKET、QUIC(HTTP3.0)


监测平台,同时获取HTTP、HTTPS、WEBSOCKET、TCP、QUIC通讯协议的性能数据,HTTP和HTTPS支持1.0/1.1版本、2.0版本、3.0版本(QUIC)协议,了解整个请求过程中每一个阶段的耗时情况,真正做到APP“全方位”监测,从而帮助用户快速定位故障点,减少故障历时和运维成本。

帮助用户“完整”了解APP性能情况,让APP的性能状况更透明。


144.png


2.监测指标更细


细化到以请求为单位,不但可以监测每个请求的整体耗时,更可以监测整个请求过程中每一个阶段的耗时,如:DNS耗时、TCP建连耗时、请求耗时、响应耗时、传输耗时。

对性能状态进行更细致的剖析,能让用户更快速、更精确地定位APP的性能瓶颈,缩短了APP 瓶颈的分析及定位时间,减少了运维成本。


145.png


3.错误类型更多


不但可采集HTTP错误,更可采集TCP错误,全面反映APP发生的网络错误。

充分了解APP异常的原因,避免因网络错误统计不全而产生的误判。


4.崩溃信息更全面


将APP崩溃问题按照具体原因进行统计分类,获取每一种崩溃原因的详细崩溃堆栈信息。此外,还可以对每一崩溃原因进行OS版本、设备型号和APP版本的分布分析,进一步定位可能引起崩溃的因素,并且可直接标记问题状态,便于对问题进行管理。平台同时为每一个崩溃样本提供出现崩溃前的操作路径。

便于研发人员定位产生崩溃的原因,研发人员可以判断每一种崩溃是否与设备类型/OS版本/APP版本有关,以便及时修复或发布通知;可以快速对问题进行复现,提高修改效率;可直接在平台上对崩溃问题进行管理,快速过滤未解决或再次出现的问题。


146.png


147.png


5.设置更灵活


可按照地域或主机进行更精确的报警设置,系统报警时,可定位到具体的地域或主机;对于接收到的样本数据可以进行报警周期的自定义的设置;系统提供完备的报警条件设置,包括设置样本数量、持续周期、异常样本比例等条件。


在告警设置方面,对网络性能风险进行提前报警,可以减小网络投资上的损失。通过对告警进行区域划分,把报警具体定位到某个地区或某台主机,可以帮助判断是普遍存在的网络性能隐患,还是只是某个局部存在隐患,便于准确处理。同时也可避免因样本数量不足而产生的无效报警。


148.png


6.报告数据更精确


灵活的过滤器设置,可以为用户过滤掉无效或不想关注的数据,使报警和报告更精准。平台提供超过60种报告,对业务数据和性能数据分别进行了统计分析;对于性能数据,可以从视图、主机、域名、地域、 运营商、接入方式、OS版本、设备型号、APP版本等维度进行全面分析。


149.png


管理人员不用担心在报警的样本中掺入了因信号质量导致的响应时间过长的样本,灵活的过滤器设置可以将这些数据排除,使报警变得更真实、更有价值。若只想关注某些特定人群时(例如:重要的城市、某个运营商、某种接入方式),或想讲信号不好的样本数据排除掉时,可以通过过滤器对报告进行过滤,真正做到组成报告的每一个样本数据都是真实需要的。


150.png


五、项目过程管理


福建农信于2021年4月启动客户体验升级项目,9月完成系统编码、测试和上线准备,正式上线手机银行IOS版本、安卓版本移动端性能监测,服务于生产上超过千万的手机银行客户群体。


六、运营情况


构建跨部门运营价值链,形成价值闭环。数字化时代,业务、运维、开发,每一个角色都不是孤岛,需要持续且实时的监控和洞察,帮助组织在优化客户体验、现代化运营、加速创新上不断提升,终在数字化浪潮中转型成功。其中,数字转型举措的主要成果之一就是改善客户体验,每一个终用户交互都是至关重要的,都将影响业务收入和获取新客户。通过手机应用体验监控平台构建的指标体系,包含:应用整体体验指标、性能分析指标、关键元素指标等,形成了日常运营的用户体验监控流程,打通了从业务侧往研发侧的应用体验反馈机制,同时,也形成了研发侧的优化绩效与应用APP体验数据提升的关联。把业务部门、运维部门和研发部门三个角色形成一个紧密的闭环。


151.png


项目上线后,一是通过对客户端性能监测的整体定位 (如2022年6月的监测时段内,手机银行-安卓版本的平均响应时间为0.069s;请求错误率3.94%;崩溃率0.35%;卡顿率18.68%;慢交互率0.02%;ANR率0.25%。整体响应性能虽有抖动,整体情况较为平稳,请求错误率较高,需要进一步观察),观察出现故障的常见机型,准确找准问题,进行定点优化,保障生产客户使用体验。二是通过对客户行为的分析(如在某日00:00-15:00期间,总行-安卓版本新增14047个新用户,日活跃数此时为99847个,活跃数与昨日此时对比提升2%,启动次数192120,启动数与昨日此时相比下降了3%,活跃用户数逐日提升;每日白天期间用户数较高。在监测周期内应用累计用户为997998个,平均每个人启动了16.62次APP,周活跃和月活跃(昨日)都比较高。)等,帮助业务人员分析客户偏好行为,更好制定客户营销策略。


七、项目成效


1.帮助企业快速定位问题,节约成本


当APP发布后,不但很难预知是否会出现各种问题,而且很难定位问题原因。APP的运营人员往往只能看到结果。当他们想了解APP问题对业务的影响时,需要运维以及研发人员投入很多的时间、很大的精力去分析问题、定位问题原因。但是否真的有效果,还要持续关注APP的运营结果来判断。这对公司来说,成本高,效率低。通过使用监测平台,运营人员可以直观的根据活跃设备数的变化来判断用户数量的变化情况;运维人员可以清晰的了解当前APP的应用性能情况,是否是因为非代码原因导致的APP用户体验下降,准确发现并定位网络性能异常的原因;研发人员可以根据崩溃信息及时了解发生崩溃的频率、覆盖的设备类型、操作系统,甚至可以复现每一个崩溃发生的过程,便于快速解决问题。对运营来说,既高效、有节约了成本。


152.png


2.协助持续关注APP性能状态,并得到实时反馈


对于APP研发部门来说,往往需要实时关注已经上线的APP的状态。一方面,可以及时发现崩溃以及应用性能问题并*****时间处理;另一方面,可以根据使用者的使用结果对APP进行进一步优化。但实际中,不可能安排专人实时查看监测结果,当APP出现问题时,并不能及时发现。 

通过使用监测平台,一旦开始对APP进行检测,系统会持续不断地接收所采集的样本数据,接收的周期为每分钟一次,以保证用户每次看到的报告数据都是新的,真正做到对APP的实时跟踪。并且当发现潜在的网络性能隐患或崩溃率达到一定标准时,会以报警的形式*****时间发送,得到及时处理,大限度降低损失。


3.协助建立APP运营管理机制


以往运营和研发部门的工作绩效与业务绩效关联性很少,在机房里面的系统运行指标与业务指标之间,没法建立有效关联,整个管理逻辑和决策缺乏必要的数据支撑。通过监测平台从用户体验、运营商服务到应用系统服务,端到端地打通了全链路的监控。管理层可依据平台给出的各维度、各层面的技术指标,及真实用户的体验数据。将问题*****时间定位到相关职能部门,大大减小故障响应时间,提升工作效率。


4.直观透视业务对性能的影响


决定APP价值的四因素其中之一就是持续的产品功能和性能改善。随着业务拓展与调整,势必需要进行相应版本的迭代和功能更新。监测平台所展现的数据都是实时的,能够帮助管理人员在由于业务变动而产生功能变动的同时,了解APP性能的情况,真正透视业务与性能的关联。


八、经验总结


“以客户为中心,为客户创造价值”。为实现这个目标,建立全行客户体验管理体系在数字化转型背景下显得尤为重要。其挑战在于“部门银行的竖井已越来越难以满足客户的综合化服务需求”,客户体验管理不能再在单个条线或渠道范围内独立进行。因为以端到端的视角审视银行的客户旅程以及影响体验的间接或者直接触点,客户旅程往往会跨越多个渠道、多个条线。建立全行统一的战略性客户体验管理体系具有重大意义,而从运营板块视角切入客户体验管理体系的意义,在于运营板块涉及多渠道多条线的协调,其统筹全行的客户体验体系的建设和迭代优化具有优势。


性能优化不是更新一两个版本就可以解决的,是持续性的需求,持续集成迭代反馈。在实际的项目中,在项目刚开始的时候,由于人力和项目完成时间限制,性能优化的优先级比较低,等进入项目投入使用阶段,就需要把优先级提高,但在项目初期,在设计架构方案时,性能优化的点也需要提早考虑进去。


移动端性能监测服务上线后,对我社互联网银行客户端(含福建农信手机银行、村镇版手机银行)进行应用数据的监测统计,监测应用运行情况,分析用户使用情况,按需导出统计报表。通过移动端数据分析,以达到监控业务数据、辅助崩溃定位、分析受众行为、促进产品优化升级的目的。

本网站案例,除特殊标明来源的,版权归金科创新社所有,未经许可不得转载,否则将视为侵权,对于不遵守此声明或者其他违法使用本文内容者,本网站依法保留追究权。另,本网站部分案例、观点文章来源于网络素材,如有侵权,请邮件联系 fenglei@fintechinchina.com 处理!
特别提示: 本网站免费为广大金融企业提供IT选型咨询服务,详情点击 【 需求提交 】

推荐阅读

更多

河南农信:基于大数据平台的智能审计管理信息系统

随着河南省农村信用社各项业务的飞速发展及信息化建设的不断深入,创新性金融产品和金融服务不断涌现,业务数据和业务流程复杂程度不断提高,交易信息和管理信息不断膨胀。

2018第二届农村中小金融机构科技创新优秀案例评选 河南农信 2022-10-10

安徽农信:基于人工智能的滨湖数据中心基础设施能效优化

数据中心基础设施能耗巨大,数据中心节能能够带来显著的经济和社会效益。而在数据中心基础设施中,空调能耗又占到全部能耗的70%,本项目通过将人工智能应用到数据中心基础设施空调系统运行控制中,为安徽省联社乃至金融行业数据中心基础设施节能降耗探索一条智能化创新的道路。

2018第二届农村中小金融机构科技创新优秀案例评选 安徽农信 2022-10-10

湖北农信:智慧学习平台

智慧学习平台的建设广泛运用互联网新媒体技术,集教、学、练、考评等要素,通过数字化学习运营将其打造为兼容、开放、共享、规范的多元一体化学习载体,成为全省农商行系统的学习中心,考试中心、直播中心、制度图书中心、员工交流中心,有效地提高了员工学习的时效性、便捷性和覆盖面,成为全省农商行“智慧银行”的建设重要载体。

第五届农村中小金融机构科技创新优秀案例评选 湖北农信 2022-10-10

江西农信:“百福快贷”项目

网络信贷项目依托互联网技术,采用全流程“不落地”线上操作模式,以大数据应用为基础,实现贷款申请受理、审批、放款、回收和贷后管理全部在线完成,整个贷款审批流程无需人工参与,实现了系统几分钟内自动产生审批结果,真正意义上达到了可足不出户就可完成贷款申请和收到贷款的目标。

2018第二届农村中小金融机构科技创新优秀案例评选 江西农信 2022-10-10

江苏省联社:风险偏好与限额管理系统

本项目旨在建设统一风险数据集市,打通风险管理相关数据,建立风险偏好与限额管理系统,提高各类风险识别、计量、监测和数据分析的能力,并提供给农商行风险管理相关的数据支撑,以帮助农商行进行合理的业务拓展与风险管理决策。

第五届农村中小金融机构科技创新优秀案例评选 江苏省联社 2022-10-10

重庆农商行:基于数据决策的全线上零售信贷产品“渝快贷”

“渝快贷”是重庆农商行推出的基于数据决策的个人全线上信用消费贷款产品。

2018第二届农村中小金融机构科技创新优秀案例评选 重庆农商行 2022-10-10

案例库

金融行业全面的数字金融创新案例,涵盖历届“鑫智奖·金融机构数智化转型优秀案例评选”、“农村金融机构科技创新优秀案例评选”、“城市金融服务同业案例征集活动”等科技创新参评案例

  • 农信/农商行
  • 手机银行
  • 数据平台与数智应用

微信
咨询

微信咨询

扫码添加金科小助手微信号
咨询案例和解决方案相关信息
或联系对应机构