本文来源于:“鑫智奖”第五届金融数据智能优秀解决方案评选,作者:鼎茂科技

鼎茂科技:基于运维对象的一体化智能监控

2023-03-30 关键词:运维管理,开发运维,运维3843

一、解决方案简介


鼎茂的一体化智能监控解决方案,从基金行业的电商、APP、交易、商户等多类业务系统监测指标作为切入视角,通过对多源指标、日志、调用链、事件、CMDB等数据的统一治理和建模分析,跨系统、跨层级映射到基础设施,形成关联业务与IT设施的一体化智能监控体系,涵盖运行监测、趋势预估、端到端分析、告警管理、故障定位、容量预测等场景功能,帮助不同数字化阶段的基金机构轻松应对业务扩展和系统运行风险。


方案植入了鼎茂多年在基金证券行业的运维管理知识沉淀,根据各类管理角色视角设定运维管理对象,通过指标管理体系和AI分析,全面透视对象和对象、对象和指标、指标和指标之间的影响关系,将传统监控升级为基于对象的全域指标可观测。


二、应用场景痛点简介


随着基金行业机构的投资产品和客户数量快速提升,各类新业务不断扩展且日趋复杂,并叠加了各类创新技术的应用,导致信息技术方面各类基础和应用系统运行风险指数级增加,大多机构虽然已部署多种监控系统,但由于缺乏一体化、智能化的监控分析手段,在监控的全面性、日志有效分析、异常定位准确和效率、容量预估精细度等方面,已明显表现出不满足实际工作需求的现状。


105.png


基于上述技术情况,造成的管理痛点还有:


1.业务链路调用复杂且监控离散,容易造成大量业务故障

复杂的业务系统中业务功能调用多达几百个,功能间调用频繁,面对这些调用故障时,传统的性能监测及链路监测很难及时感知及发现问题,因此出现调用链路故障时,往往容易造成大量的业务故障。


2.基础IT设施和业务缺乏有效关联,问题无法快速定位

对于业务而言,其判断标准为:是否能够打开、慢不慢、是否卡顿、有没有崩溃。但这些业务系统的表象对于运维而言,需要通过大量监测手段和经验才能够匹配业务系统,传统监控和处理方式经常导致问题发生不能快速定位,造成业务停滞风险。


3.各系统间数据互不相通,复杂故障的权责定位耗时耗力

一个组件或者一次调用导致的事件,往往贯穿基础网络、硬件设备、虚拟机、中间件、数据库、负载均衡、API等环节,需要运维人员基于故障发生现象及经验去判断问题点,需要较高的运维能力及大量的时间成本。


4.对于各类网络安全威胁无法实时进行风险提示

在云和容器化等复杂IT架构下,链路上各类设备和应用日志结构化的综合分析变得更加复杂,难于辅助精细化定位各类攻击的行为与路径,实时进行风险提示。


三、解决方案亮点介绍


基于运维对象的一体化智能监控解决方案呈现模式紧贴业务系统和IT物理架构,实现南北向的紧密关联,不管是负责基础设施还是应用运维的员工,都能快速、清晰、准确地获取所需要的监控及分析信息,同时在管理及应用上,实现统一视觉,统一语言。


【技术优势】全流计算架构+分布式组件


106.png



考虑到数据时效性对监控运营类场景的重要性,系统采用全流计算体系架构。


数据治理:实时采集的数据,经过数据解析、字典附意和数据脱敏等实时计算,提升运维大数据质量,并且根据不同的数据应用场景进行数据分发,从而确保智能监控场景的顺利构建;


AI引擎:积累的关于指标时空多维预测和异常检测、日志智能分析和基于时空多维分析的根因定位等标准场景件的AI引擎,通过批处理与数据流式计算结合,实时产生数据洞察;


原子化组件:一体化智能监控系统中包含了低代码前端构建、数据模型映射、算法模型编排和流批任务配置等模块,有能力快速形成个性化智能监控场景。


【分析能力】时空多维分析


107.png


基于时间趋势上预测,对关键监测指标进行动态阈值检测,准确发现非常规趋势的问题或隐患。


基于信息系统架构的空间关系,关联起信息系统各层级关键监测指标,结合其时间趋势上的异常分析,对问题进行穿透,关联分析,发现造成关键业务指标运行异常,即信息系统业务运行存在问题或隐患情况的可能根源进行分析,帮助快速排障恢复,或隐患预防。


【功能架构】


108.png


【能力范围】

可协助基金机构搭建以下能力:


109.png


各类信息系统运行状态的监控

基于【智能监测中心】功能模块,提供完整的、端到端的IT基础架构、网络及业务应用程序可用性和性能综合监控,通过对系统和应用进行智能分组,来创建自定义的业务视图,更为有效地管理系统和应用。了解底层设备在每个业务流程中的运行情况以及哪些业务将受到影响,及时捕获各类系统报错及异常信息。


各类应用的跨系统数据勾稽

基于【智能分析中心】功能模块,根据不同业务,配置各类勾稽规则,实现不同系统之间各类关联业务数据的自动核对及告警,并通过平台页面及大屏*****时间发现异常。


各类业务结果的分析与监控

基于【智能分析中心】功能模块,使用时空多维离群分析,定位不同业务行为异常,进行包括频繁交易、频繁撤单和频繁交易失败等业务行为异常场景组合,以此对异常账号进行风险等级评估和预警。


各类攻击信息的分析与监控

基于【智能安全中心】功能模块,使用大数据分析结合机器学习算法,对基础架构内链路上所有的设备日志进行串联分析,精细化定位各类攻击的行为与路径,匹配特征库实时进行风险提示。


基础及应用系统运行趋势的分析

基于【智能预测中心】功能模块,对基础架构性能指标、服务吞吐指标、服务响应指标和业务容量等指标进行时空多维分析,实现业务容量预测、IT规模预测和吞吐增长预测等。


协助各类异常的快速定位

基于【智能定位中心】功能模块,针对基金行业较多业务系统架构相对稳定的特性,以业务问题为入口,在业务系统固定服务链路下定位根因组件和指标,再结合日志模式的异常检测与事件引发链的分析,实现更细粒度的问题根因定位。


【业务价值】

1.全面监控——覆盖基础硬件、应用系统的公司全领域。


2.问题溯源——通过时空多维算法,追本溯源,定位问题根源点。


3.趋势预测——合理部署基础资源,把控业务风险。


【场景故事】

某日电商渠道APP的成功率下降,失败率上升,响应率降低的情况;


通过多维定位分析,排查发现404错误代码,主要表现为请求无法访问,部分指标告警后成功率降低较为明显;


结合日志平台进行排查发现,均为来自**.**.*.**进入的多项请求,**.**.*.**为安全漏扫设备原因为**.**.*.**漏洞扫描引起的网关流量挤压,引起404无法访问的问题。


四、金融行业客户名单


华安基金、富国基金、上银基金、国金证券等。


五、客户评价


华安基金评价:

该解决方案基于我司运维管理现状,把握运维痛点,通过各类数据分析和AI算法对运行状态及趋势进行判断,及时发现各类问题,以免延迟处理造成的影响扩散,并在一些场景中防范风险问题的产生。在提升运维团队的工作效率与成果的同时,通过黄金指标的趋势预测,不仅对核心应用全技术栈性能进行预判,也让我们对计算资源的投资更有方向。

本网站案例,除特殊标明来源的,版权归金科创新社所有,未经许可不得转载,否则将视为侵权,对于不遵守此声明或者其他违法使用本文内容者,本网站依法保留追究权。另,本网站部分案例、观点文章来源于网络素材,如有侵权,请邮件联系 fenglei@fintechinchina.com 处理!
特别提示: 本网站免费为广大金融企业提供IT选型咨询服务,详情点击 【 需求提交 】

推荐阅读

更多

广东农信:自动化测试平台建设项目

随着广东农信的业务快速增长,软件产品的广泛使用,使客户对软件产品质量的要求不断提高,作为软件质量的重要保证,软件测试越来越显示出它的巨大优势。

2019第三届农村中小金融机构科技创新优秀案例评选 广东农信 2023-03-30

山东农信:集中运维监控平台项目

为保证日常运行维护工作的顺利开展,确保业务系统安全、稳定运行,山东省联社通过建设集中运维监控平台项目,完成了异构监控系统数据的集中,通过大数据技术对运维监控数据进行挖掘和分析,实现了对运维突发事件的监测、识别、评估与态势感知,有效提高了突发事件的处置能力,初步实现了由IT运维到主动运营服务的转变。

2018第二届农村中小金融机构科技创新优秀案例评选 山东农信 2023-03-30

福建农信:云平台“农信云”项目

随着福建省农村信用社联合社(下称 “福建农信”)规模不断扩大、业务不断增加,应用系统、设备、数据中心空间能耗都不断增加,IT运维各方面都面临种种挑战。

2017首届农村中小金融机构科技创新优秀案例评选 福建农信 2023-03-30

贵州农信:IT可视化运维管理体系建设方案

为切实满足业务连续性及监管部门要求,确保IT系统安全、高效、稳定运行,我社在观山湖数据中心建设过程中同步启动了IT可视化运维管理体系建设。

2019第三届农村中小金融机构科技创新优秀案例评选 贵州农信 2023-03-30

浙江农信:运维一体化管理平台

一体化运维平台的总体构架包括资产管理、自动化运维模块、任务管理、系统管理、单点登录等核心模块

2017首届农村中小金融机构科技创新优秀案例评选 浙江农信 2023-03-30

青海农信:基于产品化云平台实现IT利旧和云计算创新实践

面对云计算、大数据等新型IT技术的蓬勃发展,需要选择一款适用的云平台实现高投入产出比,同时具备持续服务能力、全局高可用能力、虚拟化能力、灾备能力等能够保障业务的不断拓展和安全。

2018第二届农村中小金融机构科技创新优秀案例评选 青海农信 2023-03-30

选型库

金融行业全面的数智化创新解决方案,涵盖历届“鑫智奖”参评方案及选型库会员机构提交的金融行业解决方案

  • 开发运维
  • 运维管理
  • 运维

微信
咨询

微信咨询

扫码添加金科小助手微信号
咨询案例和解决方案相关信息
或联系对应机构