本文来源于:2024年“鑫智奖”第六届金融数据智能优秀解决方案评选,作者:浪潮信息

浪潮信息:面向金融数据中心的智能统一存储管理平台InView

2024-03-01 关键词:运维管理,IT运维,智能运维3487

一、解决方案简介


浪潮信息面向金融数据中心推出智能统一存储管理平台InView是通过AI技术实现存储自治,即自我管理、修复、调优,提高存储系统的性能、稳定性和易用性,降低存储使用的复杂性,简化运维,实现金融数据24小时在线。


近几年,伴随金融科技的深入发展,浪潮信息一直在致力于该方向研发和探索新特性,目前推出了面向金融数据中心的智能统一存储管理平台InView, 包含了4个预测和2个自动化智能运维功能特性。


四个预测分别为包括提前两周识别风险磁盘,降低数据丢失风险;智能预测性能增长需求,预知性能瓶颈;智能预测容量增长需求,给用户提供科学、准确的扩容建议;预测SSD使用寿命,精准到天。两个自动化分别为性能瓶颈分析,通过端到端诊断分析,快速发现存储性能瓶颈状态,并能定位根因;性能自动调优,结合金融行业应用场景和用户IO模型,自动挖掘优的客户端配置和存储端配置,并主动推荐配置给需要的存储系统和用户。


二、应用场景痛点简介


随着金融科技深入发展,金融大规模、新型数据中心迅速崛起,数据量呈指数级增长,同时各种新存储介质和技术的应用,使得存储系统变得越来越复杂。在运维管理上,完全依赖人工已经不能满足需求,企业将更多依靠人工智能进行自动化运维,Gartner认为AIOps的广泛应用将让IT基础设施管理变得更主动、更具预测性,减少管理和停机成本。


以金融数据中心的核心基础设施——存储系统为例,目前的存储系统中具有大量的可调参数,大规模分布式存储系统的软硬组件多,内、外部参数多达两千多个,且90%的参数为数值型和布尔型,参数的可调范围非常大,修改这些参数往往会对系统性能产生不同的影响。通常默认的参数配置由供应商提供,这些参数值的组合一般都不是优的参数集合。研究表明,即使调整一小部分的参数值,也可以将系统的能耗和性能效率提高数倍以上。


传统的参数调整是由系统管理员依据自身的专业知识和经验完成的,由于存储系统的复杂性不断提升,手动调参将较难适应大规模的存储系统,并且人工调参具有无法全天候的监控以及高额的人力成本等问题。如何结合具体应用场景,在存储默认配置和性能数据基础上,自动挖掘优的存储配置,并主动推荐配置给需要的存储系统,对存储系统的性能优化具有重要意义。


104.png

分布式存储AS13000参数分布


三、解决方案亮点介绍


浪潮信息面向金融数据中心推出的智能统一存储管理平台InView,将带宽提升41%、时延降低29%,实现金融数据中心的“自动驾驶”。具体如下:


首先,在自动调优中,强化学习是一个非常好的解决方案,强化学习(RL)是机器学习的一个分支,涉及代理(agent)如何在当前环境下采取行动(action)以大程度地获得回报(reward)。与监督学习和无监督学习不同,强化学习通过试错机制,与环境进行互动并获得奖励,从奖励中进行学习。


105.png

强化学习工作原理


关键算法采用的是2016年谷歌DeepMind提出的DDPG算法,算法包含Actor网络和Critic网络,其中Actor网络可根据环境当前运行状态输出连续动作,Critic网络可对当前环境运行状态和实施的动作进行评估打分,两者相结合,适用于高维连续动作场景。这是首次使用强化学习方法学习和推荐存储系统参数。



106.png

性能自动调优整体架构


其次,浪潮信息面向金融数据中心的智能统一存储管理平台InView通过强化学习进行存储系统参数调优,整体包含三个模块,分别是用户的应用、分布式存储系统AS13000以及调优模块。其中,参数推荐引擎可根据分布式存储AS13000的当前状态生成佳配置,负责将佳配置动态下发给AS13000,AS13000负责响应客户端的IO读写请求,性能指标采集器负责采集AS13000在新配置下的状态信息并计算在新配置下的性能提升效果,深度学习引擎根据AS13000的反馈迭代更新Actor和Critic网络。该过程迭代直到模型收敛,终将找到合适的参数设置。


再次,浪潮信息面向金融数据中心的智能统一存储管理平台InView的性能自动调优功能具备端到端参数自动调整、提升网络带宽同时降低网络时延、参数的调整不影响集群正常运行三大特点,具体实验效果如下:橙色框中的前360步,模型随机探索学习,红色框为360步之后,模型自动推荐参数,相比默认配置(黑色框中的点),平均带宽提升41%,时延降低29%,调优效果与性能专项组专家经验相当。


107.png

自动调优与默认配置效果对比



四、金融行业客户名单


国有银行、股份制银行、省级农信、城商行,以及大型保险央企等,均为浪潮信息智能运维解决方案的用户


五、客户评价


1.某金融用户:“浪潮信息的智能运维做得非常好,让我们的数据中心运维管理省力省心。而且浪潮信息的存储服务和产品一样好,可以为我们提供7 * 24的服务,这确实可以帮助我们维护存储设备。我们已经使用AS13000G5超过1年,它稳定且易于使用,明年我们将继续扩充容量。”


2.某金融用户:“浪潮信息的存储产品有三大优势,一是易用性好,智能统一存储管理平台InView操作方便;二是产品性能高,高峰时期使用顺畅;三是能够将本组织的全部数据将归入一个存储平台。”


本网站案例,除特殊标明来源的,版权归金科创新社所有,未经许可不得转载,否则将视为侵权,对于不遵守此声明或者其他违法使用本文内容者,本网站依法保留追究权。另,本网站部分案例、观点文章来源于网络素材,如有侵权,请邮件联系 fenglei@fintechinchina.com 处理!
特别提示: 本网站免费为广大金融企业提供IT选型咨询服务,详情点击 【 需求提交 】

推荐阅读

更多

山东农信:集中运维监控平台项目

为保证日常运行维护工作的顺利开展,确保业务系统安全、稳定运行,山东省联社通过建设集中运维监控平台项目,完成了异构监控系统数据的集中,通过大数据技术对运维监控数据进行挖掘和分析,实现了对运维突发事件的监测、识别、评估与态势感知,有效提高了突发事件的处置能力,初步实现了由IT运维到主动运营服务的转变。

2018第二届农村中小金融机构科技创新优秀案例评选 山东农信 2024-03-01

福建农信:云平台“农信云”项目

随着福建省农村信用社联合社(下称 “福建农信”)规模不断扩大、业务不断增加,应用系统、设备、数据中心空间能耗都不断增加,IT运维各方面都面临种种挑战。

2017首届农村中小金融机构科技创新优秀案例评选 福建农信 2024-03-01

贵州农信:IT可视化运维管理体系建设方案

为切实满足业务连续性及监管部门要求,确保IT系统安全、高效、稳定运行,我社在观山湖数据中心建设过程中同步启动了IT可视化运维管理体系建设。

2019第三届农村中小金融机构科技创新优秀案例评选 贵州农信 2024-03-01

浙江农信:运维一体化管理平台

一体化运维平台的总体构架包括资产管理、自动化运维模块、任务管理、系统管理、单点登录等核心模块

2017首届农村中小金融机构科技创新优秀案例评选 浙江农信 2024-03-01

江西省农商银行:IT可视化统一运维监控平台

为满足“集中监控”管理工作要求,实现运维可视化的集中监控,江西农信将建立一套集中、规范、完整的可视化统一运维监控系统,依托IT可视化系统让一线人员清晰直观掌握IT系统的整体架构和各业务、网络和资源的运行状态。

2018第二届农村中小金融机构科技创新优秀案例评选 江西省农商银行 2024-03-01

光大证券:数智化数据中心多云管理平台

数智化数据中心多云管理平台实现多云的统一管理,跨云资源调度和编排,统一监控和统一运维,统一的成本分析和优化,实现统一交付。

网络整理 光大证券 2024-03-01

案例库

金融行业全面的数字金融创新案例,涵盖历届“鑫智奖·金融机构数智化转型优秀案例评选”、“农村金融机构科技创新优秀案例评选”、“城市金融服务同业案例征集活动”等科技创新参评案例

  • IT运维
  • 智能运维
  • 运维管理

微信
咨询

微信咨询

扫码添加金科小助手微信号
咨询案例和解决方案相关信息
或联系对应机构