控制银行IT系统运维风险的手段有哪些?
数字化时代,随着银行业务的快速发展,计算机系统的数量和部署规模迅速增加,随着应用系统的微服务化,系统之间的关联更加复杂,相应地对运维系统提出了要求和难度。虽然银行内部建立了完善的监控系统,但是面对百万级的报警风暴,定位和解决问题的难度非常大,尤其不利于系统的安全、持续、稳定运行。
在数字化转型中,以用户为中心是驱动金融行业的核心基础。因此,对于拥有海量运维数据的银行、证券公司等金融行业来说,智能运维势在必行。采用先进的运维手段(智能运维)是企业不断前行的动力之源。
来说一个我们正在服务的客户。客户是一家商业银行。
这家商业银行通过青创科技提供的夏洛克AIOps解决方案,构建了智能运维数据分析系统,收集并分析十余个系统的运维数据,包括应用系统日志、告警、性能指标、交易指标、网络性能指标等。,并通过机器学习算法实现指标异常检测、关联分析和告警收敛,从而加快问题定位效率,保障系统运行。为了有效提高对异常情况的监控,预测未来趋势,提前发现系统隐患,商业银行通过创建夏洛克AI Lab,训练生成了基于业务场景的多种算法,实现了系统的单指标异常检测,大大降低了系统故障的概率。
同时,商业银行还利用青创夏洛克指标分析中心和告警分析中心,实现多维指标关联分析,帮助快速发现和定位系统问题,提高故障排查效率;实现告警汇聚,减少告警风暴,加快定位时间。目前,告警压缩率达到80%以上,运维人员的告警处理效率得到显著提升。实现了IT系统运维的智能化,提高了业务健康运行的有力保障。
事实上,青创科技之前已经服务过中国银联、交通银行、浦发银行、宁波银行等多家银行客户,帮助他们搭建了智能运维平台,提高了客户运维效率。目前,许多项目已经进入第二和第三阶段的建设。