如何正确判断“保单量”出现下降呢?传统的方式就是设置一个固定的阈值,当实时监控到的保单量超出上述阈值时,即认为保单量出现异常。传统监控系统的固定阈值告警,就是籍此产生告警信息的。

这个逻辑表面看上去没有问题,但是仔细想一下,每天凌晨的时候,会有多少新的保单提交到系统中呢(假设保险公司只受理国内的业务)?显然,每天上午10点到12点之间新提交到系统中的保单量要远远多于每天凌晨提交到系统中的保单量。以此类推,业务系统在促销活动期间和平日处理的保单量也存在显著的差别。因此,企业很难用固定阈值来判断业务系统保单量指标是否出现异常。

为了解决上述问题,云智慧AIOps平台采用多算法集成学习模式,并引入3种针对时序数据的异常检测方法:动态基线、同比/环比和指标异常检测。

动态基线基于历史数据,利用智能算法进行深度学习,对未来一段时间内的每个时间点的数值进行预测,以预测值作为基线,并通过比较实际值与基线的偏离度(百分比差异)来监控和告警。这种方法适用于已知某数据指标呈周期性变化且没办法给出每个周期的准确值或者周期内的数据变化过多的场景。

同/环比变化用于发现某个待监测指标的变化趋势是持续变好还是持续变坏。将目标监控值与历史同期数据的分布和同环比的变化情况进行对比,根据数值或百分比差异情况判断新进数据是否异常,并作出判断是否进行告警。

指标异常检测为了应对不对业务模式的数据差异化特点,采用无监督集成学习算法,无需人工设置固定阈值和定义基线偏离度,系统根据不同数据特点,选择不同算法去做针对性的检测,并对异常进行整体评估,自动识别不符合期望的数据后产生告警。

在银行业,云智慧AIOps同样在多家商业银行的智能业务链路追踪场景中发挥价值。我们都知道,任何一笔金融业务的交易链路都可能涉及几十个环节,IT追踪非常困难,过去都是基于垂直系统的监控数据由人工去做的。现在,利用AIOps的实时数据分析能力,自动对交易进行全链路追踪,对采集到的数据进行智能关联分析,快速得到想要的结果。

云智慧AIOps平台以事件为核心,基于大数据技术和机器学习算法,实现IT全生命周期的统一管控。对来自于各种监控系统的告警消息与业务指标进行统一的接入与处理,帮助金融企业打通数据孤岛,统一运维的标准与管理规范,减少对运维的事务性干扰,实现事件的智能告警、异常检测、根因分析、智能预测等。

dawei

【声明】:北京站长网内容转载自互联网,其相关言论仅代表作者个人观点绝非权威,不代表本站立场。如您发现内容存在版权问题,请提交相关链接至邮箱:bqsm@foxmail.com,我们将及时予以处理。