Processing

Please wait...

Settings

Settings

Goto Application

1. WO2020134783 - METHOD, DEVICE AND SYSTEM FOR DISPATCHING ALARM TICKET, AND COMPUTER READABLE STORAGE MEDIUM

Document

说明书

发明名称 0001   0002   0003   0004   0005   0006   0007   0008   0009   0010   0011   0012   0013   0014   0015   0016   0017   0018   0019   0020   0021   0022   0023   0024   0025   0026   0027   0028   0029   0030   0031   0032   0033   0034   0035   0036   0037   0038   0039   0040   0041   0042   0043   0044   0045   0046   0047   0048   0049   0050   0051   0052   0053   0054   0055   0056   0057   0058   0059   0060   0061   0062   0063   0064   0065   0066   0067   0068   0069   0070   0071   0072   0073   0074   0075   0076   0077   0078   0079   0080   0081   0082   0083   0084   0085   0086   0087   0088   0089   0090   0091   0092   0093   0094   0095   0096   0097   0098   0099   0100   0101   0102   0103   0104   0105   0106   0107   0108   0109   0110   0111   0112   0113   0114   0115   0116   0117   0118   0119   0120   0121   0122   0123   0124   0125   0126   0127   0128   0129   0130   0131   0132   0133   0134   0135   0136   0137   0138   0139   0140   0141   0142   0143   0144   0145   0146   0147   0148   0149   0150   0151   0152   0153   0154  

权利要求书

1   2   3   4   5   6   7   8   9   10  

附图

1   2   3   4   5   6  

说明书

发明名称 : 告警派单方法、装置、系统及计算机可读存储介质

[0001]
本公开要求享有2018年12月26日提交的名称为“告警派单方法、装置、系统及计算机可读存储介质”的中国专利申请CN201811609417.2的优先权,其全部内容通过引用并入本文中。

技术领域

[0002]
本公开涉及网络运维技术领域,尤其涉及一种告警派单方法、装置、系统及计算机可读存储介质。

背景技术

[0003]
在网络运维管理中,如果电信设备出现故障,会产生设备告警信息,并层层上报到网管监控系统,并进一步判断上报的告警信息对应的设备故障是否会影响业务质量或者业务流程,如果判定上报的告警信息对应的设备故障影响到业务质量或者业务流程,则会派发工单到运维工单系统,再由运维工单系统将工单派发给外线运维人员对应的设备,以使对应的运维人员到故障现场进行排障,从而形成一个闭环流程,最大程度的保障电信设备的正常运转。
[0004]
目前告警工单的派发分为手工派单、自动派单和自动延迟派单,其中手工派单需要运维人员根据经验判断告警是否需要派发到工单系统,这种方式依赖于运维人员的经验,并且占用大量人力资源,效率不高。而自动派单是根据积累的派发工单的经验知识,建立自动派单规则,当影响业务的告警信息上来时,网管监控系统自动派发到运维工单系统,这种方式只要是告警信息就派单,智能性较低,对于某些能自动恢复的告警设备来说,完全可以等一等就可以解决了。而自动延迟派单则是针对某些故障单据在一定时间段内能自动恢复的情况,可以理解的,若某告警信息对应的设备故障在一定时间内自动恢复了,那么就不需要运维人员上站维护,从而节约运维成本。这些经验会沉淀下来形成专家库知识,并进一步转换成派单延迟规则,对于符合自动恢复条件的告警信息延迟固定的时间再进行派单,这样可以大幅度降低派单量,节约运维成本提升运维效率,但自动延迟派单规则依旧存在两个缺点,一个是依赖于经验的积累,一个是灵活度不够。
[0005]
发明内容
[0006]
本公开的主要目的在于提供一种告警派单方法、装置、系统及计算机可读存储介质, 旨在解决现有网络运维管理中,设备故障分析不足,导致运维成本高,且运维方式不够灵活智能的技术问题。
[0007]
为实现上述目的,本公开提供了一种告警派单方法,所述告警派单方法包括:当接收到告警信息时,确定所述告警信息是否为可自动消除的告警信息;若是,则确定所述告警信息对应的抑制时间;基于所述抑制时间,对所述告警信息进行抑制,并确定所述告警信息在所述抑制时间内是否消除;若否,则将所述告警信息对应的工单发送至运维人员对应的设备。
[0008]
此外,为实现上述目的,本公开还提出一种告警派单装置,所述告警派单装置包括:判断模块,用于当接收到告警信息时,确定所述告警信息是否为可自动消除的告警信息;确定模块,用于若是,则确定所述告警信息对应的抑制时间;抑制模块,用于基于所述抑制时间,对所述告警信息进行抑制,并确定所述告警信息在所述抑制时间内是否消除;发送模块,用于若否,则将所述告警信息对应的工单发送至运维人员对应的设备。
[0009]
此外,为实现上述目的,本公开还提供一种告警派单系统,所述告警派单系统包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的告警派单程序,所述告警派单程序被所述处理器执行时实现如上文所述的告警派单方法的步骤。
[0010]
此外,为实现上述目的,本公开还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有告警派单程序,所述告警派单程序被处理器执行时实现如上文所述的告警派单方法的步骤。

附图说明

[0011]
图1是本公开实施例方案涉及的硬件运行环境的服务器结构示意图;
[0012]
图2为本公开告警派单方法第一实施例的流程示意图;
[0013]
图3为本本公开告警派单方法第一实施例中告警派单界面设置为三个预设分屏区域的示意图;
[0014]
图4为本公开告警派单方法第三实施例的流程示意图;
[0015]
图5为本公开告警派单方法第四实施例的流程示意图;
[0016]
图6为本公开的告警派单装置实施例的功能模块示意图。
[0017]
本公开目的的实现、功能特点及优点将结合实施例,参照附图做说明。

具体实施方式

[0018]
应当理解,此处所描述的实施例仅用以解释本公开,并不用于限定本公开。
[0019]
本公开实施例的解决方案主要是:当接收到告警信息时,确定所述告警信息是否为可自动消除的告警信息;若是,则确定所述告警信息对应的抑制时间;基于所述抑制时间,对所述告警信息进行抑制,并确定所述告警信息在所述抑制时间内是否消除;若否,则将所述告警信息对应的工单发送至运维人员对应的设备。以解决现有网络运维管理中,设备故障分析不足,导致运维成本高,且运维方式不够灵活智能的技术问题。
[0020]
本公开实施例提出一种告警派单系统。
[0021]
如图1所示,图1是本公开实施例方案涉及的硬件运行环境的告警派单系统的结构示意图。
[0022]
在后续的描述中,使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本公开的说明,其本身没有特定的意义。因此,“模块”、“部件”或“单元”可以混合地使用。
[0023]
该告警派单系统可以包括:处理器1001,例如CPU,通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。业主接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),在一个实施例中,业主接口1003还可以包括标准的有线接口(例如用于连接有线键盘、有线鼠标等)、无线接口(例如用于连接无线键盘、无线鼠标)。网络接口1004可选的可以包括标准的有线接口(用于连接有线网络)、无线接口(如WI-FI接口、蓝牙接口、红外线接口等,用于连接无线网络)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
[0024]
本领域技术人员可以理解,图1中示出的告警派单系统并不构成对告警派单系统的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
[0025]
如图1所示,作为一种计算机可读存储介质的存储器1005中可以包括操作系统、网络通信模块、业主接口模块以及告警派单程序。其中,操作系统是管理和控制告警派单系统与软件资源的程序,支持网络通信模块、业主接口模块、告警派单程序以及其他程序或软件的运行;网络通信模块用于管理和控制网络接口1002;业主接口模块用于管理和控制业主接口1003。
[0026]
在图1所示的告警派单系统中,所述告警派单系统通过处理器1001调用存储器1005中存储的告警派单程序,并执行以下步骤:当接收到告警信息时,确定所述告警信息是否为可自动消除的告警信息;若是,则确定所述告警信息对应的抑制时间;基于所述抑制时 间,对所述告警信息进行抑制,并确定所述告警信息在所述抑制时间内是否消除;若否,则将所述告警信息对应的工单发送至运维人员对应的设备。
[0027]
在一个实施例中,所述当接收到告警信息时,确定所述告警信息是否为可自动消除的告警信息的步骤包括:当接收到告警信息时,对所述告警信息进行预处理,得到待分类告警信息;将所述待分类告警信息输入分类模型中,生成对应的标签信息;根据所述标签信息,确定所述告警信息是否为可自动消除的告警信息。
[0028]
在一个实施例中,所述当接收到告警信息时,确定所述告警信息是否为可自动消除的告警信息的步骤之前,处理器110还用于调用存储器109中存储的告警派单程序,并执行以下操作:采集多个不同的告警信息,将各个告警信息进行预处理,得到多个不同的待分类告警信息;基于所述待分类告警信息,构建用于训练待训练分类模型的训练集;获取各个待分类告警信息对应标注的标签信息;将所述训练集中的待分类告警信息作为所述待训练分类模型的输入,将对应标注的标签信息作为所述待训练分类模型的输出,训练得到所述分类模型。
[0029]
在一个实施例中,所述若是,则确定所述告警信息对应的抑制时间的步骤包括:若是,则将所述告警信息输入预先训练好的生命周期预测模型中,生成对应的告警消除时间;基于所述告警消除时间和所述告警信息对应的告警时间,计算所述告警信息的生命周期;确定所述生命周期是否超过预设生命周期;若否,则基于所述生命周期,确定所述告警信息对应的抑制时间。
[0030]
在一个实施例中,所述若是,则将所述告警信息输入预先训练好的生命周期预测模型中,生成对应的告警消除时间的步骤包括:若是,则获取所述告警信息对应的属性信息;基于所述属性信息,通过所述生命周期预测模型,计算所述告警信息对应的告警消除时间。
[0031]
在一个实施例中,所述确定所述生命周期是否超过预设生命周期的步骤之后,处理器110还用于调用存储器109中存储的告警派单程序,并执行以下操作:若所述生命周期超过预设生命周期,则确定所述告警信息对应的抑制时间为0。
[0032]
在一个实施例中,所述当接收到告警信息时,确定所述告警信息是否为可自动消除的告警信息的步骤之后,处理器110还用于调用存储器109中存储的告警派单程序,并执行以下操作:若所述告警信息为不可自动消除的告警信息,则将所述告警信息对应的工单发送至运维人员对应的设备。
[0033]
告警派单系统100还可以包括给各个部件供电的电源111(比如电池),在一个实施例中,电源111可以通过电源管理系统与处理器110逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。
[0034]
尽管图1未示出,告警派单系统100还可以包括蓝牙模块等,在此不再赘述。
[0035]
基于上述告警派单系统硬件结构,提出本公开告警派单方法的各个实施例。
[0036]
本公开提供一种告警派单方法。
[0037]
参照图2,图2为本公开告警派单方法第一实施例的流程示意图。
[0038]
在本实施例中,提供了告警派单方法的实施例,需要说明的是,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
[0039]
在本实施例中,告警派单方法可选应用于告警派单系统中,为方便描述,告警派单系统以下简称系统,告警派单方法包括:步骤S10,当接收到告警信息时,确定所述告警信息是否为可自动消除的告警信息;步骤S20,若是,则确定所述告警信息对应的抑制时间;步骤S30,基于所述抑制时间,对所述告警信息进行抑制,并确定所述告警信息在所述抑制时间内是否消除;步骤S40,若否,则将所述告警信息对应的工单发送至运维人员对应的设备。
[0040]
在本实施例中,当告警派单系统在接收到告警信息时,先判断该告警信息是否能自动消除,若能,则确定对应的抑制时间,并抑制该告警信息,以供告警信息在该抑制时间内自动消除,若在抑制时间内告警信息无法自动消除,则将告警信息对应的工单发送给运维人员对应的设备,实现告警信息的自适应派单。
[0041]
以下针对每个步骤进行详细说明:
[0042]
步骤S10,当接收到告警信息时,确定所述告警信息是否为可自动消除的告警信息。
[0043]
在本实施例中,系统该包括监控装置,负责监控现场电信设备的运行情况,当现场有设备运行出现异常时,接收异常设备的异常响应,并将对应的告警信息发送给系统。
[0044]
当系统接收到告警信息时,确定该告警信息的类别,在一个实施例中,系统判断该告警信息为可自动消除的告警信息,还是不可自动消除的告警信息。
[0045]
对于软故障告警信息,通常可以通过后台智能处理或者不经过任何处理就可以自动恢复,这类告警信息即为可自动消除的告警信息;对于硬故障,涉及板卡坏、设备坏、光纤断等情况显然是通过后台智能处理无法进行解决的。这类故障只能及时派发工单到现场处理,这类告警信息即为不可自动消除的告警信息。
[0046]
在一个实施例中,步骤S10包括:
[0047]
步骤S11,当接收到告警信息时,对所述告警信息进行预处理,得到待分类告警信息。
[0048]
当系统接收到告警信息时,对该告警信息进行预处理,得到待分类告警信息,其中,预处理包括异常告警信息过滤,属性信息的提取,以及数值转换等几个步骤。
[0049]
在一个实施例中,异常告警信息过滤指的是,系统对一些重复报警的告警信息等进行过滤,避免重复处理同一条告警信息,造成资源浪费,在本实施例中,系统判断该告警信息是否为重复告警信息,若是,则删除该告警信息。
[0050]
属性信息的提取指的是,系统根据接收到的告警信息,获取对应的属性信息,其中,属性信息包括告警标题、告警级别、告警设备对应的厂商、告警时间和网元标识等。
[0051]
数值转化指的是,系统将属性信息转化为数值或者字母表示。
[0052]
如告警级别其中网管告警级别中采用数字编码,按照4级告警划分,一级告警取值4,二级告警取值3,三级告警取值2,四级告警取值1。根据告警级别的严重程度级别从低到高映射为从1到4的自然数,数字越大表示级别越严重。如本实施例中的告警信息若为三级告警时,则取值2。
[0053]
步骤S12,将所述待分类告警信息输入分类模型中,生成对应的标签信息。
[0054]
系统将待分类告警信息输入预先训练好的分类模型中,由分类模型输出对应的标签信息。其中,标签信息在本实施例中分为可自动消除标签和不可自动消除标签:原始值为TRUE或FALSE,表示可自动消除或不可自动消除,TRUE转换为1,表示可自动消除,FALSE为0,表示不可自动消除。在分类模型中,所有样本的标签转换后即为只含0,1的向量,基于此可以训练一个二分的分类模型。
[0055]
在本实施例中,系统只需将待告警信息输入事先训练好的分类模型中,即可生成对应的标签信息。
[0056]
步骤S130,根据所述标签信息,确定所述告警信息是否为可自动消除的告警信息。
[0057]
系统根据标签信息,确定告警信息的类型,在一个实施例中,判断告警信息是可自动消除的告警信息,还是不可自动消除的告警信息。
[0058]
步骤S20,若是,则确定所述告警信息对应的抑制时间。
[0059]
在本实施例中,若系统判定当前告警信息为可自动消除的告警信息,则确定该告警信息对应的抑制时间。可以理解的,若当前的告警信息是可自动消除的告警信息,则表示该告警信息对应的设备在一段时候内能自动进行恢复,那么系统应当允许该设备进行自我恢复,那么该告警信息就不需要进行派单,故在该设备进行自我恢复的这段时间里,系统需要对该告警信息进行抑制,以确保该告警信息不会马上被处理。
[0060]
在一个实施例中,步骤S20包括:
[0061]
步骤S21,若是,则将所述告警信息输入预先训练好的生命周期预测模型中,生成对应的告警消除时间。
[0062]
若系统判定当前的告警信息为可自动消除的告警信息,则将该告警信息输入预先训练好的生命周期预测模型中,生成对应的告警消除时间。
[0063]
在一个实施例中,步骤S21包括:
[0064]
步骤a,若是,则获取所述告警信息对应的属性信息。
[0065]
若系统判定当前的告警信息为可自动消除的告警信息,则获取该告警信息对应的属性信息,其中,属性信息包括告警标题、告警级别、告警设备对应的厂商、告警时间和网元 标识等。
[0066]
步骤b,基于所述属性信息,通过所述生命周期预测模型,计算所述告警信息对应的告警消除时间。
[0067]
系统根据获得的属性信息,通过生命周期预测模型,计算该告警信息对应的告警消除时间,在一个实施例中,系统在获得属性信息后,根据属性信息中的告警标题、告警级别、告警设备对应的缠上、告警时间和网元标识等各自在属性信息中所占的预设权重,计算该告警信息的得分,根据得分与告警消除时间的映射关系,得到告警信息对应的告警消除时间。
[0068]
步骤S22,基于所述告警消除时间和所述告警信息对应的告警时间,计算所述告警信息的生命周期。
[0069]
系统根据计算得出的告警消除时间和告警信息对应的告警时间,计算告警信息的生命周期,生命周期即指该告警信息的存活时间,具体指该告警信息从发出告警到自动消除的时间。
[0070]
步骤S23,确定所述生命周期是否超过预设生命周期。
[0071]
可以理解的,如果该告警信息对应的设备故障可以自我消除,但是所用时间过长,如需要一天以上的时间才能恢复成正常状态,此时告警消除时间过长,会影响对应业务的进程,则该告警信息是不应当进行抑制的,而是应当及时通知运维人员。故系统在计算出告警信息的生命周期后,需要确定该生命周期是否超过了预设生命周期,由于现场设备不同,以及对应处理的业务不同,该预设生命周期需要根据实际情况进行设定。
[0072]
步骤S24,若否,基于所述生命周期,确定所述告警信息对应的抑制时间。
[0073]
若系统判定计算出来的生命周期未超过预设生命周期,则根据计算得出的告警信息的生命周期,确定该告警信息对应的抑制时间,可以理解的,告警信息的生命周期与抑制时间不一致,在实际处理过程中,抑制时间会比告警信息对应的生命周期要长一些,如系统计算得出告警信息的生命周期为3秒,则抑制时间为5秒,确保告警信息有足够的时间进行自我消除。即抑制时间等于告警信息对应的生命周期加上一个预设的固定时间。
[0074]
在一个实施例中,步骤S23之后,所述方法还包括:
[0075]
步骤S25,若所述生命周期超过预设生命周期,则确定所述告警信息对应的抑制时间为0。
[0076]
若系统判定计算出来的生命周期超过了预设生命周期,则表示该告警信息自我消除的时间过长,可能会影响对应业务的进程,故系统直接确定该告警信息的抑制时间为0,即系统直接获取该告警信息对应的工单,并将该告工单发送至外线运维人员对应的设备。
[0077]
步骤S30,基于所述抑制时间,对所述告警信息进行抑制,并确定所述告警信息在所述抑制时间内是否消除。
[0078]
在本实施例中,系统基于计算得出的抑制时间,对对应的告警信息进行抑制,在一个实施例中,是对该告警信息进行延迟处理,延迟的时间即为抑制时间。系统在抑制时间内确定该告警信息是否消除
[0079]
可以理解的,在抑制时间内,告警信息对应的设备进行自我恢复,在该设备处于异常的情况下,告警信息一直存在,当该设备自我恢复成功,从异常状态变为正常状态时,不再发出告警,对应的告警信息即被消除。
[0080]
若系统确定当前告警信息消除时,则将该告警信息提出处理名单,不用再对该告警信息进行处理。
[0081]
步骤S40,若否,则将所述告警信息对应的工单发送至运维人员对应的设备。
[0082]
在本实施例中,若系统判定在抑制时间内,告警信息还不消除,则说明该告警信息对应的设备在抑制时间内无法自我恢复,系统则将告警信息生成对应的工单,并将该工单发送至运维人员对应的设备,以通过运维人员到现场进行排障。
[0083]
本实施例在当接收到告警信息时,确定所述告警信息是否为可自动消除的告警信息;若是,则确定所述告警信息对应的抑制时间;基于所述抑制时间,对所述告警信息进行抑制,并确定所述告警信息在所述抑制时间内是否消除;若否,则将所述告警信息对应的工单发送至运维人员对应的设备。本公开在接收到告警信息时,先判断该告警信息是否能自动消除,若能,则确定对应的抑制时间,并抑制该告警信息,以供告警信息自动消除,若在抑制时间内告警信息无法自动消除,则将告警信息对应的工单发送给运维人员对应的设备,实现告警信息的自适应派单。
[0084]
在一个实施例中,基于第一实施例提出本公开告警派单方法的第二实施例。告警派单方法的第二实施例与告警派单方法的第一实施例的区别在于,步骤S10之前,所述方法还包括:步骤S50,采集多个不同的告警信息,将各个告警信息进行预处理,得到多个不同的待分类告警信息;步骤S60,基于所述待分类告警信息,构建用于训练待训练分类模型的训练集;步骤S70,获取各个待分类告警信息对应标注的标签信息;步骤S80,将所述训练集中的待分类告警信息作为所述待训练分类模型的输入,将对应标注的标签信息作为所述待训练分类模型的输出,训练得到所述分类模型。
[0085]
在本实施例中,系统先通过采集模块采集多个不同的告警信息,作为训练用的样本,并基于告警信息对应的标签信息,通过模型训练,训练得到一个分类模型,以助于后续告警信息的分类。
[0086]
需要说明的是,本公开方案涉及到分类模型和生命周期预测模型,在实际处理中,这两个模型的训练是可以同步进行的,训练方法类是,这里以分类模型为主进行详细说明。
[0087]
以下将对各个步骤进行详细说明:
[0088]
步骤S50,采集多个不同的告警信息,将各个告警信息进行预处理,得到多个不同的待分类告警信息。
[0089]
在本实施例中,系统采集多个不同的告警信息,并对所有的告警信息进行预处理,得到多个不同的待分类告警信息,其中,告警信息是系统对应的数据库中记录的历史告警信息。需要说明的是,系统采集的告警信息是随时更新的,即系统在对当前的告警信息进行可自动消除判断时,采集是当前的告警信息之前的告警信息记录,在处理完当前的告警信息后,接收到下一条告警信息时,系统采集的告警信息除了之前的告警信息记录,还包括当前已处理完的告警信息。
[0090]
如图3所示,系统包括监控系统、分类模型、生命周期预测模型、抑制派单单元、单据系统、DB(训练集)、运维人员。
[0091]
处理流程如下:系统接收健康系统实时告警信息,将告警信息作为一个样本转换为数值向量,并输入分类模型MODEL进行分类,若输出分类结果为是(可自动消除)的告警信息,则传输给生命周期预测模型,继续预测;若输出分类结果为否(不可自动消除)的告警信息,则直接发送给抑制派单单元,此时的告警信息的抑制时间为0,抑制派单单元根据抑制时间,将告警信息发送到单据系统,由单据系统生成工单发给运维人员,此时的告警信息也被记录,作为模型的训练集,用于模型训练,得到分类模型和生命周期预测模型。
[0092]
其中,预处理包括异常告警信息过滤,属性信息的提取,以及数值转换等几个步骤。
[0093]
在一个实施例中,异常告警信息过滤指的是,系统对一些重复报警的告警信息等进行过滤,避免重复处理同一条告警信息,造成资源浪费。
[0094]
属性信息的提取指的是,系统根据接收到的告警信息,获取对应的属性信息,其中,属性信息包括告警标题、告警级别、告警设备对应的厂商、告警时间和网元标识等。
[0095]
数值转化指的是,系统将属性信息转化为数值或者字母表示,在一个实施例中,数值转化分为直接数值转化、直接哑编码和间接哑编码。
[0096]
直接数值转化:对于数值大小可以反映业务信息的特征直接采用业务数值,如告警级别其中网管告警级别中采用数字编码,按照4级告警划分,一级告警取值4,二级告警取值3,三级告警取值2,四级告警取值1。根据告警级别的严重程度级别从低到高映射为从1到4的自然数,数字越大表示级别越严重。
[0097]
直接哑编码:对于属于某一个类别,或具有某一种类的特性的字段需要进行ONE-HOT编码(独热编码):将离散型特征的每一种取值都看成一种状态,若一特征中有N个不相同的取值,那么就可以将该特征抽象成N种不同的状态,ONE-HOT编码保证了每一个取值只会使得一种状态处于“激活态”,也就是说这N种状态中只有一个状态位值为1,其他状态位都是0。告警标题、设备厂商、设备类型、网元标识和标签字段等使用直接哑编 码进行处理转换。
[0098]
如故障设备厂商字段中的取值有4种取值,厂商A、厂商B、厂商C、厂商D,那么使用0、1编码,1的位置对应取值。映射完成的结果如下:
[0099]
[表0001]
厂商_A 厂商_B 厂商_C 厂商_D
1 0 0 0
0 1 0 0
0 0 1 0
0 0 0 1

[0100]
间接哑编码:对于时间相关的特征如故障发生时间和故障恢复时间等,需要先对时间进行分段处理后,再使用哑编码方式进行处理。如将一天分段为临晨、上午、中午、下午、傍晚、晚上和深夜几段,并且衍生一个是否为节假日的特征。如故障发生时间经过间接哑编码后体现为下面的表格:
[0101]
[表0002]
临晨 上午 中午 下午 傍晚 晚上 深夜 节假日
1 0 0 0 0 0 0 0
0 1 0 0 0 0 0 1

[0102]
以某运维管理3个月历史告警信息为例,处理完输出到X矩阵中,处理后的数据维度为(18537,1282),即18537个样本,每个样本共1282个属性值,如下所示:
[0103]
[0104]
步骤S60,基于所述待分类告警信息,构建用于训练待训练分类模型的训练集。
[0105]
在本实施例中,系统根据待分类告警信息,构建训练分类模型所用的训练集,其中,每一个待分类告警信息都为训练集中的一个训练样本。
[0106]
步骤S70,获取各个待分类告警信息对应标注的标签信息。
[0107]
在本实施例中,系统获取各个待分类告警信息对应标注的标签信息,标签信息来自运维人员的标注(是否自动消除),来生成对应的标签信息Y,如果自动消除则Y为1,否则Y为0。模型训练即从筛选的告警信息中进一步分析告警每个属性信息不同的取值对工单是否自动恢复(标签取值)的影响程度,即权重,体现为权重参数矩阵W。这样可以了解某个属性是否对工单是否可自动恢复或生命周期长短有显著影响。
[0108]
可以理解的,这些训练用的告警信息是已经被处理过的历史告警信息,那么即说明用户可以对其进行人为标注,即每一个待分类告警信息都带有一个人为标注的标签信息,该 标签信息为可自动消除标签和不可自动消除标签。
[0109]
步骤S80,将所述训练集中的待分类告警信息作为所述待训练分类模型的输入,将对应标注的标签信息作为所述待训练分类模型的输出,训练得到所述分类模型。
[0110]
在本实施例中,系统将训练集中的待分类告警信息作为分类模型输入,将对应标注的标签信息作为分类模型的输出,训练得到分类模型,该分类模型是一个二分模型,即告警信息对应的分类为可自动消除的告警信息和不可自动消除的告警信息。
[0111]
本实施例的模型训练采用神经网络进行学习,神经网络由一个输入层,多个隐藏层和一个输出层组成,隐藏层由多个节点(每个节点对应一个神经元)组成。输出层是输入层的连续函数,这样就完成了回归的功能。其中每个节点通过对多个输入进行加权并适用激活函数产生本神经元的输出,作为下层的输入。神经元由多个输入进行加权求和并运用激活函数产生输出。每一层的输出作为下一层的输入层层连接形成一个多层多节点神经网络模型。
[0112]
通过标注过的历史告警信息作为输入,训练多层神经网络模型,神经网络由很多层和节点组成。先随机初始化模型参数,并设定MINI-BATCH(小批处理)大小和迭代次数EPOCH(当一个完整的训练集通过了神经网络一次并且返回了一次,这个过程称为一个EPOCH)。对神经网络模型进EPOCH次迭代训练,每次EPOCH中分别对MINI-BATCH的小批量数据进行一次前向传播,每一层从前面一层的每个节点中获取数据,将这些数据乘以权重并且将来自不同节点的数据相加,最后在通过非线性函数产生该层的结果,算出误差,然后反向传播更新一次参数。多次迭代的目的就是最小化预测结果和真实结果的误差,使得最大程度的和数据的结果一致并且具有良好的泛化能力。
[0113]
分类模型的作用是对告警信息是否可以自动消除进行二分类(可自动消除或不可自动消除),通过训练获得,为多层神经网络模型:1层输入层,多个隐含层,一个输出层。对应函数y=f(x),y和x都为向量,f(x)的参数为W,为矩阵形式,参考图4分类模型图。
[0114]
需要说明的是,生命周期预测模型的训练方式在分类模型训练的基础上,通过告警信息对应的属性信息,计算告警信息的得分,并将告警信息的得分作为生命周期预测模型的输入,对应关联的告警消除时间作为生命周期预测模型的输出训练得到。
[0115]
生命周期预测模型的作用是对可自动消除的告警信息的生命周期预测,通过训练获得,为多层神经网络模型:神经网络由很多层和节点组成。每一层从前面一层的每个节点中获取属性信息,将这些属性信息乘以权重并且将来自不同节点的数据相加,最后在通过非线性函数产生该层的结果。每一层会有很多节点,从而实现尺寸的缩减或扩展。
[0116]
对应函数y=f(x),y和x都为向量,f(x)的参数为W,为矩阵形式。参考图5生命周期预测模型图。
[0117]
以分类模型为例说明:训练过程为将对历史告警信息进行属性信息提取处理,作为样本进行输入,通过前向传播和后向传播数个迭代过程,逐渐调整模型的权重参数W,使得模型的损失最小,训练出和训练样本最贴合并且泛化能力强的模型出来。
[0118]
处理流程如下:
[0119]
训练样本拆分:
[0120]
样本X(18537,1282)拆分为训练数据X_TRAIN(50%)、验证数据X_VAL(30%)和测试数据X_TEST(20%),标签Y(18537)拆分为训练数据Y_TRAIN(50%)、验证数据Y_VAL(30%)测试数据Y_TEST(20%)。
[0121]
生成MODEL:
[0122]
初始化基本信息:
[0123]
初始训练参数:采用XAVIER UNIFORM初始化方法(深度学习方法中的一种),包括INPUT_SHAPE:1282,网络结构:1282*512(dropout(0.5))*256*1,激活函数Activation(relu,relu,sigmoid),OUTPUT为二分类。
[0124]
设定超参数:
[0125]
学习率(rmsprop(lr=0.001))、MINI-BATCH:128和迭代次数EPOCH:100。
[0126]
模型训练:
[0127]
对神经网络模型进行EPOCH次迭代训练,保存最优模型机制,即在验证集上模型不在进化时保存该模型。
[0128]
模型评估:
[0129]
采用ACCURACY评价指标。
[0130]
输出模型MODEL。
[0131]
本实施例系统包括采集模块,在接收告警信息之前,先采集系统对应记录的历史告警信息,以历史告警信息为训练样本,训练得到一个二分的分类模型,以供后续在接收到告警信息时,可以通过分类模型迅速判断出当前告警信息是可自动消除的告警信息还是不可自动消除的告警信息,并且该分类模型是一直处于更新状态的,提高了告警方法的智能性。
[0132]
在一个实施例中,提出本公开告警派单方法的第三实施例。告警派单方法的第三实施例与告警派单方法的第一或第二实施例的区别在于,步骤S10之后,所述方法还包括:
[0133]
步骤S90,若所述告警信息为不可自动消除的告警信息,则将所述告警信息对应的工单发送至运维人员对应的设备。
[0134]
若系统判定当前的告警信息为不可自动消除的告警信息,则根据所述告警信息对应的属性信息,生成对应的工单,该工单包括告警发生时间、告警设备以及告警问题。
[0135]
系统将告警信息对应的工单发送至运维人员对应的设备,以供运维人员了解当前的告 警信息,并到现场进行排障。
[0136]
在一个实施例中,系统在将告警信息生成对应的工单的过程中,系统可对告警信息对应的告警问题进行初步判断,并确定解决该告警问题所需的工具,从而根据解决该告警问题所需的工具,生成工具清单,并将工具清单和对应的工单一并发送至运维人员对应的设备,以供运维人员在到现场之前,根据工具清单准备对应的维修工具。
[0137]
本实施例当确定告警信息为不可自动消除的告警信息时,直接将告警信息对应的工单发送至运维人员对应的设备,以及时通报运维人员到现场进行排障,提高了告警派单方法的智能性,实现了告警派单系统对告警信息的自适应派单。
[0138]
本公开进一步提供一种告警派单装置,如图6所示,图6为本公开告警派单装置实施例的功能模块示意图。
[0139]
在本实施例中,该告警派单装置包括:判断模块10,用于当接收到告警信息时,确定所述告警信息是否为可自动消除的告警信息;确定模块20,用于若是,则确定所述告警信息对应的抑制时间;抑制模块30,用于基于所述抑制时间,对所述告警信息进行抑制,并确定所述告警信息在所述抑制时间内是否消除;发送模块40,用于若否,则将所述告警信息对应的工单发送至运维人员对应的设备。
[0140]
在一个实施例中,判断模块10还包括:预处理单元,用于当接收到告警信息时,对所述告警信息进行预处理,得到待分类告警信息;第一生成单元,用于将所述待分类告警信息输入分类模型中,生成对应的标签信息;第一判断单元,用于根据所述标签信息,确定所述告警信息是否为可自动消除的告警信息。
[0141]
在一个实施例中,告警派单装置还包括:采集模块,用于采集多个不同的告警信息,将各个告警信息进行预处理,得到多个不同的待分类告警信息;构建模块,用于基于所述待分类告警信息,构建用于训练待训练分类模型的训练集;获取模块,用于获取各个待分类告警信息对应标注的标签信息;训练模块,用于将所述训练集中的待分类告警信息作为所述待训练分类模型的输入,将对应标注的标签信息作为所述待训练分类模型的输出,训练得到所述分类模型。
[0142]
在一个实施例中,确定模块20包括:第二生成单元,用于若是,则将所述告警信息输入预先训练好的生命周期预测模型中,生成对应的告警消除时间;第一计算单元,用于基于所述告警消除时间和所述告警信息对应的告警时间,计算所述告警信息的生命周期;第二判断单元,用于确定所述生命周期是否超过预设生命周期;第一确定单元,用于若否,则基于所述生命周期,确定所述告警信息对应的抑制时间。
[0143]
在一个实施例中,第二生成单元包括:获取单元,用于若是,则获取所述告警信息对应的属性信息;第二计算单元,用于基于所述属性信息,通过所述生命周期预测模型,计 算所述告警信息对应的告警消除时间。
[0144]
在一个实施例中,告警派单装置还包括:第二确定单元,用于若所述生命周期超过预设生命周期,则确定所述告警信息对应的抑制时间为0。
[0145]
在一个实施例中,发送模块还用于若所述告警信息对应为不可自动消除的告警信息,则将所述告警信息对应的工单发送至运维人员对应的设备。
[0146]
此外,本公开实施例还提出一种计算机可读存储介质。
[0147]
所述计算机可读存储介质上存储有告警派单程序,所述告警派单程序被处理器执行时实现如上述任一项实施例中的告警派单方法的步骤。
[0148]
本公开计算机可读存储介质实施方式与上述告警派单方法各实施例基本相同,在此不再赘述。
[0149]
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其它变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其它要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
[0150]
上述本公开实施例序号仅仅为了描述,不代表实施例的优劣。
[0151]
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本公开的技术方案本质上或者说对一些情况做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台系统设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本公开各个实施例所述的方法。
[0152]
本公开在接收到告警信息时,先判断该告警信息是否能自动消除,若能,则确定对应的抑制时间,并抑制该告警信息,以供告警信息自动消除,若在抑制时间内告警信息无法自动消除,则将告警信息对应的工单发送给运维人员对应的设备,实现告警信息的自适应派单。
[0153]
本公开的技术方案,当接收到告警信息时,确定所述告警信息是否为可自动消除的告警信息;若是,则确定所述告警信息对应的抑制时间;基于所述抑制时间,对所述告警信息进行抑制,并确定所述告警信息在所述抑制时间内是否消除;若否,则将所述告警信息对应的工单发送至运维人员对应的设备。本公开在接收到告警信息时,先判断该告警信息是否能自动消除,若能,则确定对应的抑制时间,并抑制该告警信息,以供告警信息自动 消除,若在抑制时间内告警信息无法自动消除,则将告警信息对应的工单发送给运维人员对应的设备,实现告警信息的自适应派单。
[0154]
以上仅为本公开的优选实施例,并非因此限制本公开的专利范围,凡是利用本公开说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其它相关的技术领域,均同理包括在本公开的专利保护范围内。

权利要求书

[权利要求 1]
一种告警派单方法,其中,所述告警派单方法包括以下步骤: 当接收到告警信息时,确定所述告警信息是否为可自动消除的告警信息; 若是,则确定所述告警信息对应的抑制时间; 基于所述抑制时间,对所述告警信息进行抑制,并确定所述告警信息在所述抑制时间内是否消除; 若否,则将所述告警信息对应的工单发送至运维人员对应的设备。
[权利要求 2]
如权利要求1所述的告警派单方法,其中,所述当接收到告警信息时,确定所述告警信息是否为可自动消除的告警信息的步骤包括: 当接收到告警信息时,对所述告警信息进行预处理,得到待分类告警信息; 将所述待分类告警信息输入分类模型中,生成对应的标签信息; 根据所述标签信息,确定所述告警信息是否为可自动消除的告警信息。
[权利要求 3]
如权利要求2所述的告警派单方法,其中,所述当接收到告警信息时,确定所述告警信息是否为可自动消除的告警信息的步骤之前,所述方法还包括: 采集多个不同的告警信息,将各个告警信息进行预处理,得到多个不同的待分类告警信息; 基于所述待分类告警信息,构建用于训练待训练分类模型的训练集; 获取各个待分类告警信息对应标注的标签信息; 将所述训练集中的待分类告警信息作为所述待训练分类模型的输入,将对应标注的标签信息作为所述待训练分类模型的输出,训练得到所述分类模型。
[权利要求 4]
如权利要求1所述的告警派单方法,其中,所述若是,则确定所述告警信息对应的抑制时间的步骤包括: 若是,则将所述告警信息输入预先训练好的生命周期预测模型中,生成对应的告警消除时间; 基于所述告警消除时间和所述告警信息对应的告警时间,计算所述告警信息的生命周期; 确定所述生命周期是否超过预设生命周期; 若否,则基于所述生命周期,确定所述告警信息对应的抑制时间。
[权利要求 5]
如权利要求4所述的告警派单方法,其中,所述若是,则将所述告警信息输入预先训练好的生命周期预测模型中,生成对应的告警消除时间的步骤包括: 若是,则获取所述告警信息对应的属性信息; 基于所述属性信息,通过所述生命周期预测模型,计算所述告警信息对应的告警消除时间。
[权利要求 6]
如权利要求4所述的告警派单方法,其中,所述确定所述生命周期是否超过预设生命周期的步骤之后,所述方法还包括: 若所述生命周期超过预设生命周期,则确定所述告警信息对应的抑制时间为0。
[权利要求 7]
如权利要求1-6任一项所述的告警派单方法,其中,所述当接收到告警信息时,确定所述告警信息是否为可自动消除的告警信息的步骤之后,所述方法还包括: 若所述告警信息为不可自动消除的告警信息,则将所述告警信息对应的工单发送至运维人员对应的设备。
[权利要求 8]
一种告警派单装置,其中,所述告警派单装置包括: 判断模块,用于当接收到告警信息时,确定所述告警信息是否为可自动消除的告警信息; 确定模块,用于若是,则确定所述告警信息对应的抑制时间; 抑制模块,用于基于所述抑制时间,对所述告警信息进行抑制,并确定所述告警信息在所述抑制时间内是否消除; 发送模块,用于若否,则将所述告警信息对应的工单发送至运维人员对应的设备。
[权利要求 9]
一种告警派单系统,其中,所述告警派单系统包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的告警派单程序;所述告警派单程序被所述处理器执行时实现如权利要求1-7中任一项所述的告警派单方法的步骤。
[权利要求 10]
一种计算机可读存储介质,其中,所述计算机可读存储介质上存储有告警派单程序,所述告警派单程序被处理器执行时实现如权利要求1-7中任一项所述的告警派单方法的步骤。

附图

[ 图 1]  
[ 图 2]  
[ 图 3]  
[ 图 4]  
[ 图 5]  
[ 图 6]