2M光网络中采用可信度模型的故障定位技术探讨

(整期优先)网络出版时间:2022-06-07
/ 3

2M光网络中采用可信度模型的故障定位技术探讨

杨金

云南电网有限责任公司玉溪供电局 电力调度控制中心

摘要:2M光网络具有高带宽,低时延和功耗等良好特性,是新一代电网通信网络发展的方向。为提高光网络的可靠性和可用性,保证光网络正常,高效的运行,实现光网络的故障诊断极为重要。当前,在透明节点增加、光电再生设备减少的全光网络中,多故障定位的非完全多项式属性、网络拓扑的复杂性以及承载业务的多样性使得故障定位变得尤为困难,如何根据收集的告警信息,确切地找出故障的准确数目及其位置成为网络管理人员的难题。基于此,本文通过引入可信度概念,建立采用可信度模型的故障定位机制,并基于建立的模型提出两种故障定位算法。通过不同的网络拓扑以及与其他的算法对比,对这两种算法以及可信度模型的正确性进行了验证。仿真结果表明,该模型能够很好地处理多故障定位问题的不确定性,且定位性能优越,具有很强的实际意义。

关键词:全光网;故障定位;不确定性;可信度


一、前言

近年来,随着电网业务的快速发展,传输专网的需求不断提高。于是,研究者试图运用光网络来提高电网业务发展的需要。与传统的电路网络相比,2M光网络在通信容量、传输距离、信号串扰、保密性能等方面具有明显的优势。但光网络虽然有这么多的优势,其可靠性要求也就越高,运行过程一旦发生故障,若不能及时定位故障,进行保护恢复,则光网络将会损失大量数据,造成无法预估的后果,因此需要一种有效、精准的故障定位技术。基于此,本文主要对在2M光网络中采用可信度模型的故障定位技术进行了论述,通过仿真结果表明,该模型能够很好地处理多故障定位问题的不确定性,且定位性能优越,具有很强的实际意义。



二、故障定位

对不同光网络的故障诊断需求,设计不同的故障诊断算法是尤其重要。 光网络故障诊断目标,是设计各种故障诊断算法,实现光网络中故障处理器的自主诊断与识别。光网络故障诊断算法的设计思路: 根据已建立的光网络通信模。有学者利用模糊数学的思想,引入不确定性推理技术,利用可信度的概念来衡量告警与故障之间的因果关系。不确定性推理技术不仅能对确定性的推理

关系进行建模,为故障和告警之间不确定性的推理关系提供建模方法,基于贝叶斯网络的不确定性推理技术将故障定位转换成概率问题,大大简化故障定位推理的复杂度,基于贝叶斯网络的故障定位方法很适合应用到全光网中来实施故障定位。

首先,定义网络模型 G(V,E,S),利用无向图来描述该拓扑结构,通过构造相应的邻接矩阵来存储网络拓扑中顶点与链路的连通关系,其中 V 代表网络中的节点集合,E代表网络中的边集合,并且链路均是无向,S代表网络中承载的业务集合。任意节点集合中的节点都有一个节点权重Pd),Pd)代表节点 d 因为出现故障而产生告警的概率;任意链路集合中的链路都有一个链路权重 PL), PL)代表链路发生故障的概率,假设每条链路发生故障的概率是相同,并且所有链路之间是否发生故障是相互独立;任意业务集合中的业务都可以标记为(id,route),其中,id 代表网络中承载业务的id 标号,route 代表承载业务的路由 信息,id 和 route 能够惟一标记网络中的业务,通过某个业务的 id route 信息,可以确定该业务经过的link数目,记为 Lnum ,以及与该业务有相同的宿节点的业务数目 Snum。在建立网络模型后,引用文献[7]的故障传播模型——仅考虑网络发生断纤故障,假设故障仅能被业务宿节点检测到,并且一旦某个链路发生故障,由于拓扑结构的连通性,以及业务配置的影响,那么其下游业务均受影响。

结合已经建立的故障传播模型以及网络模型,根据网络拓扑和已建立的光路, 可以得到告警集合 SAS以及疑似链路集合SF,并且可以得到相应的二部图。在上述工作的基础上,建立了可信度模型。可信度因子 FC能够很好地衡量出基于证据推断出某些结论可信程度的大小,因而可以利用可信度来描述基于某些业务中断宿节点产生的告警信息,来推断具体是哪些链路发生故障,进而完成多故障定位,得到最可能的疑似故障链路集。因此,全光网中可信度模型可以建立如下:

FC (link,node ): node →link. (1)

式(1)代表某个业务的宿节点是 node,当节点 node 因为某个链路发生故障而致使位于 node 处的监测器产生告警信息,利用 FC(Link,node )(以下简称 FC(L,d ))来衡量链路 Link是引起 node 告警的疑似故障链路的可信度。可以用式(2)和式(3)来分别计算该节点发生故障推断链路Ⅰ是故障链路的可信度以及节点 d发生告警的概率。

FCLd )=(P(L / d)- Pd))(1- PL)), (2)

629f121572fac_html_6083020594ed6b39.png (3)

式(2)代表一旦链路

L发生故障,节点 d 产生告警的可信度,其中,PL /d)是当节点 d 产生告警,链路 L是故障链路的条件概率,PL)是链路的权重,即链路发生故障的概率。节点产生告警的概率,可以用式(3)来计算,其中 L-numi表示第个业务经过的链路个数 Lnum. Snum是具有相同宿节d 的业务个数。


629f121572fac_html_85532ce7193068ff.png

图1、精简的链路结构

常见的链路结构可以精简为图 1。其中节点 D 为业务的宿节点,那么经过该节点的业务要么是单业务, 则这时业务的路由可以抽象为图1(a)所示的链路结构。当宿节点 d的业务不止一个时,可以抽象为图1(b)所示的链路结构。以两个业务均以节点 D是宿节点为例, 当 D节点是单业务的宿节点时, 如图1(a)所示,设每个链路的故障概率为 P(L),那么 D 节点产生告警的概率是Pd)=1-(1-PL2,因为在图1(a)中,宿节点为D 的业务S1 经过的链路数2,每个链路正常的概率是1-PL),若节点D产生告警,则该业务经过的链路至少有一 条发生故障,根据概率的相关性质,可以得到上述的结果。当多业务的宿节点相同时,先计算每个单业务全部正常的概率,宿节点产生告警,则代表至少有一个业务发生了故障,因而利用同样的方法,只需要得到具有相同宿节点的业务数目即可,进而可以推广到宿节点相同的业务数为两个以上的情况,计算结果如式(3)所示。

根据全概率公式,PL/ d )可以用式(4)来代替。在式(4)中需要注意的是,Pd /L)有两种情况,第1 种就是链路 L 发生故障会引起宿节点 d 告警, 因为有宿节点为 d 的业务经过链路L,因而链路 L发生故障与宿节点d 告警相关。另外一种情况是宿节点为 d 的业务不经过链路 L,因而链路 L发生故障与否,与宿节点告警不相关,在这种情况下,宿节点不会产生告警。结合网络的拓扑和当前承载的业务信息,式(2)可以用式(5)来代替,

PL/d )= Pd /LPLPd) (4)

FCLd )= PL)(1-Pd ))/(Pd)(1-PL))) (5)

接下来,讨论当多个告警由同一个故障引起时的情况。如果当多于一个受影响的业务是由同一个链路发生故障引起的,则根据收到的告警计算由多个告警组合证据推断链路就是疑似故障链路的联合可信度。以d1 d2告警,进而推断 L 就是疑似故障链路的联合可信度的计算过程为例,

Fci(L)=Fc(Ldi)max{0,Fc(di)} (6)

Fc(Ld)=Fc1(L)+Fc2(L)-Fc1(LFc2(L) (7)

根据可信度的推算方法,可以得到式(6)以及式(7)。需要注意的是,文中的可信度模型,认为所有的告警信息均是由当前网络发生故障引起的,不考虑其他的影响因素。因而上述可信度模型中的告警证据都包含有故障的相关信息,不存在证据不存在的情况,因而修改上述不确定推理技术中可信度的值域FC(H,E) 为[0,1]以及去掉可信度表达式中的负数部分。


三、采用可信度模型的故障定位算法

全光网中多故障定位流程如图2所示,文中主要提出两种采用可信度模型的故障定位算法,隶属度-可信度故障定位算法(Membershipbased Credibiliry  Model Algorithm,MCMA)以及联合可信度故障定位算法(Combination Credibiliry Model Algorithm,CCMA)。这两种算法均基于可信度模型,算法输入都是故障图2多故障定位流程告警二部图,并利用贪婪策略筛选出疑似故障链路,进而完成多故障定位,但是处理各自算法的权重因子不尽相同,前者引入模糊数学中隶属度的概念,该方法中的权重因子是模糊隶属度以及可信度共同作用的结果;后者联合可信度模型算法是利 用 组合证据的联合可信度来完成最终疑似故障链路集合的选取。之所以选择贪婪策略是因为在可信度模型中,证据 E 的出现会增加结论为真的可信度,并且证据 E的出现对 H为真的信任度越大,则FC(HE) 的值越大。因此,有理由相信,利用初始证据,经过推理计算得到的最终结论的可信度FC(HE),若FC(HE) 值越大,则证明此次推导过程越接近真实的场景,那么该链路将最有可能是故障链路,因而,文中提出的两种算法均采用贪婪策略进行故障链路的选择。

629f121572fac_html_ba6c47c13591586e.png

图2、多故障定位流程

(1)隶属度-可信度故障定位算法(MCMA)。该算法的提出是结合不确定性推理技术中两种重要的处理手段:概率论以及模糊数学,在可信度模型的基础上,提出隶属度的概念,利用可信度与隶属度的双重约束计算 MCMA 的权重因子α

,采用贪婪策略来选择具有最大权重因子的链路,则该链路就是最终的疑似故障链路,将该链路加入到疑似故障链路集合RF中,提出故障定位成功率 Location Accuracy 这个性能指标,来衡量最终算法的定位准确性,该指标的定义是成功定位的故障链路数与所有定位的故障链路数的比值,其值越高,代表该算法的定位越精确。

(2)组合可信度模型算法。该算法的提出主要是利用可信度推理技术中组合证据的合取算法,由于多个证据可能同时推出同一个结论,并且具有不同的可信度。同一个链路故障,由于拓扑的连通性以及故障传播模型,会导致许多业务中断,这些业务的宿节点都会针对该链路的故障信息进行告警,因而利用证据的合取性质进行同一个链路故障与否的推导具有合理性。最终,同样利用贪婪策略来选择最大权重因子的链路,则该链路就是最终的疑似故障链路,将该链路加入到疑似故障链路集合 RF中,利用故障定位成功率 Location Accuracy 这个性能指标,来衡量最终算法的定位准确性。该指标的定义与 MCMA相同,都是成功定位的故障链路数与所有定位的故障链路数的比值,其值越高,代表该算法定位的性能越好。与MCMA 不同的是,CCMA 中的权重因子只由组合可信度决定。


四、仿真结果与分析

在2M光网网络仿真系统中,模拟了在 NSFNet 和 SmallNet 两种拓扑中采用可信度模型的故障定位算法的性能。该仿真运用的对比算法是我们的模糊算法(FuzzyArithmetic,FA),模糊算法在处理故障告警的二部图时,是给每个故障告警的连接分配告警隶属度,该连接的模糊隶属度越大,代表该链路越有可能是故障链路。

629f121572fac_html_edcafd28e201487b.png629f121572fac_html_27071c3eb8b00146.png

图3、 NSFNet拓扑下故障成功定位率 图4、SmallNet下故障成功定位率

由图3和图4可以看到,随着业务量的增加,故障定位成功率均呈现增加的趋势,提出的两种算法性能均优于对比算法,且可信度权重因子α=1时,性能最优。这说明提出的两种算法能够很好适应故障数目的随机变化,有效利用故障信息,结合可信度推理技术,进行告警与故障的不确定分析,从而有效地进行故障定位。通过对比分析,还可以看到,这两种算法在稀疏度差别较大的两个网络中的故障定位性能都比较优越。因而,这两个算法具有良好的扩展性,可以适应不同的网络拓扑。与此同时,对比算法的性能受到故障数目的制约,当故障数目或是业务信息较少时,产生的告警消息必然也相应减少,此时,告警隶属度不能深入地挖掘故障与告警的不确定性关系,因而其故障定位成功率稍差。可信度权重因子α=1,α=0时,MCMA 的算法性能也有差异,这是因为α=1,相当于只考虑单个故障与告警连接的关系,而没有综合考虑触发告警数目 的隶属度的因素,根据证据的推导,最有可能的故障链路一定会拥有最大的可信度因子。与此同时,却不一定能够触发最多的告警数目,告警数目的多少取决于当前的网络拓扑,以及业务配置情况,只能说具有最大的可信度的故障链路,有较大可能触发最多的告警数目。因而,引入触发告警数目充当疑似故障链路的证据进行推导,本身就存在模糊性,二者之间不存在必然联系,因此会导致引入触发告警数目时,其定位性能与不引入触发告警数目的情况的差别。同理,CCMA 引入的组合可信度,也可能引入干扰性的告警,导致最终疑似故障链路的推导出现问题,影响了成功定位的故障链路个数以及故障定位成功率。


五、结束语

综上所述,本文简述了光网络故障诊断的研究意义,分析2M光网络故障诊断的方法。提出了采用可信度模型的两种启发式故障定位算法,通过不同的网络拓扑以及其他的算法对比,对这两种算法以及可信度模型的正确性进行了验证,实现了完整的采用可信度模型的多故障定位技术。


参考文献

[1]吴简,李兴明.基于动态模糊关联规则推理的光网络故障管理[J].光电工程, 2012,39(7): 13.

[2]李妍琰,何勇.光纤通信网络中故障优化诊断方法仿真[J].计算机仿真, 2014, 31(9) : 221.

[3]堯县,张静,张乐,等.光分配网故障诊断技术研究与应用[J].光通信研究, 2012(1): 16.