地震前兆观测异常数据检测方法研究

(整期优先)网络出版时间:2021-05-21
/ 2

地震前兆观测异常数据检测方法研究

张弘颖

21090219800322 **** 辽宁省阜新地震台

摘要:我国受到印度板块、欧亚板块以及太平洋板块的共同作用,其地震灾害的强度和频率均较大、分布范围较广,人民的生命财产安全容易受到严重威胁。因此对地震的分析预报工作极其重要,而保障其工作的基础就是能够切实观测到地震前兆的异常数据,所以我们必须要对地震前兆观测异常数据的检测方法加以重视。本文基于数据挖掘中的算法,利用地震前兆中时序模式的表现方式,对数据序列中较为显著的异常数据加以观察检测,以期能够为地震前兆数据的分析预报工作提供保障。

关键词:地震前兆;观测;异常数据;检测方法


0、引言

在预报地震以及进行其他科研时需要提前对地震前兆加以观测,并且其研究结果的有效率直接受到地震前兆观测数据的质量以及数量影响。所以,在地震监测时,地震前兆的观测工作是非常值得重视的。由于时代的不断进步,我国在前兆观测方面的技术也逐渐得到发展,其观测系统也已经具备多范围、多学科、数字化、高智能化的时代特点。目前,我国的地震前兆观测系统因为数据的采样率以及产出精度两方面均有所提升,数据量也相应地得到了激增,这就使得前兆台网以及台站每天所要检查的数据汇集工作量迅速增多。与此同时,在实际进行前兆观测时还极易容易遭受各种因素的影响,例如:雨量、观测环境、雷电、电压改变、停电、外界干扰等,这时,在地震前兆观测数据上就极其可能存在众多的异常数据,例如:数据毛刺现象、台阶跃变现象以及大幅突跳等状况。


1、异常数据检测

在进行数据挖掘的过程中,异常数据检测是极其重要的工作内容。自从上世纪以来,经过国内外学者的不断研究,许多异常数据的检测方法层出不穷,并被广泛应用于不同领域。但随着深入的应用检验发现其大多都是在对无序数据集进行收集,这就表明其并不能很好的服务于地震前兆异常数据的观测工作,因为地震前兆数据是典型的时间序列。对于时间序列本身来说,其多为高维数据,在对其加以实际操作时,必须提前做好降维准备工作。现今,在时间序列中,反映数据的模式相对较多,例如:频域、分段线性、符号、奇异值表示等反映手段,优缺点各异,在实际应用的过程中必须以切实数据为基础情况加以抉择、裁减工作。目前,地震前兆观测数据大部分是以分钟、更有甚是采取秒钟加以采样的等间隔时间序列,其保存单元多是以每天观测数据为基础的。地震前兆数据观测的对象可分成三大学科,分别是:电磁学科、流体学科、形变学科,不同科之间存在多种测项,每一测项之间又存在一至多种分量。实际进行数据处理或是应用之时都是以分量为基础而进行操作的。其测项分量的数据都是时间序列,因此种类繁多,序列也比较长,量级、曲线的表现形态上存在的差异往往又非常大,这就无法保障前兆异常数据检测方法的有效性。因此,本文使用时间序列中的模式异常检测方法,其能够兼顾到实际点的异常检测。


2、前兆异常数据检测具体步骤

进行异常数据挖掘工作的实际步骤如下:数据分割点确定、确定分割点后,使用模式对每一子序列进行反映、使用某一方式使得异常模式得到确定[1]

2.1、数据分割点确定。对于原始序列的分割方法来说,其数量较多,可以借由拟合误差对分割点加以最终确定,也可以应用原始序列对等间隔进行区分。

2.2、确定分割点后,使用模式对每一子序列进行反映。在具体检测时,需要检测的数据一般容易出现短时台阶或者大幅突跳等细节特征状况,如果仅仅使用普通模式来进行表示,势必会使得细节发生丢失,进而使得研究目的无法达成。所以,本文结合地震前兆数据的特点以及具体的检测目标,设计了模式表示方法,就是用模式均值、模式极差、模式标准差以及模式长度四个特征值进行模式表示。其中模式均值是各个模式趋势的表示;模式极差就是模式高度,将不同模式之间的变化波动反映出来;模式标准差就是将不同模式之间的数据离散程度表示出来;模式长度则代表了各个模式内的趋势变化的长短。序列中的异常数据普遍都有表现一至多个特征值异常。其特征值的量级、量纲也相异,这容易使得异常检测的结果受到影响,因此,在实际运算前需要先进行特征值的处理,将其归纳到(0,1)的区间之内。

2.3、使用模式对原始序列进行反映后,为确定某一模式有没有异常之处,需要将此模式和其它模式之间的差异程度加以对比衡量。本文使用局部异常因子进行对比衡量。这种基于密度的异常数据检测方式多是与距离基础有关,可以使得局部数据得到更好的检测。


3、实例应用分析

分别使用数据库中3个不同学科相异测项的原始产出数据加以实验检验。笔者使用ARIMA模型方式加以缺值插补,分别应用了云南丽江地震台动水位(测项代码为4222)观测数据、广西灵山地震台重力潮汐(测项代码为2323)观测数据和山西夏县中心地震台南北向地电场(测项代码为3777)观测数据作为实验测项数据,对2011年全年数据加以实验运算检测(检测结果如下表1.1所示)。

表1.1 实验异常检测结果统计表

检测项分量代码

总天数

检测异常(天数)

实际异常(天数)

误检(天数)

误检率

漏检天数

漏检率

时间

准确率

4222

365

225

250

14

3.83%

19

5.20%

31.74

90.74%

2323

352

120

94

29

8.23%

0

0%

188.64

93.02%

3777

365

320

341

4

1.25%

6

1.64%

289.75

98.20%

由此不难看出,三项异常检测结果准确率都达至90%以上,可以满足绝大部分观测系统的需求。对于检测时效来说,虽然具体用时差异较为明显,但观测数据时间为一年,具体检测时间却只有几分钟,证明此项检测方法的时效性可以得到保障。经检测结果表明,此项检测方式的准确率以及时效率均可,实际应用时能够使得相关检测人员的工作强度降低,地震前兆异常数据检测工作的速度以及准确性得到保障。


4、结束语

综上所述,将地震前兆数据的特点与检测目标相结合,利用时间序列异常数据模式方法检测前兆异常数据。其不但能够使得大多前兆数据预处理方式的缺点得到弥补,还可以提升具体前兆数据检测过程中的效率以及准确性,使得前兆数据相关观测工作人员的工作强度与工作时间得到大幅度降低,并且使得其工作质量也可以得到相应的保障,这对地震前兆异常数据的预处理工作意义颇大。


参考文献

[1]韩凯旋.地震前兆异常时间序列识别研究[D].河北师范大学.

[2]刘子维.地震前兆数据异常识别关键技术研究[D].武汉大学,2016.

[3]吴利军,杨颖.一种地震前兆观测数据异常识别方法:CN109765614A[P].2019.

[4]张聪聪.地震前兆观测数据异常检测方法研究[D].中国地震局地壳应力研究所,2015.

[5]成万里,王秀英.基于数据的前兆仪器分辨力检测方法研究[J].山西地震,2018, 000(003):10-13.

[6]Harika,Narumanchi,Dishant,等.数字化地震前兆台网观测数据质量评价方法[C]//IEEE International Conference on Smart Cloud.

[7]王秀英,张聪聪,王成亮.一种前兆观测时序特征量的数据检测方法[J].大地测量与地球动力学,2015(03):533-536.

[8]杨振鹏,孙素梅,赵倩,等.辽宁地震前兆台网观测数据跟踪分析探讨[J].防灾减灾学报, 2018,34(02):48-52.

[9]杨德贺,袁静,王秀英,等.形变观测数据的多异常形态统一识别[J].地球物理学报,2017, 060(012):4623-4632.