在线环保监测系统中的大数据浅谈

(整期优先)网络出版时间:2017-04-14
/ 2

在线环保监测系统中的大数据浅谈

王涛

天津市津南区环境保护监测站天津市津南区300350

摘要:由于S02的排放在电力行业的废弃物中是最令人头疼的,所以为了使总量排放更大程度的降低,笔者通过数据挖掘技术中的关联规则算法,从而经过数据预处理,对各种算法加以利用,从而提出了脱硫监测数据参数波动模型和参数预测模型,对数据之间的联系有效地寻找出,为“智慧环保’,提供可靠依据。

关键词:智慧环保;数据挖掘技术;关联规则算法;脱硫监测

引文:本文利用数据挖掘中的关联规则算法对脱硫监测数据进行处理,提出了脱硫设施参数波动模型、参数预测模型,并且说明了模型的可行性和有效性,起到了提高脱硫效率的作用。

1数据挖掘技术

一般情况下,数据挖掘技术需要经过问题定义、数据收集、数据预处理、数据挖掘算法等阶段。

1.1数据准备阶段

这一过程,也可以分为三个不同的阶段:数据的选择、集成以及预处理。

1.2数据挖掘阶段

该阶段主要包括以下四步:第一,确定怎样产生假设。第二,选择数据挖掘过程的合适算法。第三,获取数据的知识。第四,验证获得的知识具有有效性。

1.3挖掘结果的表达和解释阶段

对数据集通过数据挖掘后所获得的知识进行评估是很有必要的,因为有时候数据挖掘产生的结果也许实用价值很小或根本没有实际意义,甚至可能会歪曲数据的实际意义,所以就需要剔除用户不感兴趣的知识,采用降低冗余模式的方法,把对用户而言有实用价值和实际意义的知识给保留下来,修剪或删除对用户而言没有价值和意义的信息,最后通过决策支持工具把保留下来的信息传递给决策者,对其决策提供支持。

2关联规则算法

关联规则用于海量数据的分析和处理。假设数据项集XI,B、A分别是事务集D中包含X、Y的事务数目,那么数据集X的支持度定义下:

在实际操作中,把挖掘流程分为如下两个程序:第一步,事先找出事务数据项集当中所有的频繁数据,这是主要步骤,是衡量关联规则挖掘算法的主要标准;第二步是通过第一步产生的频繁项目集来得出强关联规则。

3数据挖掘技术在智慧环保系统中的应用研究

3.1选取数据和预处理

本文选取的数据集来自上海一家环境科技有限公司对某地电厂脱硫设施进行监测的数据,在电厂脱硫设施工序中设置了4个监测点,分别为WL_DC_01、WL_DC_02、WL_Dc_03、wL_Dc_04。600Mw是电厂脱硫设施机组的容量,电厂脱硫设施采用的是石灰石石膏湿法进行脱硫处理。在不同时间对4个监测点进行数据监测,其时间间隔为1小时。本次监测时间跨度为3个月,分别为2015年5月、2015年6月、2015年7月。

从具体的工况进一步筛选出主要监测参数数据,进而把FGD出口处二氧化硫的浓度以及脱硫的效率当作过滤属性和分类属性的子集,把FGD进口处二氧化硫浓度、吸收塔PH值等14个属性作为主要的研究对象,并且为了方便研究,把这14个属性设置为Al/AZ/A3/A4/AS/A6/A7/AS/Ag/A10/All/A12/13/A14,关于这14个参数的设置。

确定14个属性作为主要研究对象,清理掉其他的属性参数,这种做法主要两个好处:首先使得数据的范畴得到了削减,大大简化了数据的繁杂程度,对数据挖掘的实际操作提供了很大方便;其次,通过降低数据处理所要完成的工作总量,来达到提高工作效率的目的。

3.2脱硫设施的数据结构模型的建立

3.2.1建立参数波动模型

对于每个参数属性的单个计算来说,互相之间的关联性缺少一定的联系。利用经典关联规则算法中的aPriori算法,对14个参数互相之间的相关性进行分析。通过对电厂脱硫设施wL_DC_01获得的数据进行预处理之后,经过差值计算,可以得出脱硫监测设备在同时满足下面4个条件时是正常工作的:

(AZ一A9)2<0.72

(A4一AS)2<0.68

(AS一A8)2<0.76

(Alo一通13)2<0.85

这个是脱硫监测设施的参数波动模型。其是由电厂脱硫设施1号机组所获得的脱硫监测数据产生的,同时利用wL_DC一02、WL一DC_03、WL_DC_04这三个机组获得的数据,验证参数波动模型,也得出当脱硫监测设备同时满足以上4个条件时,脱硫监测设备正常运行,因此可以得出参数波动模型的有效性。脱硫监测设施运行是否正常,可以利用这个模型得知。一旦发现非正常工作状态,可以在第一时间做出应对,大大提高脱硫效率以及降低污染物的排放。

3.2.2建立参数预测模型

依照脱硫效率做出分类,利用关联规则的属性进行参数选择,其中评价算法选择CFS,而搜索方法选择BestFisrot将得到的与脱硫效率有关的7个属性参数通过多元线性回归方程进行计算,进而预测脱硫设备的脱硫效率。

式(4)中,z是预测的脱硫效率值。将式(4)定义为脱硫监测数据参数的预测模型,可以将实际监测的数据通过该预测模型得出脱硫效率的预测值,然后与脱硫效率实际值进行比较,看是不是在允许的误差范围里。如果是,那说明脱硫设施运行正常,否则脱硫设施可能存在故障,得及时做出检查,避免污染物排放量过高。

3.3预测结果与应用性评价

对于脱硫效果,从电厂脱硫设施1号机组wL_DC_01所获得的脱硫监测数据,通过预测模型所得的预测结果和实际所监测的数据进行对比的散列图。

可以看出,在脱硫设施正常运行的情况下,脱硫效率高于95.5%,同时可以看出脱硫效率的预测值与实际值相差最大为4.0%,由此可知参数预测模型是有效并且有实际意义的。

从电厂脱硫设施2号机组wL_C_2,3号机组wL_DC_03,4号机组wL_DC_04,预测结果和实际监测结果进行对比的散列图:相应的参数模型,为环境保护部门和电力公司做出决策提供准确根据,最终实现社会、经济、环境多方面效益共同提升。所得预测结果和实际监测数据的对比散列图与以上一致,都可以看出脱硫效率预测值与实际值相差最大为4.0%,所以验证了参数预测模型是有效的,并且是有实际意义的。

本文所得出的参数波动模型和预测模型对于上海这家环境科技有限公司对电厂脱硫设施进行智能化管理有明显的效果,对其他脱硫设施也许不是很吻合,因为电厂脱硫设施中影响设备是否正常运行存在很多因素,是特别繁杂的,如果要开展最为精准的分析活动,除了对脱硫设施中的各项数据参数指标的含义以及特点做到完全掌控,对于参数彼此之间的关系和互相间的影响也要有全面的了解。如果更换脱硫处理方法,改变机组大小,那么脱硫效率会发生很大变化。对于其他脱硫监测设备,可以采用本文的方法和模式,来得出相应的参数模型,为环境保护部门和电力公司做出决策提供准确根据,最终实现社会、经济、环境多方面效益共同提升。

4结语

尽管本文对电厂脱硫监测数据运用关联规则算法进行数据分析,取得了良好的成效,在解决实际问题中起到了重要作用。但此过程涉及到了繁杂的数据,在数据处理中,除了参考专家的建议和环境保护部门的意见之外,与此同时不考虑一些目前短时间不关心甚至无序和杂乱的数据,对脱硫设施中的脱硫监测数据采取了简单的手段,这样操作可能会影响到结果的完整性。

参考文献

[l]尹晓远,李红华,杨竞佳.智慧环保物联网及技术应用示范[A].《2012中国环境科学学会学术年会论文集(第二卷)[D].2012.

[2]吴勇,张红剑.基于大数据和云计算的智慧环保解决方案[J].信息技术与标准化,2013:38一41.

[3]刘锐,詹志明,谢涛,等.我国“智慧环保”的体系建设探讨[J].环境保护与循环经济,2012:9一14.