一种基于线性回归的多成分气体组分浓度校准方法

(整期优先)网络出版时间:2023-09-07
/ 3

一种基于线性回归的多成分气体组分浓度校准方法

张之

利晟(杭州)科技有限公司  310000

背景

近年来,利用ppb级电化学传感器以网格方式监测区域空气质量日益成为在线监测的新热点。综合各地给出的监测方案,普遍将二氧化硫、二氧化氮、臭氧、一氧化碳作为主要监测因子。电化学传感器在监测上述气体时普遍面临一个问题,四种气体在传感器上存在相互干扰,导致传感器输出不能正确反映气体浓度,必须校准。

例如,二氧化氮传感器在接触臭氧后输出降低,即使二氧化氮成分并没有变化。有两种方法解决上述问题:一是Honeywell的采用隔离膜,隔离臭氧;二是通过计算这两种气体的相关系数,从数值角度校准测量结果。

上述两种方法在实践中均存在重大缺陷:现实中往往是多种气体混合,存在复杂的相互干扰而不只是两种气体的相互干扰,隔离膜效果有限而两种气体间相关系数无法直接用于混合气体。在建立空气质量监测网络中,这个问题不可回避,必须在一定程度上给与解决。

主要实验设备及器材

Thermo Scientific 43i-TLE 型痕量SO2 分析仪

Thermo Scientific 48i型痕量 CO 分析仪

Thermo Scientific 49i 型臭氧分析仪

Thermo Scientific Model 42i-Y NOY 分析仪

聚光科技 AQMS-200动态校准仪

电化学传感器:Alphasense的B4系列电化学传感器:SO2-B4、NO2-B43F、CO-B4、OX-B431,分别对应二氧化硫、二氧化氮、一氧化碳、臭氧,四种气体。

实验条件

环境温度为25℃;环境湿度为50%RH;气压为1个标准大气压。二氧化硫、二氧化氮、臭氧,三种气体输出浓度区间为0~1000ppb,一氧化碳输出区间为0~10ppm。标准仪器设置量程为:二氧化硫、二氧化氮、臭氧,三种均为(0~2ppm);一氧化碳(0~20ppm)。此浓度区间大部分处于传感器线性较好区间,同时也是大气环境监测的主要区间。

实验步骤

  1. 单一组分气体传感器校准

通过单一组分气体校准传感器。首先通入含氧20%氮气(标准空气),校准传感器零点。然后通过动态校准仪将浓度为500ppb标准测试气体通入,校准传感器半量程。最后经动态校准仪将浓度为1000ppb的标准测试气体通入,校准满量程。

重复上述步骤,直至将四种待测气体传感器均完成校准。

  1. 混合气体基准测试

混合气体测试具体过程分为两部分表述。首先,混合气体通气方案为:

四种气体以随机浓度,随机时间通入混合室。

每次通气时间不低于2分钟,不超过5分钟。

每种气体在测试过程中至少通气2次,每次通气间隔不少于30分钟。

通气浓度通过动态校准仪设定,进入混气室后,通过标准监测设备监测四种气体浓度变化。同时,以0.6~0.8L/min的流量从混合室抽取气体送入流通槽,依次通过四个传感器,传感器输出数据以5秒为周期记录。

24小时后,以标准监测设备数据为标准,对传感器数据进行数据分析,利用线性规划方法,得到四种气体间的相关系数。这些系数将在步骤3中直接用于校准传感器输出数据。

  1. 混合气体参数验证

在此阶段,按前述步骤1校准传感器,然后按步骤2混气通气方案再次通气并记录数据。最后,将传感器输出数据经相关系数计算后与标准监测设备数据比较,分析误差。标准仪器记录数据以分钟为单位,故将传感器输出数据进行整理取分钟内平均值。

处理思路

线性回归(Linear Regression)是数理统计中的回归分析中的一种,当回归分析中包括两个或两个以上自变量时,称为多元线性回归。使用线性回归有几点前提需要考虑。

  1. 自变量与因变量呈线性关系或近似线性关系。四种气体浓度区间为0~1000ppb,除低于传感器检出限(小于20ppb)部分非线性严重外,其余区间均具有良好线性。(此处引用传感器资料)
  2. 因变量是否符合正态分布。作为成熟产品,某一传感器面对与其匹配的单一待测气体时,在测试浓度范围内我们认为是其线性输出稳定的,残差仅来源于噪声且满足正态分布。但是面对多种干扰气体,且浓度存在变化情况时,传感器输出是否仍能满足正态正态分布或近似正态分布则未知。例如,对二氧化硫传感器通入二氧化氮时,其残差也应满足正态分布。为确定残差分布状况,我们进行了补充实验,简述如下:稳定通入500ppb浓度二氧化硫,然后通入浓度为200ppb的二氧化氮,待传感器输出稳定至少10分钟后,降低二氧化氮输入浓度50ppb,等待传感器输出稳定至少10分钟。然后以降低输入浓度时间点为中心,取前后5分钟数据进行分析

下图为补充实验结果:

补充实验中,混气成分只有标准空气(氧气、氮气)、二氧化硫、二氧化氮。实验中虽无臭氧输入,但臭氧传感器有明显输出。一氧化碳传感器全程基本维持0值,无统计意义上的变化,故未在左图中。右图为二氧化硫传感器在变动前后残差分布。浓度变化前后各传感器标准差见下表。

sensor

before

after

SO2

6.1629

6.1735

NO2

4.5103

4.4116

O3

5.2656

5.1065

在二氧化氮浓度变化前后标准差未发生显著变化。不同混气组合均能得到与之类似的无统计差异结果,故可以认为实验过程中各传感器噪声均能保持稳定的正态分布。

  1. 自变量相互独立。本实验通过动态校准仪实现各气体浓度独立受控,不存在两种或多种气体浓度关联变化输入。
  2. 方差齐性。传感器工作区间方差受控,不随浓度增加而发生显著偏移,此处不再展开。

考虑到实验中各主要因素都基本满足条件,预期采用线性回归对实验数据进行处理能获得较好结果。

数据分析

  1. 原理

通过多个样本的线性组合来近似描述函数变化,寻求从特征空间X到函数空间Y的最优线性映射即为线性回归。表达为:,通过寻求某超平面,使得所有样本到此平面欧氏距离之和最小,可解得

  1. 数据分析区间及误差约定

根据《环境空气质量标准》,将数据分析区间集中在小于二级浓度限值120%的区间内(对应空气质量等级:差、极差)。

根据《微型环境空气质量监控系统的环保产品认证实施细则》、标准仪器工况、传感器检出限、线性区间等情况综合约定:低于标准仪器量程5%的数据不做误差分析。即二氧化硫、二氧化氮、臭氧,三种气体低于100ppb、一氧化碳低于1ppm。

  1. 参数估计

由步骤2所述混合气体基准测试结果如下:(蓝色为标准仪器输出数值,橙色为传感器输出未校准数值)

由图可见,二氧化硫、臭氧传感器受气体间相互干扰严重。二氧化硫无法直观确认成分变化;而臭氧输出总体偏高且有无法解释的峰值。二氧化氮、一氧化碳则表现为恒值干扰。

对原始数据进行线性回归分析后,获得参数,拟合后数值与标准仪器输出对比如下图:

从拟合效果上看,总体偏差较小;二氧化硫传感器受干扰超过其他传感器,尤其是二氧化氮气体对其干扰。拟合评价:二氧化硫:0.9353、二氧化氮:0.8513、臭氧:0.9110、一氧化碳:0.9880。

峰值处出现统一偏小的状况(臭氧尤为明显),我们认为出现此现象的原因有两点:一是较高浓度气体通入的冲击效应,基于光学原理的标准仪器反应速度高于电化学原理传感器;二是线性回归算法本身是一种基于平均值的算法,对峰值有削弱作用。

  1. 参数验证

参数验证过程采用相同的通气方案。然后对传感器输出直接用前面得到的参数进行校准产生校准值。实验结果如下图:

实验结果表明通过线性回归获得的参数能有效反应各气体浓度变化趋势。总体上校准值略小于标准仪器输出值。剔除臭氧尖峰值后,各传感器校准值与标准仪器输出值最大偏差小于15%(二氧化硫:14.2%、二氧化氮:8.6%、臭氧:14.7%、一氧化碳:7.9%),取小时平均值后偏差进一步缩小至10%以内。

  1. 讨论

上述实验中,步骤2选取数据量多少对最终结果有明显影响。当只选取一次通气数据时,计算所得参数无法完成步骤3验证。当选取数据量超过3次通气数据时,其结果与3次相差极小。当数据远超3次时,由于存在各种外界因素干扰(气瓶换气、温湿度变化),会引发无法区分数据冲击来源的欠拟合问题。

除数据量选取外,另一个对实验干扰较大因素是传感器本身。将四个传感器中的任何一个即便替换为同品牌同型号产品,对实验结果会带来较为明显的影响。尤其是受气体相互干扰较为明显的传感器,例如SO2-B4二氧化硫传感器。通过对二氧化硫传感器的多次实验,我们发现线性度相差较小的传感器替换对实验结果影响相对较小,反之则影响较大。

从实验获得的参数看,测试浓度下,其他三种气体对二氧化硫、二氧化氮、臭氧传感器的影响权重是一氧化碳的数百倍。而一氧化碳传感器对其他三种气体也不敏感,因此可将一氧化碳传感器单独校准,而其他三个传感器联合校准,我们在实际测试中也取得了较好效果。

对于峰值误差我们也尝试进行了一些处理。实验结果中冲击区域数据拟合效果差而平缓区域效果好,从函数角度看此现象,意味着高次项存在作用。即从开始的变为二次多项式回归,以扩展到非线性领域的办法尝试解决。扩展后确实改善了冲击区误差较大的问题,但也带来了三个困难:一是不能确定给出有效的,解出值多数情况近似于0,这就回到一次项情况;二是在步骤3验证环节很容易出现数据极端化情况,校准后数据极大或极小,远超量程。三是计算及验证调整周期变长,效率下降。传感器替换操作带来的负面效果在这里也被进一步放大,而替换损坏或寿命到期传感器在实践中极为常见,此方法效能无法应对。处理冲击区需另行讨论方案,故对峰值误差没有进一步处理,维持当前处置方案。

结论

在测试浓度区间内,线性回归方法能较好解决大气环境下基于电化学原理的二氧化硫、二氧化氮、臭氧、一氧化碳浓度监测的校准问题。线性回归方法的优势在于其算法成熟,运算效能高,在嵌入式系统中也能实现快速应用。

对于网格化布点的大气环境监测网络,无论采用云平台或嵌入式系统,线性回归方法都是一个低成本的校准方案。对于云平台,现场端可简化为采样通讯设备,而回归算法由云平台执行,实现算力优化;对于嵌入式系统,线性回归算法成熟高效,设备开发及运行负载都小,综合运营成本低。

线性回归方法也存在一定缺陷,主要体现在对冲击峰值的处理上。解决这个问题一方面有赖于在传感器技术上有进一步的发展,提高响应速度及准确度;另一方面也需要进一步研究寻求更佳的数值处理方案。

参考文献

[1] HJ 654—2013 环境空气气态污染物( SO2、 NO2、 O3、 CO) 连续 自动监测系统技术要求及检测方法.[S]

[2] JJG 551—2003 二氧化硫气体检测仪检定规程.[S]

[3] JJG 801—2004 化学发光法氮氧化物分析仪检定规程.[S]

[4] JJG 1077—2012 臭氧气体分析仪检定规程.[S]

[5] GB 3095—2012 环境空气质量标准.[S]

[6] CCAEPI-RG-Y0402017 微型环境空气质量监控系统的环保产品认证实施细则.[S]

[7]蒋学悟,刘海韬,魏海明 电化学气体传感器测量干扰排除的探讨[C].中国土木工程学会城市燃气分会应用专业委员会年会 论文集, 2010.

[8] 张国城,赵红达,赵俊秀,潘一廷.两种微型空气质量监测站气体交差干扰的数学模型[J].计量技术,2020(01):46-49.

[9] 张晗. 基于物联网的传感器校正方法研究[D].北京交通大学,2017.

[10] 孙静茹.基于多元线性回归模型的空气质量数据校准——2019年大学生数学建模竞赛D题解析[J].黑龙江科学,2019,10(24):18-20.

[11] 舒林,刘浠,万天军,魏辰光. 基于线性回归的数据处理方法研究[C]. 中国航空学会.2019年(第四届)中国航空科学技术大会论文集.中国航空学会:中国航空学会,2019:47-52.

[12] Alphasense, CO-B4 [EB/OL].(2019-9)[2020-6-17]. alphasense.com/WEB1213

[13] Alphasense, SO2-B4 [EB/OL].(2019-9)[2020-6-17]. alphasense.com/WEB1213

[14] Alphasense, NO2-B43F [EB/OL].(2019-9)[2020-6-17]. alphasense.com/WEB1213

[15] Alphasense, OX-B431 [EB/OL].(2019-9)[2020-6-17]. alphasense.com/WEB1213