基于Copula函数的莺落峡站月径流随机模拟应用

(整期优先)网络出版时间:2022-09-22
/ 3

基于Copula函数的莺落峡站月径流随机模拟应用

陈俊,王春红

浙江惠川水利工程技术有限公司,浙江杭州 310020

摘要:准确描述各月径流之间的联合分布,进行月径流随机模拟,是水利工程规划设计和防洪减灾重要的科学依据。本文以莺落峡水文站1945-2009年月径流序列为研究对象,利用Log-Logistic函数建立各月径流边缘分布并进行K-S检验。通过Clayton Copula、Gumbel Copula和Frank Copula三种不同类型阿基米德Copula建立相邻月径流的联合分布函数,得到各月径流之间复杂的相关关系。研究结果表明:在径流量较小的季节采用Clayton Copula更能捕捉相邻月份之间的相关关系,而在径流量较大的季节则采用Gumbel Copula更能捕捉相邻月份之间复杂的相关关系。本研究可为水资源规划和管理利用提供依据。

关键词:Copula函数;月径流随机模拟;莺落峡水文站;Log-Logistic分布


1. 引言

水文过程呈现特定的周期变化规律,同时也受气候、环境、地形和生物活动等诸多因素的影响,具有复杂性和随机性,因此随机模拟方法在水文领域内被广泛采用。

Copula函数可以将两个或多个随机变量边缘分布函数连接得到多变量联合分布,灵活构建联合分布来描述随机变量之间的依赖结构[1],由de Michele[2]首次引入水文水资源领域,建立了边缘分布为广义Pareto分布的降雨强度和降雨历时的联合概率分布,后来被广泛应用于洪水频率分析[3]、设计洪水地区组合[4]、降水要素分析[5]、干旱特征分析[6]、遭遇问题[7]、水文随机模拟[8]等方面。

本文旨在通过Copula函数建立月径流联合分布模型,以莺落峡水文站为例,通过Clayton Copula、Gumbel Copula和Frank Copula三种函数捕捉相邻月径流分布特征,刻画不同月径流之间复杂的相关关系,准确地描述径流联合分布规律,为水资源规划和管理利用提供依据。

2. 研究区域与方法

2.1 研究区概况

黑河是我国西北第二大内陆河,发源于青海省祁连山区的走廊南山和托勒山之间,流经青海、甘肃和内蒙古三省区[9]。莺落峡水文站位于黑河流域中游寒区,布设于1943年10月,控制面积10 009 km2,占全流域面积的6%[10]。以莺落峡站1945-2009年的月径流数据为研究对象,通过Copula函数刻画相邻月径流之间的相关关系。

2.2 边缘分布拟合

对月径流数据进行归一化处理[11]

       (1)

式中:SD代表归一化处理数据,OD代表实测数据,MN为最小值,MX为最大值,d取0.05。

选取对数逻辑分布(Log-Logistic,LL),采用极大似然估计法(MLE)估计参数。通过K-S检验等对分布线型的拟合优度进行检验。K-S检验是比较经验分布与理论分布的检验方法,拟合优度P值大于0.005则通过检验,越接近于1,则表明边缘分布拟合效果越好。假设H0:两个数据分布一致或者数据符合理论分布。计算两者最大差异值D=max|f(x)- g(x)|,取显著性水平α= 0.05,临界值Dα为0.16,当实际观测值D>D(n,α)则拒绝H0,否则接受H0

2.3 Copula函数

Copula函数作为边缘分布函数多维联合分布函数之间的纽带描述变量间相依性的一种有效工具[12]假设u=FX(x)v=FY(y)分别为连续随机变量XY的累积概率分布函数,由Sklar定理知,随机变量Copula联合分布函数为[13]

    (2)

Copula函数模型主要有2种,包括椭圆型Copula函数和阿基米德Copula函数。阿基米德型Copula函数构造简单、求解容易、只包含一个参数,在水文领域得到了广泛的应用。常用的阿基米德Copula函数主要有Clayton、Frank和Gumbel三种,其生成函数、参数取值范围及联合分布函数如表1所示。

表1 二元阿基米德Copula函数基本特征

Copula

函数

生成函数φ(t)

θ

C(u1,u2,…,un)

Clayton

θ>0

Frank

θ≠0

Gumbel

θ≥1

通过BIC判断拟合优度。BIC信息准则是衡量统计模型拟合优良性的一种标准,适用于检验通过极大似然法(MLE)得到的Copula函数拟合优度,包括拟合偏差与参数的不可靠性。表达式为

       (3)

         (4)

式中:MSE代表均方根误差,n代表样本长度,pi代表观测样本变量联合Copula概率计算值,pe代表对应多指标经验概率,m代表MSE残差平方和。AIC值越小则Copula模型拟合度越高[14]

3. 实例应用

3.1 边缘分布拟合结果

对各月径流数据进行归一化处理后,选用Log-Logistic函数对径流序列进行经验分布和理论分布拟合,采用极大似然法估计参数,通过K-S检验和均方根误差来检验边缘分布的拟合效果,结果如表2所示。在建立的12个月径流边缘分布中,所有月份K-S检验的

P值均大于0.005,说明LL分布适用于莺落峡站的月径流边缘分布拟合。其中4月、8月和10月的K-S检验的P值为1,对应的均方根误差在0.025以内。大多数月份的P值大于0.9,D值在0.1以内,RMSE误差在0.05以内,说明LL分布较能保持各月径流的分布特性。

表2 月径流序列边缘分布K-S检验和均方根误差

D

P

RMSE

1月

0.092

0.933

0.028

2月

0.123

0.680

0.033

3月

0.123

0.680

0.056

4月

0.062

1.000

0.025

5月

0.077

0.988

0.030

6月

0.092

0.933

0.030

7月

0.092

0.933

0.037

8月

0.062

1.000

0.025

9月

0.077

0.988

0.033

10月

0.062

1.000

0.021

11月

0.123

0.680

0.038

12月

0.108

0.824

0.030

绘制Log-Logistic分布的概率密度函数如图2所示,蓝色点表示观测数据的经验分布,红色曲线表示Log-Logistic概率分布。总体而言红色曲线与蓝色点表现出相对一致的变化趋势,均为先快速增加而后缓慢增加逐渐接近1,拟合效果较好。


图1 莺落峡站1-12月径流经验与理论概率分布对比


3.2 联合分布拟合结果

根据3.1节的边缘分布拟合结果,采用Copula函数构建联合分布模型。通过极大似然法估计Clayton Copula、Gumbel Copula和Frank Copula三种不同类型Copula函数的参数,并进行K-S检验,计算BIC,对比三种不同类型Copula函数的模拟效果,结果如表3所示。从表三可以看出:(1)各模型在各月份的K-S检验P值大于0.005,均通过检验。(2)以BIC为择优目标,则Clayton Copula建立的相邻月份联合分布BIC值最小的有5个,分别是12-1,2-3,3-4,4-5和5-6月,相对集中在径流量较小的春季和冬季。Gumbel Copula建立的相邻月份联合分布BIC值最小的有4个,分别是1-2,6-7,9-10,10-11和11-12月,相对集中在汛期之后的秋季。Gumbel Copula建立的相邻月份联合分布BIC值最小的有2个,分别是7-8和8-9月,集中在夏季汛期。(3)以K-S检验的D值为评价标准,则Clayton Copula、Gumbel Copula和Frank Copula最优的比例分别为58.3%、16.7%和25%。综合来看,对于莺落峡站,在径流量较小的季节采用Clayton Copula更能捕捉相邻月份之间的相关关系,而在径流量较大的季节则采用Gumbel Copula更能捕捉相邻月份之间复杂的相关关系。


表3 Clayton、Gumbel和Frank Copula参数及拟合效果检验

Copula

月份

θ

BIC

D

P

月份

θ

BIC

D

P

Clayton

1月-
2月

1.042

-416.122

0.047

0.949

7月-
8月

0.210

-488.234

0.061

0.761

Gumbel

2.221

-469.197

0.059

0.763

1.377

-485.822

0.056

0.809

Frank

6.468

-422.603

0.054

0.849

2.188

-494.406

0.057

0.800

Clayton

2月-
3月

1.435

-488.895

0.077

0.464

8月-
9月

0.125

-488.689

0.061

0.761

Gumbel

2.196

-456.370

0.086

0.290

1.272

-496.012

0.057

0.793

Frank

7.036

-415.361

0.085

0.304

1.682

-517.495

0.055

0.828

Clayton

3月-
4月

0.216

-479.613

0.069

0.599

9月-
10月

0.874

-437.543

0.035

0.997

Gumbel

1.385

-469.881

0.071

0.527

1.931

-549.783

0.037

0.994

Frank

2.751

-455.429

0.076

0.439

6.247

-524.532

0.036

0.996

Clayton

4月-
5月

0.333

-498.051

0.056

0.837

10月-
11月

1.560

-416.712

0.055

0.847

Gumbel

1.419

-487.747

0.0521

0.874

2.791

-492.500

0.057

0.788

Frank

2.432

-489.641

0.0524

0.870

8.100

-436.145

0.053

0.854

Clayton

5月-
6月

0.500

-513.800

0.066

0.665

11月-
12月

0.359

-412.303

0.063

0.721

Gumbel

1.491

-416.744

0.066

0.628

1.835

-503.991

0.073

0.499

Frank

2.553

-441.566

0.064

0.662

5.690

-427.036

0.068

0.594

Clayton

6月-
7月

0.317

-429.284

0.064

0.700

12月-
1月

0.848

-479.816

0.058

0.806

Gumbel

1.654

-484.390

0.065

0.643

1.523

-450.636

0.068

0.600

Frank

4.030

-482.610

0.071

0.540

3.253

-444.208

0.061

0.736


4. 结论

本文通过Clayton Copula、Gumbel Copula和Frank Copula建立莺落峡水文站相邻月径流的联合分布函数,描述各月径流之间复杂的相关关系。通过三种不同类型Copula函数模拟对比,得到结论:三种Copula函数均适合模拟莺落峡站的月径流相关关系,在径流量较小的季节采用Clayton Copula更能捕捉相邻月份之间的相关关系,而在径流量较大的季节则采用Gumbel Copula更能捕捉相邻月份之间复杂的相关关系。

参考文献:

[1]Vandenberghe S. A comparative Copula-based bivariate frequency analysis of observed and simulated storm events: A case study on Bartlett-Lewis modeled rainfall, Water Resour. Res.2011,47, W07529.

[2][ ] de MICHELE C,SALVADORI G. A Generalized Pareto intensity-duration model of storm rainfall exploiting 2-Copulas[J]. Journal of Geophysical Research: Atmospheres, 2003,108 (D2) : 4067.

[3]Grimaldi S, Serincesco F. Asymmetric Copula in multivariate flood frequency analysis[J]. Advances in Water Resources. 2006, 29(8): 1155-1167.

[4]闫宝伟, 郭生练, 郭靖, 等. 基于 Copula 函数的设计洪水地区组成研究[J]. 水力发电学报, 2010, 29(6): 60-65.

[5]De Michele C, Salvadori G. A Generalized Pareto intensity-duration model of storm rainfall exploiting 2-Copulas[J]. Journal of Geophysical Research, 2003, 108(D2), 4067.

[6]闫宝伟, 郭生练, 肖义. 基于两变量联合分布的干旱特征分析[J]. 干旱区研究, 2007, 24(4): 537-542.

[7]闫宝伟, 郭生练, 肖义. 南水北调中线水源区与受水区降水丰枯遭遇研究[J]. 水利学报, 2007, 38(10): 1178-1185.

[8]陈士永, 王祥三, 张涛, 等. Copula 函数和 AR 模型在洪水随机模拟中的应用[J]. 水电能源科学, 2009, 27(2): 1-7.

[9]蔡树香.黑河莺落峡水文站来水量趋势分析[J].甘肃科技,2015,31(15):40-42.

[10][ ] 王钰峰.加权马尔可夫链模型在黑河莺落峡水文站降水丰枯预测中的应用[J].甘肃水利水电技术,2015,51(08):5-7.

[11]HAO Z., SINGH V. P. Single- site monthly streamflow simulation using entropytheory [J]. Water Resources Research, 2011, 47(9): 178-187.

[12]Chen L , Qiu H , J Zhang, et al. Copula-based method for stochastic daily streamflow simulation considering lag-2 autocorrelation [J]. Journal of Hydrology, 2019, 578:123938.

[13]宋松柏,蔡焕杰,金菊良,等.Copulas函数及其在水文中的应用[M].北京:科学出版社,2012.

[14]崔刚,韩曦.基于Copula理论的甘肃省干旱特征分析[J].人民黄河,2015,37(11):77-80.


作者简介:陈俊(1985-),男,汉,浙江杭州,学士,工程师,主要研究方向:水利水电工程咨询、设计

作者简介:王春红,1988.03,女,汉,山东日照,硕士,工程师,主要研究方向水利工程规划与设计