• 收藏
  • 加入书签
添加成功
收藏成功
分享

多元线性回归分析在腊普河流域径流量中长期预测中的应用

李文芳 张伦
  
扬帆媒体号
2025年298期
云南省水文水资源局大理分局,云南大理671013

摘要:根据腊普河流域塔城(二)代表站197\~2021年、汛期、枯期实测径流量系列,分别与同期气温、累计日照小时数、降水量以及降水量年内分配(不同量级累积降水量占年降水量比重)、蒸发量等15个影响因子建立相关识别其显著水平,最终选择相关性显著的影响因子通过F检验、T检验、D-W值检验、复相关系数检验及预测成果合格率检验分别得出腊普河流域年、汛期、枯期径流量的多元线性回归分析方程应用于腊普河流域中长期径流预测。关键词:腊普河;多元线性回归分析;径流量;中长期预测

0引言

腊普河流域气候属中温带低纬季风气候,四季分明,雨水充沛,降水时空分布不均,合理有效的中长期径流量预报可作为解决来水和用水矛盾的非工程措施,能有效解决防洪抗旱、供用水供需不平衡等矛盾,通过统筹规划以缓解水资源供需矛盾、服务于流域水资源统一调度的现实需求,分析研究该流域中长期径流量预报方法既是地方政府及相关部门在防汛减灾及水资源调度规划工作中的技术支撑,也是迫切需要。

1概况

腊普河流域地处迪庆州维西傈僳族自治县塔城镇区域,腊普河源头色马里底河发源于云岭山脉的梨地坪一带,色马里底河在柯那村附近与柯公河相汇后称为腊普河。河流自西南向东北流经永春、塔城两个乡镇后,在小河口汇入金沙江,河流全长 74.2km 。目前流域内有塔城(二)水文站,双加马、使跨丁、柯挪、串处、其宗5个雨量站,塔城(二)水文站位于迪庆州维西县塔城镇塔城村,径流面积724km2,距离金沙江汇口处15km,是腊普河区域代表站,为国家基本水文站,属中央报汛站。

图1腊普河流域地理位置及站点分布图

2资料收集及使用方法

2.1资料收集

本次分析收集到流域内1977~2021年(以水文年进行统计)塔城(二)水文站月年径流量、维西气象站月年气温、月年累计日照小时数、月年降水量、流域内各代表雨量站降水量年内分配(中雨、大雨、暴雨、大暴雨、特大暴雨等不同量级以上累积降水量占年降水量比重)、塔城站月年蒸发量、年灌溉面积。通过已有的矢量地图数据,包括部分年份土地利用、森林覆盖和土壤侵蚀的矢量数据,在腊普河流域范围内包含的属性字段进行了部分年份的面积量算和相关数据统计。

2.2使用方法

2.2.1相关分析

相关关系是应用相关分析方法计算表示 ΔY 和X相关密切程度的统计数,即相关系数,并检验其显著性。相关分析采用Pearson相关系数法,是一种线性相关系数,用来反映两个变量X和Y 的线性相关程度,统计上一般以r表示样本相关系数,先分别计算 W ,然后计算r。

相关系数的数值范围在-1和+1范围之间,即-1≤r≤1, r>0 为正相关, r<0 为负相关。判断标准:通过相关系数假设检验判断相关的显著性,不同样本空间大小有一个临界相关系数值 r∗∗ ,若r≥r 就代表相关关系显著,否则为不显著。若r≥r临m(a-0.5,则结果显著;若r≥r gY(a-0.01) 则结果极显著;若 则结果认为没有统计显著性。r临(a-0.05)、临(a-0.01)根据样本数量n,查线性相关显著性检验临界相关系数表得。

2.2.2多元回归分析

多元回归分析属于数理统计方法的一种,是研究多个变量之间关系的回归分析方法,按因变量和自变量的数量对应关系可划分为一个因变量对多个自变量的回归分析(简称为“一对多"回归分析)及多个因变量对多个自变量的回归分析(简称为“多对多"回归分析),按回归模型类型可划分为线性回归分析和非线性回归分析,本次按线性回归进行分析。

2.2.2.1数学模型多元回归的数学模型为:

2.2.2.2回归系数确定

多元线性回归方程的回归系数 bi(i=0,1,2….m) 采用最小二乘法来确定的,设预报对象y与预报因子x1,x2,..,xm有关,把各个xt的第一次观测数据代入数据模型后,就可得到一个y的估计值,可计算n个y与估计值的误差,并可进一步计算残差平方和为

残差平方和Q依赖于b0,b1,...,bm,现要求Q为最小,则b0,bl,...,bm可由下面的方程组确定。

s⋅m1b1+s⋅m2b2+...+s⋅mmb⋅m=s⋅my

在观测数据已经给定的情况下,各求和号内的数值均可算出。因此上述方程组是以回归系数bi为未知数的m阶线性方程组可用消去法求解。bi解出后,则m元线性回归方程就确定了。

2.2.2.3相关因子筛选

在线性回归模型中,对可以估计离散参数的统计分布,我们可以根据F检验来比较嵌套模型对自变量x进行筛选,式为:

其中 D0 为回归方程中仅含截距(或上一步)的模型偏差,D为含有解释变量的模型偏差。F 近似F方分布。为了检验两个模型似然值的差异是否显著,我们必须要考虑自由度。在这里的F检验中,自由度等于前后两个模型解释变量个数的差值。这样根据F方值及其自由度,计算出显著性概率p值,根据p值我们就可以判断模型差异是否显著。一般来说p<0.05时我们就可认为解释变量对因变量有显著的解释能力;或者说,当前模型中至少有一个解释变量的回归系数不为0,模型有意义,从而优选出最优的多元线性回归方程。

3分阶段主要影响因子识别

分别将影响腊普河流域年、汛期及枯期径流量的系列影响因子分为同期影响因子及前期影响因子,分别与腊普河流域各年、汛期及枯期径流量建立相关,通过相关分析法对相关系数相关性强度进行判断,相关系数越接近0,线性相关关系越弱,相关系数越接近-1或+1,线性相关关系越强。并通过查线性相关显著性检验临界相关系数表r临界(a-0.05)、r临界(a-0.01)进行显著性检验,腊普河流域年、汛期及枯期径流量资料系列为 1977~2021 年, n=45 ,当a=0.01时,r≥0.38时结果极显著,当 a=0.05 时,r≥0.294时结果显著。

3.1年径流量

从年径流量与各系列因子相关系数成果表3.1中看出,同期系列影响因子中,年降水量对年径流量的影响最为显著,年蒸发量的影响次之,见图3.1,中雨、大雨占比及年平均气温的影响也较显著。前期系列影响因子中,各因子对年径流量的影响均不显著。

表3.1年径流量与各因子相关系数成果

图3.1年径流量与年降水量、年蒸发量相关关系图

3.2汛期径流量

从汛期径流量与各系列因子相关系数成果表3.2中看出,同期系列影响因子中,汛期降水量对汛期径流量的影响最为显著,汛期平均气温的影响次之,见图3.2,汛期蒸发量的影响显著,前期系列影响因子中,各因子对汛期径流量的影响均不显著。

表3.2汛期径流量与各因子相关系数成果

图3.2汛期径流量与汛期降水量、汛期平均气温相关关系图

3.3枯期径流量

经从枯期径流量与各系列因子相关系数成果表3.3中看出,同期系列影响因子中,枯期降水量对枯期径流量的影响最为显著,枯期蒸发量的影响次之,见图3.3,枯期累计日照及平均气温的影响较为显著。前期系列影响因子中,各因子对枯期径流量的影响均不显著。

表3.3枯期径流量与各因子相关系数成果

图3.3枯期径流量与枯期降水量、枯期蒸发量相关关系图

4分阶段多元线性回归效果检验及方程确定

多元回归方程式的回归效果检验包括定量预报误差、F检验、T检验及D-W值检验、复相关系数检验等五项,具体如下:

(1)根据《水情预警预报规范》第7.5.4条确定本次分阶段径流量取用预报误差在多年变幅20%以内,可以用作预报。

(2)F检验:通常被选定的预报因子会全部进入方程,最后尚要进行回归效果的F检验

F值愈大,回归效果愈好。进行F检验时,由一定的信度a和自由度(因子个数m与n-m-1)查取临界Fa,若F>Fa则回归效果显著,反之不显著。

(3)T检验:主要检验每个自变量对因变量影响的显著性检验,一般看P值,如果P值<0.05表示该自变量对因变量影响显著,如果P值>0.05表示不显著。

(4)D-W值:杜宾—沃森是用来检验回归分析中的残差项是否存在自相关现象的,该值用于对自变量的自相关性进行检验分析,用于检验自变量因子之间的独立性,D-W值在0~4之间,如果接近0,说明存在正自相关,如果接近4,说明存在负自相关,一般认为,如果D-W检验值在1.5~2.5在之间,最佳范围1.98~2.03之间,越接近2越好,说明不存在自相关问题。

(5)复相关系数R用来衡量回归效果的好坏,显然R愈接近于1,回归效果愈好。根据样本数n因子个数m,在一定的信度条件下查表可得临界Ra值,若R>Ra,则在该信度水平下回归的效果是显著的。

4.1年径流量方程

通过对年径流量同期和前期的主要因子影响显著水平分析,选用1977~2016年 (n=40) 系列资料共选取:

个因子运用DPS计算多元回归方程,通过F检验、复相关系数检验及对方程内各影响因子的T值、D-W值、标准化回归系数综合检验分析后(表4.1) 对所建 的4 个多元回归方程式进行筛选,由于T检验中仅有2因子方程里所有因子均通过了自变量T的显著性检验 最后选用2017 2021年资料进行预报合格率检验通过后最终选取2因子回归方程得出腊普河流域年径流量预测的多元回归方程(表4.2),方程式如下:

y = 22529.58727 + 50.6608x, + 0.9634x

式中:y—当年径流量

Xi—当年降水量

X2—上年枯期径流量

表4.1年径流量多元回归方程各自变量T检验结果统计表

表4.2多元回归方程年径流量预报成果表

选取2017~2021年对实测年径流量和回归方程计算后的径流量做误差统计,由表4.2得知,2因子回归方程中检验期预报合格率 80.0% ,达到中长期作业预报要求。

4.2汛期径流量方程

通过对汛期径流量同期和前期的主要因子影响显著水平分析,选用1977~2016年 (n=40) 系列资料共选取5个因子运用DPS计算多元回归方程,通过F检验、复相关系数检验及对方程内各影响因子的T值、D-W值、标准化回归系数综合检验分析后对所建立的4个多元回归方程式进行筛选(表4.3),选择3因子和2因子建立回归方程,最后选用2017~21年资料进行预报合格率检验后最终选取各项成果最优的3因子回归方程得出腊普河流域汛期径流量预测的多元回归方程(表4.4),方程式如下:

y=-504.47894+44.3621x1-24.05341x2+0.7831x3

式中:y—汛期径流量

Xi—汛期降水量

X—汛期蒸发量

X—上年枯期径流量

表4.3汛期径流量多元回归方程各自变量T检验结果统计表

表4.4多元回归方程汛期径流量成果表

取2017~2021年对实测年径流量和回归方程计算后的径流量做误差统计,由表4.4得知,3因子回归方程中检验期预报合格率为 80.0% ,达到中长期作业预报要求

4.3枯期径流量方程

通过对枯期径流量同期和前期的主要因子影响显著水平分析,选用1977~2010年 (1=34) 系列资料共选取3个因子运用DPS计算多元回归方程,通过F检验、复相关系数检验及对方程内各影响因子的T值、D-W值、标准化回归系数综合检验分析后对所建立的4个多元回归方程式进行筛选(表4.5),选择3因子和2因子建立回归方程,选用 2011~2021 年资料进行预报合格率检验后最终选取各项成果最优的2因子回归方程得出腊普河流域汛期径流量预测的多元回归方程(表4.6),方程式如下:

y=-517.09168+30.2752x1+0.2156x2

式中:y—枯期径流量

X—枯期降水量

X2—当年汛期径流量

表4.6多元回归方程枯期径流量预报成果表

表4.5枯期径流量多元回归方程各自变量T检验结果统计表

选取2011~2021年对实测年径流量和回归方程计算后的径流量做误差统计,由表4.6得知,2因子回归方程中检验期预报合格率 72.7% ,达到中长期作业预报要求。

4、使用多元线性回归方程对流域分阶段径流量进行预测的前提是需对敏感因子先作出预判,敏感因子的初始值的确定对结果的精度起决定性作用。

5结论

1、在腊普河流域分阶段径流量的影响因子中,相应降水量的影响最为显著,蒸发量的影响次之。

2、腊普河流域分阶段选取的多元回归方程各项检验均合格,预报合格率也均在70%以上,在今后的中长期则中可加入此方法对预报结果进行综合评判。

3、腊普河流域多元回归方程分阶段的径流量影响因子具有本质的不同,因此今后在选择运用多元回归方程进行中长期预测时对所选流域分阶段、找关键因子对该方法的适用和预测精度较为关键。

参考文献:

[1]中华人民共和国水利部《水文情报预报规范》[M].北京:中国水利水电出版社,2008

[2]范钟秀.中长期水文预报[M].南京:河海大学出版社,2006.8

[3]黄忠恕等.水文预测基础理论与应用技术[M].北京:中国水利水电出版社,2005.3

[4]姜珊.嫩江流域中长期径流预报方法比较研究[J]吉林大学学报,2011.

*本文暂不支持打印功能

monitor