徐洪福,袁一星,兰宏娟 (哈尔滨工业大学给水排水系统研究室) 摘要: 周期性指数平滑法是时间序列分析方法中的一种。以天津市给水管网系统为例,进行日用水量预测。通过对预测结果进行残差分析,说明这种日用水量预测模型是可行的。 关键词: 日用水量预测 时间序列分析 周期性指数平滑法 水平因子 趋势因子 周期因子 Forcasting Daily Water Demands of Period Index Smooth Method Xu Hongfu,Yuan Yixing,Wei Baocheng (Workgroup of Water & Wastewater System, Harbin Institute of Technology) Abstract: Period index smooth method is an approach of time-series analyses. The study applies this method in the daily demand forecast of Tianjin distribution networks. The error analysis of the forecast result demonstrates that this model is effective. Keywords: daily demand forecast; time-series analysis; period index smooth method; level factor; tendency factor; period factor. 1. 引言 城市用水量预测在城市建设规划﹑供水系统的优化调度中具有重要的作用,它的准确程度直接影响到供水系统调度决策的可靠性及实用性。 用水量预测按预测方法可分为两类:回归分析方法和时间序列分析方法。回归分析也称为解释性预测,它通过观测系统输出的结果,并对系统的输入数据加以分析﹑比较﹑来寻找两者是否存在因果关系,回归模型对长期预测来说是一种有效的方法;时间序列分析与回归分析有明显的不同之处,它把系统看成一个“暗盒”,只依赖于历史观测数据模式,用适当的数理统计方法对这个时间序列加以解释,确定它的数据模式,然后选用预测模型进行预测。 2. 周期性指数平滑法 许多时间序列的变化情况和季节因素有关,或者说呈现周期性的变化规律。有的不仅含有周期性的变化因素而且还有线性增长或减少的趋势。对于这种时间序列,前几种指数平滑法基本上是无效的,而要采取更为高级的指数平滑方法。它的基本原理是要把这种时间序列分解成三个部分,第一部分是水平因子;第二部分是趋势因子1;第三部分是周期因子。先把这三部分从时间序列中分离出来,然后再合起来进行预测。这就存在一个周期长度的问题。周期长度要通过自相关分析来确定。 在应用周期性指数平滑法进行预测时,必须事先获得前两个周期内每一时期的观测值。设时间序列的周期长度,其计算过程如下,共分为九个步骤。 第一步: 分别计算前两个周期每期的平均数。 第一个周期的平均数V1:V1=(x1+x2+∧+xl)/l······(1) 第二个周期的平均数V2:V2=(x1+l+x2+l+∧+x2l)/l······(2) 第二步: 计算两个周期内平均每个时期的增量B:B=(V2-V1)/l······ (3) 第三步: 计算初始指数平滑值S:S= V2+(l-1)B/2······(4) 第四步: 分别计算前两个周期内每一时期的季节因子 第一个周期内每一个时期的季节因子Ct': | ······(5) |
其中: 当t=l时,m=1;当t=2时,m=2;.....当t=l时,m=l。 第二个周期内每一个时期的季节因子Ct': | ······(6) |
其中: 当t=l+1时,m=1;当t=l+2时,m=2;当t=2l时,m=l。 第五步: 计算前两个周期中平均每个时期的季节因子Ct”: Ct”=(Ct-l'+Ct')/2 ······(7) 第六步: 将季节因子正态化 按第五步计算出来的l个平均季节因子之和可能不等于周期l,因此需要按比例缩小或扩大,使它们之和等于l。 先计算这l个平均季节因子之和l': l'=Cl+1"+Cl+2"+∧+C2l"······(8) 再计算正态化以后的季节因子Ct: Ct=l· Ct"/l' ······(9) 共计算出l个正态化以后的季节因子Ct,它们之和必然为l。 第七步: 对第三个周期内每一个时期做初步预测 Ft+m=(S+mB)Ct-l+m······(10) 第八步: 当第三个周期的第一个时期的观测值得到(xt=x2l+1),就可以用一组确定的平滑常数α,β,γ的数值来修正指数平滑值、趋势和季节因子,修正公式如下: | ······(11) |
这样可以重新预测第三个周期内其余(l-1)个时期的数值 Ft+m=(St+mB)Ct-l+m ······(12) 修正以后的指数平滑预测值比修正前的预测值要准确。 第九步: 以后,每次当获得前t时期的观测值xt时,就可以用以下公式分别计算单指数平滑值、趋势和季节因子: | ······(13) |
对(t+m)时期的预测值 Ft+m=(St+mBt)Ct-l+m······(14) 每当计算完一个周期,得到l个季节因子以后,就要按第六步的方法,把它们重新加以正态化。
3. 工程应用 本文利用上述周期性平滑指数法对天津市日用水量建模预测。对1999年7月7日~1999年9月28日天津市日用水量记录资料可由图 和表 中看到。经自相关分析,天津市日用水量序列自相关系数列于表1中,对应变化曲线见图1。从表1和图1中可以看出此时间序列表现出很强的周期性,所以非常适于建立周期性指数平滑模型。本文作者经过实际调查得出,对于每一个星期,休息日与工作日用水量存在显著的差异,是导致其自相关系数出现周期性的直接原因。而且,从图1中我们也可以发现,自相关系数每隔六个出现一次“峰值”,所以可以选定此序列的周期为7,即L=7。 表1 天津市日用水量自相关系数表7.71E-01 | 4.34E-01 | 1.44E-01 | 2.09E-02 | 3.27E-02 | 6.45E-01 | 4.82E-01 | 1.48E-01 | -3.04E-02 | -8.67E-02 | 5.57E-01 | 3.13E-01 | 1.83E-01 | -6.59E-02 | -1.50E-01 | 4.82E-01 | 2.19E-01 | 2.46E-01 | -7.96E-02 | -1.70E-01 | 4.34E-01 | 1.89E-01 | 1.17E-01 | -4.54E-02 | -1.90E-01 | 利用上述算法编制计算机程序,搜索得到一组最佳平滑常数为α=0.71;β=0.53;γ=0.03,。所以 预测模型为: 利用上述模型对天津市日用水量进行预测,预测结果如图2所示。预测残差序列变化曲线如图3所示。 4.预测精度分析 残差序列中最大残差值为-121.54千吨,最大百分比误差为-9.4%,对于工程精度来说,可以接受。对残差序列进行自相关检验,取前30个自相关系数,如表2所示,对应的残差自相关系数分布曲线如图4所示。由表2和图4可知,前30个自相关系数全部落在95%置信区间[-0.234,+0.234]内,也就是说有95%的置信度认为所有的自相关系数与零没有显著差异。由此可以断定这个残差序列是一个随机时间序列。 对前30个自相关系数求Q值,得Q=13.61,与附表中df=m-1=29,置信度为95%时所对应x292的值,即x292=42.55比较Q292,,同样说明有95%置信度认为这30个自相关系数中与零没有显著性差异,预测残差序列为随机性误差。所以用周期性平滑指数法预测日用水量不存在必然性误差,预测模型是成功的。 表2 预测残差序列自相关系数表序号 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 自相关系数 | 0.187 | -0.137 | -0.230 | -0.192 | -0.104 | 0.029 | 0.096 | 0.153 | 0.074 | -0.015 | 序号 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 自相关系数 | -0.165 | -0.019 | 0.081 | -0.071 | -0.034 | -0.103 | 0.063 | 0.069 | 0.041 | -0.201 | 序号 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 自相关系数 | -0.046 | -0.003 | 0.118 | -0.047 | -0.037 | -0.152 | -0.029 | 0.055 | -0.001 | 0.067 | 参考文献: [1] 赵洪宾等 城市供水管网系统节能技术课题技术报告,哈尔滨建筑大学。 [2] 徐洪福 城市用水量预测理论与方法的研究,硕士学位论文。 [3] 王勇领 《预测计算方法》,科学出版社。 [4] 杨位钦等 《时间序列分析与动态数据建模》,北京理工大学出版社,1988。 [5] 姚庭宝等 《Turbo Pascal 7.0程序设计及Turbo Vision 使用大全》,电子工业出版社。
作者简介: 徐洪福 博士 哈尔滨工业大学市政环境工程学院 通 讯 处: 哈尔滨工业大学(二区)624#信箱 150090 0451-6282281 Email: [email protected] |