首页> 资源> 论文>正文

模式识别-时间序列模型预测城市时用水量

论文类型 基础研究 发表日期 2004-12-01
来源 中国水网
作者 段焕丰,俞国平,俞海宁
关键词 模式识别 时间序列 时用水量 预测 积分自回归-移动平均模型
摘要 介绍了基于模式识别和时间序列方法相结合的模型来预测城市时用水量。将每天的水量需求模式分为“上升(快速和缓慢)”、“波动”和“下降”三个或四个连续反复的状态,即连续的马尔可夫状态。并分别利用低次积分自回归-移动平均模型(ARIMA) 来拟合预测。实例结果表明该模型能够准确预测未来几天的时用水量,并且可以实时操作,简单易行。

段焕丰  俞国平  俞海宁
(同济大学 环境科学与工程学院,上海 200092)

  摘要:介绍了基于模式识别和时间序列方法相结合的模型来预测城市时用水量。将每天的水量需求模式分为“上升(快速和缓慢)”、“波动”和“下降”三个或四个连续反复的状态,即连续的马尔可夫状态。并分别利用低次积分自回归-移动平均模型(ARIMA) 来拟合预测。实例结果表明该模型能够准确预测未来几天的时用水量,并且可以实时操作,简单易行。
  关键词:模式识别;时间序列;时用水量;预测;积分自回归-移动平均模型

Pattern Recognition and Time Series Analysis Models for Forecasting Urban Hourly Water Demands

Duan Huanfeng; Yu Guoping; Yu Haining
(School of Environmental Science and Engineering, Tongji University, Shanghai 200092)

  Abstract: Hourly water-demand data is forecasted with a model based on a combination of pattern recognition and time series analysis. There or four repeating states are observed in the daily demand pattern: “Rising (slow or rapid),” “Oscillating,” and “Falling,” which are defined as successive states of a Markov process; and low-order auto-regressive integrated moving average models (ARIMA) fitted to each segment. An example followed shows that the model can be used to forecast hourly demands for a period of one to several days ahead, and the forecast can be performed in real time easily.
  Keywords:pattern recognition; time series analysis; hourly water-demand; forecast; low-order auto-regressive integrated moving average (ARIMA) models

  城市配水系统在线作业控制的任务是为该系统制定和执行某一计划方案。其目的就是在最小费用的目标下满足用水量需求,即最优运行操作方案。一般来说,由于配水系统的许多运行工作都是以一天(24小时)为周期,其运行方案须至少提前24小时就制定好。而制定该最优运行方案的前提条件就是要准确预测出整个方案期间的时用水量。因此,时用水量的预测对配水系统的经济运行有着重要的意义。
  用来预测用水量的方法主要有:时间序列法,神经网络法及灰色理论模型法等等。从实践经验来看,单纯的神经网络法和灰色理论模型法需要的历史数据较多并且更适用于中长期的宏观水量预测,而时间序列法在预测时用水量时将产生较大误差,特别是预测期越远其误差就越大。对此,本文提出一种模式识别与时间序列相结合的预测方法来提高预测的准确度。

1.基本思想

  一天中需水量的变化取决于许多因素,如温度,湿度,距上次下雨的时间间隔以及一周中的第几天等等。然而,我们从实践中许多实例的考察可以看出某些天中的用水需求曲线模式有显著的相似。一般来说,每天用水量曲线总的趋势都是在晚上较低,从早上开始上升,一直达到最高并有波动,然后又下降。这些变化部分的过渡或者是各部分的曲线形状将随用水对象的不同而不同。但是,我们可以将每天的模式划分为“上升”、“波动”和“下降”三个部分或状态,下面我们所要讨论的模型将基于此,然后确定各部分的过渡点并且为每个部分构造时间序列模型。
  本文将在Mottl’ (1983)提出的模式识别原理方法的基础上,假设以上各部分的需求模式是一个随机过程,并且它们之间的过渡是一个马尔可夫链,而在各部分内部则是一个自回归过程。该预测方法包括一下步骤:
  (1)假设:同上,假设每天的水量需求通常分为三个状态。如果有必要,可以将“上升”状态分为“缓慢上升”和“快速上升”两个状态,从而使整体形成四个状态,这样可以进一步提高预测的精度。
  (2)模式的学习训练:根据人工智能方面的模式学习原理,输入必要的需求数据(部分数据),对上述三种或者四种状态模式进行自我训练学习,计算出各部分状态之间的过渡概率以及每部分状态中自回归模型的参数初试值。
  (3)模式识别:利用所有的需求数据集合,计算出最优参数值,包括各状态的事后概率、各状态之间的过渡概率以及自回归模型参数的最优值。
  (4)预测:利用上述得出的各状态的事后概率和自回归模型来预测未来一天的用水量。
  该预测模型中所用数据最好是连续监测数据,并且数量适度即可。

2.预测模型的建立

2.1 需求模型
  由上述,各水量需求看作是一个随机过程,并且重复三个状态过程;从一个状态过渡到另一个状态是一个马尔可夫链。因此,每个状态的长度是随机的。
  设vt(t=…-1,0,1,2…)为时刻t需求曲线的状态,并且vt=1,…m 取整数值,则从一个状态到下一个状态的过渡概率为

                  (1)

  在时刻t,需水量xt是一个标准的n次自回归过程:

             (2)

     其中:ct=(c0tc1t,……,cnt)为一组与时间有关的系数向量;
     ζt为具有零期望值和单位方差的标准变量;
     bt为离散白噪声的标准偏差,与时间有关。

  又设在(2)中的参数向量θt=(ct,bt),在任何时刻t 都能假设1 到m之间的值k ,并设vt=kk=1,…m。自回归模型的次序m 可以允许在各部分之间变化,这样可以为模型的适应度带来更大的灵活性。假设有数据X1N=(x1,…xN),我们将利用该数据来解决以下两个相关的问题:
  1) 估计参数P,θl,…,θm
  2) 确定在时刻t 的任一点的状态V1N=(v1,…vN) 。
  根据Yacovlev 和Vorob’yov (1986)提出的极大可能方法原理,则有:

         (3)

  其中,f(XlN|P,θl,…,θm) 为向量XlN 的条件概率密度。
  上述过程为一个反复递推的计算过程,其主要的特点和计算过程如下:

  1)logf(XlN|P,θl,…,θm) 为单调不减;
  2) 参数P*,θl,…,θm 的估计满足:

   (4)

  即f(XlN|P,θl,…,θm) 的一个局部极大值点。

  其递推方程为:

      (5)

                  (6)

  并且:

   (7)

  其中:p(vt=k|XlN,Ps,θsl,…,θsm) 为在时刻t状态k下过程xt 的事后概率,对其估计按照马尔可夫链的性质及式(7)来进行计算。
  对上述每一步递推,都要满足式(4),以收敛到某一期望值。
  由条件概率的性质有:

  

        (8)

  根据Yacovlev 和Vorob’yov (1986)有:

       (9)

  由上述(1)~(9)式,我们即可以对模型(1)和(2)的参数P,θl,…,m 进行估计,其具体的算法步骤叙述如下。
2.2 模型的求解
  上文已对预测模型进行了详细说明,现对该模型进行求解,主要步骤如下:
2.2.1模式学习训练:
  1) 检查所给样本数据,得出m N值,一般m=3 or 4 ;N>200-300 ;
  2) 选出部分样本数据,设N1个,且N1<<N
  3) 根据样本数据频率计算过渡概率初试矩阵:
         (10)

  其中,t=1,…,Nl,并任意设

     (11)

  4)根据(5)计算θlk=k,k=1,…m,并计算(6)、(7)和(8)式,这些计算均是对t=1,…,Nl而言。

2.2.2模式识别

  这部分计算均是对所有的样本数据t=1,…,N
  1)计算事后概率 (12)

  k=1,…m

  2)根据(5)和(6)式计算

  这部分计算是一个重复递推过程,直到满足局部最优可行解的条件。在计算过程中定义一个误差函数和相对应的真值函数,使得误差函数值最小。

  

  其中λ(k,k)=0;λ(k,l)=1;k,l=1,…,m,且k≠1      (15)

  以上的计算过程中,在特殊情况下可以通过引入动态规划法进行最小化修正详见文献。

2.2.3预测
  1) 状态预测
  由上述算法得到了各个时刻每个状态的事后概率,运用积分自回归-移动平均模型(ARIMA)来进行预测。在一天内(T=24h)的模型形式为:

           (16)

  其中,pt 为事后概率,看作为随机过程;ζt 同前;BT 为转置矩阵(B=xt-xt-1);φ1Γ1Γ2为多项式。

  性能指标:

                              (17)

  2) 用水量预测
  根据上述预测模型对未来用水量进行预测,可以分别利用三个和四个状态模型进行预测,显然,四个状态的模型比三个状态的模型精度高,但计算量稍大。本文核心计算模块程序采用C++语言编写,以提高效率。其预测效果详见实例。

3.应用

  根据某城市配水系统1999年夏的两个月(6.1日~7.31日)的实测时用水量数据来进行预测。整个中心城区的服务总人口约20万,平均日用水量为2.2万m3。由于篇幅限制其原始数据省略。通过上述模型训练与模式识别来进行未来用水量的预测。本文仅就上文中的四态模型进行预测,三态模型的预测原理过程同样可得。图1中给出了对未来五天(8.1日~8.5日)的时用水量预测结果。图中还同时给出了真实用水量值以进行比较。
  表1则给出了对未来一个月(8月份)的日用水总量的预测结果及模型误差。从图1中可以看到时用水量曲线与实际曲线的拟合程度很高,表1则说明了该方法的预测累计误差很小,对配水系统的在线实时预测的精度很高。

图1 四态模型24小时用水量的预测曲线
Fig.1 Four state model demand forecasting curve for 24h ahead

表1 四态模型对八月份用水量的预测值
Tab.1 Evaluation of four state model’s forecast for August

日期星期实际用水量(m3)预测用水量(m3)预测误差(%)日期星期实际用水量(m3)预测用水量(m3)预测

误差(%)

1Mon19618.819885.6+1.3617Wed20886.920928.7+0.20
2Tue17450.317753.1+1.7418Thur19655.019423.8-1.18
3Wed19099.219007.6-0.4819Fri20116.720357.1+1.20
4Thur19882.719795.8-0.4420Sat11854.912332.2+4.03
5Fri18302.518154.9-0.8121Sun20052.820085.6+0.16
6Sat10117.511034.1+9.0622Mon19201.119615.2+2.16
7Sun19908.020004.0+0.4823Tue20533.420785.4+1.23
8Mon16576.116395.6-1.0924Wed17324.719468.0+12.37
9Tue18157.118521.0+2.0025Thur17575.217682.3+0.61
10Wed20943.320798.7-0.6926Fri16867.716354.4-3.04
11Thur21644.620986.3-3.0427Sat10653.710650.5-0.03
12Fri17314.817656.8+1.9828Sun24620.923995.4-2.54
13Sat9929.19878.5-0.5129Mon22227.021929.4-1.34
14Sun16004.516184.2+1.1230Tue21419.521586.2+0.78
15Mon20136.320228.5+0.4631Wed16876.517168.2+1.73
16Tue21469.521356.9-0.52

4. 结语

  通过对预测模型的理论推导和实例应用,我们可以看出该模型方法误差很小。尽管它在理论推导有些繁琐,但是,在实际中,通过模块化编程形成计算软件,其应用非常简单,特别适用于实时连续监测系统;而且它能够在个人计算机上只需很短时间的运行即可得到较为精确的结果。因此,该预测方法在给水系统的最优运行中具有很大实用经济价值。当然,对于某些很小的城镇配水系统,由于其用水变化很大,甚至单个用户用水对整个系统都有影响,该方法则难以精确预测,这也仍需进一步探讨。

参考文献

[1] Jowitt, P.W., and Xu, C. (1992). Demand forecasting for water distribution systems [J]. Civ. Engrg. System, 9,105-121.

[2] Box, G.E.P., and Jenkins, G.M. (1970). Time series analysis, forecasting and control [M]. Holden Day, San Francisco, CA.

[3] Christensen, P.E., and Macdassi, T.J. (1989). Computerized analysis and prediction of hourly demand curves [M]. AWWA Speciality Comp. Conf., American Water Works association, Denver, Colo.

[4] Mottl’, V.V., and Muchnik, I.B. (1984). Segmentation of structural curves using dynamic programming methods [J]. Automation and Remote Control, 44(8), 1035-1044.

[5] 袁一星,张杰等. 城市用水量中长期预测模型的研究[J]. 给水排水,2004,30(6):102~105

[6] 俞峰,陶建科. 城市给水系统时用水量预测方法的探讨.城市公用事业[J],2003,17(6):23~26

[7] 何迎晖,钱伟民编著. 随机过程简明教程[M]. 上海,同济大学出版社,2004

[8] (美)Bruce Eckel 著,刘宗田,袁兆山,潘秋菱等译. C++编程思想[M]. 北京,机械工业出版社,2002


作者简介 段焕丰,男,1982年生,安徽安庆人,硕士研究生,主要从事市政工程设计与运行最优化方向的研究。
     俞国平,男,同济大学教授,从事运行调度优化研究。
     俞海宁,女,硕士研究生。
第一作者通讯地址:上海市武东路100号同济大学沪东校区0336#信箱     邮编:200433
联系电话:021-65901098
E-mail:[email protected]

论文搜索

发表时间

论文投稿

很多时候您的文章总是无缘变成铅字。研究做到关键时,试验有了起色时,是不是想和同行探讨一下,工作中有了心得,您是不是很想与人分享,那么不要只是默默工作了,写下来吧!投稿时,请以附件形式发至 [email protected] ,请注明论文投稿。一旦采用,我们会为您增加100枚金币。