[0004] 针对城市供水需水量的非线性和随机波动性特点,本发明提出了一种新的需水量预测方法——误差平方和最小的城市需水量组合预测方法。
[0005] 本发明的具体步骤如下:
[0006] 1、建立供水管网需水量数据库
[0007] 建立供水管网需水量数据库。输入数据包括:各地区测点累计流量、节假日情况、各地区历史天气数据,如日最高气温,日最低情况,日降雨情况,风力等。输出数据包括:需水量预测值,预测时间等。
[0008] 1)确定训练样本
[0009] 将SCADA(Supervisory Control and Data Acquisition)系统采集到的需水量数据、天气情况和节假日作为模型训练数据样本集合表示为 χi表示第i组模型输入数据,yi表示第i组模型输出数据。设供水管网系统有p个输入控制变量,r个输出变量
[0010] 2)数据归一化处理
[0011] 对输入数据进行归一化处理,一般采用最大—最小标准化方法对数据进行处理[0012]
[0013] 其中:Y为归一化处理后的输入值,L为原始输入值,Lmax、Lmin为神经网络输入量的最大、最小值。该方法将数据归一到[0,1]之间,便于处理。
[0014] 对应的反归一化算法为
[0015] Y=Lmin+Y(Lmax‑Lmin) (2)
[0016] 2、训练并建立RBF神经网络模型
[0017] RBF神经网络一般由三层组成。第一层为输入层,第二层为隐含层,第三层为输出层。
[0018] 输入层:输入层直接将神经网络输入到隐含层。
[0019] 隐含层:隐含层输出为
[0020]
[0021] 其中,x=[x1.....xn]T为输入向量;ci=[c1i...cNi]T为第i个非线性变换单元的中心向量,i=1,2......M,M为输出维数;δi为第i个非线性变换单元格宽度。
[0022] 输出层:输出层作用是将隐含层的输出线性加权合并。
[0023]
[0024] RBF神经网络输出为:
[0025] f1=[f11......f1t]T
[0026] 这里,RBF神经网络隐含层结点数一般通过经验公式得到
[0027]
[0028] 其中a为隐含层节点数,b为输入层节点数,c为输出层节点数目,d为1‑10之间的调节常数。
[0029] 3、训练并建立GRNN模型
[0030] (1)GRNN神经网络一般由四层组成。第一层为输入层,第二层为模式层,第三层为求和层,第四层为输出层。
[0031] 输入层:输入层直接将神经网络输入到模式层。
[0032] 模式层:GRNN模式层神经元的基函数采用距离函数和激活函数采用径向基函数。基函数对输入信号在局部产生响应。
[0033] 模式层神经元计算过程如下:
[0034] 1)计算样本与中心的欧式距离
[0035]
[0036] 2)用高斯函数计算模式层输出P,p=[p1....pn]T
[0037]
[0038] 求和层:求和层使用神经元计算公式
[0039]
[0040] 输出层:输出层的神经元网络等于学习样本中输出向量的维数k。f2t为当x=xt时的预测值
[0041]
[0042] GRNN神经网络输出值为:
[0043] f2=[f21......f2t]T (10)
[0044] (2)GRNN神经网络网络参数选择
[0045] GRNN不需要人为确定对模型预测能力产生较大影响的网络结构参数如传递函数和隐层神经元数等,只要确认光滑参数σ。
[0046] 光滑参数最优值的确定一般使用kflod算法(交叉验证搜索)来确定。
[0047] 具体算法:在平滑参数的取值范围[σminσmax]中,平滑参数σ以Δσ为步长递增变化。在GRNN网络n个学习样本中,以某一样本ni作为检验样本,利用剩余n‑1个样本构建神经网络进行仿真预测;采用上述过程对n个样本均遍历1次,可以得到预测值和样本值之间的误差序列,以均方误差作为评判标准,即
[0048]
[0049] 其中 为神经网络预测值,yi为实际值
[0050] 将最小均方误差所对应σ的值作为最优值。
[0051] 4、训练并建立ARIMA模型
[0052] 非平稳序列ARIMA(p,d,q)总可以通过初始值y1、y2、…yd和平稳的ARMA(p,q)序列zt来表示,又由于y1、y2、…yd与yt是相互独立的,所以对zt的预测不受y1、y2、…yd的影响,则有:
[0053]
[0054] 若已知yt以及yt以前的时刻的值,则由上式可得ARIMA(p,d,q)序列{yt}的预测模型为:
[0055]
[0056] 一旦求出 将其带入上式,即可求出yt+h的预测值。
[0057] 特别的,令d=1,预测模型式子可以简化为
[0058]
[0059] 令d=2,预测模型式子可以简化为
[0060]
[0061] 具体建模步骤如下
[0062] 1)对样本进行平稳性检验。若时序是非平稳的,通过变换使其变为平稳序列。平稳化处理一般是对原始数据进行差分,一般情况下1阶差分使数据平稳化,如果差分后数据仍然不平稳,继续差分直到数据平稳,需水量预测中所遇到的非平稳序列问题,通常都是低阶的d=1或d=2。
[0063] 1阶差分
[0064] d阶差分
[0065] 2)确定滞后阶数p和q,本发明借助于BIC准则来确定p、q的值
[0066]
[0067] 其中 为对序列拟合的ARMA(p,q)模型的残差;N为观测数量,当BIC取得最小值的p,q组合即为最佳模型
[0068] 3)残差白噪声检验。对ARIMA(p,d,q)的残差序列进行白噪声检验。若残差序列为白噪声序列,则说明模型有效,否则需重新确定模型。
[0069] 5、基于误差平方和最小的组合预测
[0070] 1)计算RBF神经网络模型、GRNN神经网络模型和ARIMA模型的最优权值[0071] y——实际观察值;
[0072] f1、f2、f3——RBF、GRNN、ARIMA模型预测值序列;
[0073] e1、e2、e3——RBF、GRNN、ARIMA模型预测误差序列;
[0074] k1、k2、k3——RBF、GRNN、ARIMA模型的权值;
[0075] 为了使组合模型保持无偏性,则权值应该满足:
[0076] k1+k2+k3=1
[0077] 设f=k1f1+k2f2+k3f3为组合预测值,eit为第i种预测方法在t时刻的预测误差。那么[0078] ei=[ei1ei2...eit] (17)
[0079] et=ft‑yt=k1e1t+k2e2t+k3e3t (18)
[0080] 设J为组合预测模型的误差平方和,那么
[0081]
[0082] 以误差平方和最小为准则的组合预测模型就变为下列最优化问题:
[0083] min J
[0084] s.t.k1+k2+k3=1
[0085] 设K=[k1k2k3]T L=[111]T
[0086] 其中K为三维权重系数列向量,L为三维列向量。
[0087] 设
[0088]
[0089] 那么该最优化问题可以表示为矩阵形式
[0090] minJ=KTEK
[0091] s.t.LTK=1
[0092] 根据拉格朗日乘数法,函数在约束条件之下的条件极值点应是方程组的解上述模型的最优解。
[0093]
[0094] K*即为所求的最优权值
[0095] 2)基于误差和最小组合预测。
[0096] 误差和最小组合预测模型将预测自变量分为两组,一组为各个模型预测值序列,另一组为待定权值,权值由模型测试求出。
[0097] 最终得到预测值
[0098] f=k1f1+k2f2+k3f3 (21)
[0099] 其中k1、k2、k3为各个模型的最优权值,f1、f2、f3为各个模型的预测值序列。6、滚动更新组合预测模型
[0100] 随着时间推移,既定的组合预测模型可能偏离实际需水量变化,重复步骤1‑5,更新各预测模型子项,更新计算权值,获取新近的、优化的组合预测模型。
[0101] 本发明与现有技术相比,有以下有益结果:该方法将RBF神经网络逼近能力强,全局最优等特点与GRNN神经网络学习速度快,易收敛等特点与ARIMA灵活,适应性强等特点结合,并结合滚动更新策略,使该预测方法能动态适应环境发展变化。