[0048] 3.调度关联数据集合的聚类处理。
[0049] 以需水量序列为特征属性对E进行聚类,得到K个不同需水量特征属性下的类别及子集: 且有s1+s2+…+sk+…+sK=Np,s1,s2,…,sk,…,sK分别为各子集的大小。
[0050] 本实施例采用k-means方法对E进行聚类,流程如下:
[0051] a.初始化待聚类的数据单元的聚类中心。
[0052] b.计算每个数据单元到聚类中心的距离,将该数据单元聚类到离该单元最近的类(子集)中。
[0053] c.计算每个聚类中所有数据单元的重心,并将这个重心作为新的聚类中心。
[0054] d.反复执行步骤b和c,直到聚类中心不再进行大范围移动或者聚类次数达到要求为止。
[0055] 4.调度关联数据单元的统计检验。
[0056] 对于子集Ek,k=1,2,…,K,将所包含的相应数据单元 逐一进行统计检验,剔除未通过检验的数据元。步骤如下:
[0057] (1)在某一子集Ek内,根据其所包含的所有数据单元 分别计算n个控制点压力序列的平均值 i=1,…,n,及其标准差
公式分别如下:
[0058]
[0059] (2)对控制点i,给定乘子Li,及其压力变化区间 i=1,…,n。该区间表示了各个控制点压力序列一天中在各采样时刻可接受的波动范围。如给定Li=
3,则表示控制点压力波动超过3个标准差范围,该压力序列将不被接受。
[0060] (3)对子集Ek包含的数据元ej(j=k1,k2,…,ksk)进行统计检验。具体为判断数据单元ej的n个控制点压力序列 是否全在给定区间内。若否,则剔除该数据单元ej。重复ksk次,完成对子集Ek内各数据单元的统计检验与剔除。
[0061] (4)重复步骤(1),(2),(3)共K次,完成对所有子集内数据单元统计检验与剔除。
[0062] 整理经步骤(1),(2),(3),(4)处理的各子集,其数据单元数将进一步缩减:其中r1,r2,…,rk,…,rK分别为各子集的大小,满足r1≤s1,r2≤
s2,…,rk≤sk,…,rK≤sK,r1+r2+…+rk+…+rK=Npr,Npr≤Np。
[0063] 5.计划调度决策方案的生成。
[0064] (1)根据需水量预测模型预测未来24小时需水量序列D=[d1,d2,…,d24],并构建预测日调度关联数据单元e={D,P,C},P,C分别为控制点压力序列及调度方案,均为未知,而D为预测的需水量序列。
[0065] (2)以需水量为特征属性,对e其进行预测分类,找到所属调度关联数据单元类别及子集
[0066] 本实施例采用k-近邻算法进行分类,流程为:
[0067] a.计算已知数据单元子集中每个数据单元与预测日数据单元间的距离。
[0068] b.按照距离递增次序排序。
[0069] c.选取与预测日数据单元距离最小的Kn个数据单元。
[0070] d.确定这Kn个数据单元在所在子集的出现频率。
[0071] e.返回Kn个数据单元出现频率最高的子集选为预测日数据单元的预测分类。
[0072] (3)在所属子集 中,以需水量序列为特征属性进一步计算预测日数据单元其与各数据单元 的相似度,并按相似度从大到小排序。选择具有相似度最大的数据单元,作为预测日调度关联数据单元。相似度计算公式如下:
[0073] 6.当日调度完成,根据历史调度数据构建关联数据单元e={D,P,C},执行步骤1,步骤2,步骤3,步骤4更新调度关联数据单元集合,执行步骤5生成下一日计划调度决策方案。
[0074] 本发明基于大量的历史生产调度数据,采用数据挖掘相关方法,将经验数据结构化、逻辑化、去粗取精,形成合理化的经验调度知识,建立了基于数据驱动的日计划调度决策模型。该发明能根据需水量预测情况,自动给出计划调度方案,且调度方案基于历史数据及经验调度知识,可以保障决策方案符合实际生产。本发明摒弃了简单的人工经验,使得调度决策更加科学合理。