首页 > 专利 > 杭州电子科技大学 > 基于并行LSTM串联DNN的供水管网压力预测方法专利详情

基于并行LSTM串联DNN的供水管网压力预测方法 0 0

有效专利查看PDF

申请进展

基本信息

申请人信息

代理人信息

摘要

法律状态

权利要求

说明书

专利申请流程有哪些步骤？

申请

申请号：指国家知识产权局受理一件专利申请时给予该专利申请的一个标示号码。唯一性原则。

申请日：提出专利申请之日。

2018-05-16

申请公布

申请公布指发明专利申请经初步审查合格后，自申请日（或优先权日）起18个月期满时的公布或根据申请人的请求提前进行的公布。

申请公布号：专利申请过程中，在尚未取得专利授权之前，国家专利局《专利公报》公开专利时的编号。

申请公布日：申请公开的日期，即在专利公报上予以公开的日期。

2018-11-30

授权

授权指对发明专利申请经实质审查没有发现驳回理由，授予发明专利权；或对实用新型或外观设计专利申请经初步审查没有发现驳回理由，授予实用新型专利权或外观设计专利权。

2021-11-30

预估到期

发明专利权的期限为二十年，实用新型专利权期限为十年，外观设计专利权期限为十五年，均自申请日起计算。专利届满后法律终止保护。

2038-05-16

基本信息

有效性	有效专利	专利类型	发明专利
申请号	CN201810465536.9	申请日	2018-05-16
公开/公告号	CN108764540B	公开/公告日	2021-11-30
授权日	2021-11-30	预估到期日	2038-05-16
申请年	2018年	公开/公告年	2021年
缴费截止日
分类号	G06Q10/04 、G06K9/00 、G06K9/62 、G06N3/04 、G06Q50/06	主分类号	G06Q10/04
是否联合申请	独立申请	文献类型号	B
独权数量	1	从权数量	6
权利要求数量	7	非专利引证数量	0
引用专利数量	0	被引证专利数量	0
非专利引证
引用专利		被引证专利
专利权维持	4	专利申请国编码	CN
专利事件		事务标签	实质审查、授权

申请人信息

申请人	杭州电子科技大学	第一申请人	杭州电子科技大学
专利权人	杭州电子科技大学	当前专利权人	杭州电子科技大学
发明人	徐哲、李玉全、陈晖、何必仕、陈云	第一发明人	徐哲
地址	浙江省杭州市下沙高教园区2号大街	邮编	310018
申请人数量	1	发明人数量	5
申请人所在省	浙江省	申请人所在市	浙江省杭州市

代理人信息

代理机构

专利代理机构是经省专利管理局审核，国家知识产权局批准设立，可以接受委托人的委托，在委托权限范围内以委托人的名义办理专利申请或其他专利事务的服务机构。

浙江千克知识产权代理有限公司

代理人

专利代理师是代理他人进行专利申请和办理其他专利事务，取得一定资格的人。

周希良

摘要

本发明公开了一种基于并行LSTM串联DNN的供水管网压力预测方法。本发明首先确定输入输出项，建立基于并行LSTM串联DNN的预测模型。其次数据预处理，建立压力预测数据库。然后训练预测模型。最后进行在线压力预测。本发明实现LSTM和DNN的优势互补，并用Dropout技术防止模型过拟合，Relu激活函数加快模型收敛速度，小批量梯度下降法减少了随机性和计算量，选择RMSprop作为随机梯度下降法的优化算法，提高了供水管网压力预测方法的抗干扰性和精度。

摘要附图
说明书附图：图1
说明书附图：图2

法律状态

序号	法律状态公告日	法律状态	法律状态信息
1	2021-11-30	授权
2	2018-11-30	实质审查的生效	IPC(主分类): G06Q 10/04 专利申请号: 201810465536.9 申请日: 2018.05.16

权利要求

权利要求书是申请文件最核心的部分，是申请人向国家申请保护他的发明创造及划定保护范围的文件。

1.基于并行LSTM串联DNN的供水管网压力预测方法，其特征在于该方法具体是：
步骤(1)确定输入输出项，建立基于并行LSTM串联DNN的预测模型，具体是：
鉴于供水管网系统是一个多输入多输出的非线性时滞系统，选择历史状态量[x(t),x(t‑1),…,x(t‑ns)]和控制量[u(t‑1),u(t‑2),…,u(t‑nu)]作为输入项；确定输出项为压力测点t+1时刻的输出ym(t+1)，这里ns、nu为历史时间窗口；
建立基于并行LSTM串联DNN的深度学习模型：
a.分别采用LSTM模型对状态量[x(t),x(t‑1),…,x(t‑ns)]和控制量[u(t‑1),u(t‑
2),…,u(t‑nu)]进行特征提取和学习，同时设分别为供水管网的状态量和控制量经LSTM模型的输出值；
b.采用深层神经网络DNN模型将进行融合处理，得到输出ym(t+1)
其中[]表示将两种在时间维度上具有相同维数的矩进行合并，H()为DNN模型的激活函数；WDNN、bDNN分别为DNN模型的权值与阈值；
步骤(2)数据预处理，建立压力预测数据库
(2‑1)数据预处理
数据补缺：针对来自SCADA系统现场采集的数据存在数据丢失问题，采用线性、抛物线或三次曲线插值补全缺失的数据；
数据去噪：针对现场数据存在大量噪声干扰问题，采用小波变换去除噪声；
无量纲处理：针对供水管网压力和流量具有不同的物理量纲和数量级问题，对数据作归一化处理，即将输入与输出都限制在[0,l]，使它们以相同的等级参与模型训练与预测；
(2‑2)建立压力预测数据库
数据项除了时间戳、节点外，还包括：(1)测点的压力、流量值，入口的压力、流量值，从SCADA系统中实时抽取、清洗、转换、并存储，作为模型的输入项；(2)测点的预测压力，来自模型预测，是模型的输出项；(3)误差数据项，用来统计分析预测精度；
步骤(3)训练预测模型
(3‑1)确定训练样本
围绕大型供水管网的DMA分区或者小型供水管网，确定输入样本为{X(ns),U(nu),Y}，其中X(ns)为i维状态量，U(nu)为2j维控制量，i为监测点数，j为入口数；
(3‑2)确定模型基本结构，设置其余参数初值，开始训练模型
根据经验或者初步调参的效果确定参数的取值范围；nu、ns∈{1,2,...12}，时间步长t＝5分钟，即历史信息最大跨度为60分钟；隐含层个数Layers∈{1,2,...,5}；相应神经元数量Neurons∈[0,300]；
(3‑3)训练迭代
在模型训练时，过模型的预测值和实测值y求出均方根作为模型误差loss，当loss<误差目标ε∈[0.2％，0.5％]，达到训练要求，迭代结束；当误差不满足要求时调整模型的各个参数，若误差不符合收敛条件且不再减小，则改变模型基本结构，即重新给定一个{nu,ns,Layers}，再根据各个基本结构调节其他参数，重新迭代训练；
步骤(4)在线压力预测
将压力预测数据库中测点的压力、流量值，入口的压力、流量值，依次输入到模型，模型则给出t+1时刻的压力预测值ym(t+1)；同时，将压力预测值ym(t+1)存入数据库，与t+1时刻的实测值y(t+1)进行比较，计算Δ＝ym(t+1)‑y(t+1)；设允许预测误差为σ∈[5％，10％]，若连续三次Δ>σ*y(t+1),则返回步骤(3)，重新训练模型，用新近数据，更新模型参数。

2.根据权利要求1所述的基于并行LSTM串联DNN的供水管网压力预测方法，其特征在于：步骤(3‑2)中为了防止深度学习模型出现过拟合现象，在每一层引入Dropout技术后随机地更新网络参数，增加模型的泛化能力。

3.根据权利要求2所述的基于并行LSTM串联DNN的供水管网压力预测方法，其特征在于：所述的Dropout技术具体是在模型训练时随机抛弃一定比例的隐含层节点，但权重会保存，仅暂时不进行更新，而在模型使用时恢复全连接；节点抛弃比例在0.1至0.5之间。

4.根据权利要求1所述的基于并行LSTM串联DNN的供水管网压力预测方法，其特征在于：步骤(3‑2)中采用小批量梯度下降法来优化模型中的各个参数。

5.根据权利要求4所述的基于并行LSTM串联DNN的供水管网压力预测方法，其特征在于：所述的小批量梯度下降法是把数据分为若干个批，按批来更新参数；小批量梯度下降法的样本大小为5至50之间；训练轮数为100至200之间。

6.根据权利要求1所述的基于并行LSTM串联DNN的供水管网压力预测方法，其特征在于：步骤(3‑2)中模型的激活函数选用ReLU激活函数。

7.根据权利要求1所述的基于并行LSTM串联DNN的供水管网压力预测方法，其特征在于：步骤(4)中压力预测值ym(t+1)提前5分钟提供给调度人员参考。

说明书

技术领域

[0001] 本发明属于城市供水领域，具体是一种基于并行LSTM串联DNN的供水管网压力预测方法。

背景技术

[0002] 供水管网系统是一个结构复杂、规模庞大、用水随机性强的非线性动态系统，能否快速准确地模拟和预测出管网的运行工况，是进行供水管网优化调度的关键。供水管网生产运行中，调度人员一般以压力实测数据来观察管网的运行状况。因此，对监测点压力进行预测分析，有助于调度人员提前预判，做好生产指挥。

[0003] 目前供水管网压力预测方法一般分为时间序列法、结构分析法和系统方法三大类。其中时间序列法包括移动平均法、指数平滑法、趋势外推法等；结构分析法包括回归分析法等；系统方法包括灰色预测、人工神经网络等。时间序列模型预测精度较好、数据处理简单，但是只能利用测点短期时序数据，并不适用于变化较大的情况；回归分析法模型简单、方便但受多种因素综合影响时难以选择；系统方法具有自学习能力、非线性处理等优点，但是存在模型复杂、训练时间长等问题。上述方法均易受噪声干扰，预测精度难以保证。

发明内容

[0004] 针对供水管网的高度复杂非线性特性及现有技术方法的不足，本发明提出一种基于并行LSTM(长短期记忆神经网络)串联DNN(深度神经网络)的深度学习模型进行管网压力预测，提高预测精度。

[0005] 由于供水管网的状态量和控制量是两种不同类型的特征信息，倘若简单采用一个LSTM模型进行特征提取，两类特征信息对模型的不同影响将无法凸显，为此，将单一LSTM模型扩展为并行LSTM模型，分别提取、学习两类不同的特征信息。又由于LSTM擅长处理基于时间序列的数据，DNN适用于将特征信息映射到更高的空间，利用LSTM与DNN各自的优点，将LSTM与DNN联合起来作为一个统一的架构，实现优势互补，即将两路LSTM的输出结果融合后通过DNN输出，实现对下一时刻的测点压力进行预测。由此，本发明提供了一种基于并行LSTM串联DNN深度学习模型的供水管网压力预测方法。

[0006] 为实现高抗干扰性、高预测精度高目的，本发明采取以下步骤：

[0007] 1、确定输入输出项，建立基于并行LSTM串联DNN的预测模型

[0008] 鉴于供水管网系统是一个多输入多输出的非线性时滞系统，选择较长的历史状态量(测点压力信息)[x(t),x(t‑1),…,x(t‑ns)]和控制量(入水口压力和流量)[u(t‑1),u(t‑2),…,u(t‑nu)]作为输入项，以补偿“供水管网状态量仅部分可知”的不足；确定输出项为压力测点t+1时刻的输出ym(t+1)。这里，ns、nu为历史时间窗口。

[0009] 建立基于并行LSTM串联DNN的深度学习模型：

[0010] a.分别采用LSTM模型对状态量[x(t),x(t‑1),…,x(t‑ns)]和控制量[u(t‑1),u(t‑2),…,u(t‑nu)]进行特征提取和学习。分别为供水管网的状态变量和控制变量经LSTM模型的输出值。

[0011] b.采用深层神经网络DNN模型将进行融合处理，得到输出ym(t+1)，可用式(1)描述：

[0012]

[0013] ym(t+1)为深度学习模型的预测输出。[]表示将两种在时间维度上具有相同维数的矩进行合并，H()为DNN模型的激活函数。WDNN、bDNN分别为DNN模型的权值与阈值。

[0014] 2、数据预处理，建立压力预测数据库

[0015] (1)数据预处理

[0016] 数据补缺：针对来自SCADA系统现场采集的数据存在数据丢失问题，采用线性、抛物线或三次曲线插值补全缺失的数据。如缺失数据过多，则放弃这一时段的历史数据。

[0017] 数据去噪：针对现场数据存在大量噪声干扰问题，采用小波变换去除噪声。小波变换能在时域和频域进行局部化信号分析，可实现多分辨率分析，判断噪声与突变信号，确定有效信号。

[0018] 无量纲处理：针对供水管网压力和流量具有不同的物理量纲和数量级问题，对数据作归一化处理，即将输入与输出都限制在[0,l]，使它们以相同的等级参与模型训练与预测，具体公式如(2)所示

[0019]

[0020] 式中，X表示需归一化数据，Max(X)、Min(X)分别代表最小值和最大值，Xnor代表归一化后的数据。

[0021] (2)建立压力预测数据库

[0022] 建立供水管网压力预测数据库：数据项除了时间戳、节点(监测点或入口)外，包括：(1)测点的压力、流量值，入口的压力、流量值等，从SCADA中实时抽取/清洗/转换，并存储，作为模型的输入项；(2)测点的预测压力，来自模型预测，是模型的输出项；(3)误差数据项，用来统计分析预测精度。

[0023] 3、训练预测模型

[0024] (1)确定训练样本

[0025] 围绕大型供水管网的DMA分区，或者小型供水管网，确定输入样本为{X(ns),U(nu),Y}，其中X(ns)为i维状态变量，U(nu)为2j维控制变量，i为监测点数，j为入口数，。

[0026] 为保证训练，输入样本数据时间跨度必须保证Max(ns,nu)个时段连续，一般须保证1小时以上的连续有效的{X(ns),U(nu),Y}数据，有效样本不少于12x24x15＝4320个。

[0027] (2)确定模型基本结构，设置其余参数初值，开始训练模型

[0028] 根据经验或者初步调参的效果确定参数的取值范围。nu、ns∈{1,2,…12}，时间步长t＝5分钟，即历史信息最大跨度为60分钟，由于较长的历史信息会使输入冗余，且对提高预测精度并无多大影响；隐含层个数Layers∈{1,2,…,5}，增加隐含层的层数可以提高特征提取与学习能力，但多层会使模型变得越来越复杂；相应神经元数量Neurons∈[0,300]，神经元的数量决定了网络训练的非线性程度。

[0029] 为了防止深度学习模型出现过拟合现象，本发明在每一层引入Dropout后会随机地更新网络参数，增加模型的泛化能力。Dropout技术具体做法是在模型训练时随机抛弃一定比例的隐含层节点(但权重会保存，仅暂时不进行更新)，而在模型使用时恢复全连接。节点抛弃比例dropout rate∈[01,0.5]，对于节点抛弃比例的选取，如果比例太低则起不到效果，比例太高则会导致模型的欠学习。

[0030] 本发明采用小批量(Mini‑batch)梯度下降法来优化模型中的各个参数，这种方法把数据分为若干个批，按批(batch)来更新参数，这样，一个批中的一组数据共同决定了参数的更新，减少了随机性和计算量。小批量梯度下降法的样本大小Mini_batch∈[5,50]。训练轮数epoch∈[100,200]，训练次数太少达不到训练效果，过多并不会提高预测精度反而增加训练时间。

[0031] 激活函数在模型中两个部分使用，一是用于输入值计算LSTM层，还有用于特征融合后的输出层。传统的饱和激活函数，如sigmoid和tanh会带来梯度消失问题，而ReLU等非饱和激活函数相对于饱和激活函数，能够加快模型收敛速度；使用ReLU的深度模型在有监督训练之前不需要预训练就能得到相近甚至更好的结果。本发明激活函数选取ReLU。

[0032] (3)训练迭代

[0033] 在模型训练时，一般通过模型的预测值和实测值y求出均方根作为模型误差，如公式(3)所示。其中，n是输出层神经元节点个数。

[0034]

[0035] 当loss<误差目标ε∈[0.2％，0.5％]，达到训练要求，迭代结束。当误差较大时调整模型的各个参数，若误差不符合收敛条件且不再减小，则改变模型基本结构，即重新给定一个{nu,ns,Layers}，再根据各个基本结构调节其他参数，重新迭代训练。

[0036] 4、在线压力预测

[0037] 将压力预测数据库中测点的压力、流量值，入口的压力、流量值等连续有效数据，依次输入到模型，模型则给出t+1时刻的压力预测值ym(t+1)，可以提前约t＝5分钟提供给调度人员参考。

[0038] 同时，将压力预测值ym(t+1)存入数据库，与t+1时刻的实测值y(t+1)进行比较，计算Δ＝ym(t+1)‑y(t+1)。设允许预测误差为σ∈[5％，10％]，若连续三次Δ>σ*y(t+1),则返回步骤3，重新训练模型，用新近数据，更新模型参数。

[0039] 本发明的有益效果：本发明提出一种基于并行LSTM串联DNN的深度学习模型，实现LSTM和DNN的优势互补，并用Dropout技术防止模型过拟合，Relu激活函数加快模型收敛速度，小批量梯度下降法减少了随机性和计算量，选择RMSprop作为随机梯度下降法的优化算法，提高了供水管网压力预测方法的抗干扰性和精度。

实施方案

[0042] 为使本发明实现的技术手段与创作特征易于明白，下面结合附图和实施例，对本发明的实现方式进一步详述，并不限制本发明的权利范围。

[0043] 现以某市Y区供水管网为实例，该区面积约合106.7km2，日供水量约为150000m3,监测点包括入水口流量计压力测点、管网压力测点、出水口流量测点、中间管道测点。

[0044] 具体的管网内部重要压力监测点信息见表1

[0045] 表1管网17个重要压力监测点信息

[0046]

[0047] 1、确定输入输出项，建立基于并行LSTM串联DNN的预测模型

[0048] 鉴于供水管网系统是一个多输入多输出的非线性时滞系统，选择较长的历史状态量[x(t),x(t‑1),…,x(t‑ns)]和控制量[u(t‑1),u(t‑2),…,u(t‑nu)]作为输入项，以补偿“供水管网状态量仅部分可知”的不足；确定输出项为压力测点t+1时刻的输出ym(t+1)。其中，ns、nu为历史时间窗口。

[0049] 这里，以该市Y区供水管网系统的4个入水口的供水压力、供水量的历史控制信息和17个测点压力历史和当前状态信息为输入项，以17个监测点下一时刻的压力作为输出项。

[0050] 建立基于并行LSTM串联DNN的深度学习模型(如图1所示)：

[0051] a.分别采用LSTM模型对状态量[x(t),x(t‑1),…,x(t‑ns)]和控制量[u(t‑1),u(t‑2),…,u(t‑nu)]进行特征提取和学习。分别为供水管网的状态变量和控制变量经LSTM模型的输出值。

[0052] b.采用深层神经网络DNN模型将进行融合处理，得到输出ym(t+1)，可用式(4)描述：

[0053]

[0054] ym(t+1)为深度学习模型的预测输出。[]表示将两种在时间维度上具有相同维数的矩进行合并，H()为DNN模型的激活函数。WDNN、bDNN分别为DNN模型的权值与阈值。

[0055] 2、数据预处理，建立压力预测数据库

[0056] (1)数据预处理

[0057] 数据补缺：针对来自SCADA系统现场采集的数据存在数据丢失问题，采用线性、抛物线或三次曲线插值补全缺失的数据。如缺失数据过多，则放弃这一时段的历史数据。

[0058] 数据去噪：针对现场数据存在大量噪声干扰问题，采用小波变换去除噪声。小波变换能在时域和频域进行局部化信号分析，可实现多分辨率分析，判断噪声与突变信号，确定有效信号。

[0059] 无量纲处理：针对供水管网压力和流量具有不同的物理量纲和数量级问题，对数据作归一化处理，即将输入与输出都限制在[0,l]，使它们以相同的等级参与模型训练与预测，具体公式如(5)所示

[0060]

[0061] 式中，X表示需归一化数据，Max(X)、Min(X)分别代表最小值和最大值，Xnor代表归一化后的数据。

[0062] (2)建立压力预测数据库

[0063] 建立供水管网压力预测数据库：数据项除了时间戳、节点(监测点或入口)外，包括：(1)测点的压力、流量值，入口的压力、流量值等，从SCADA中实时抽取/清洗/转换，并存储，作为模型的输入项；(2)测点的预测压力，来自模型预测，是模型的输出项；(3)误差数据项，用来统计分析预测精度。

[0064] 3、训练预测模型

[0065] (1)确定训练样本

[0066] 围绕某市Y区供水管网，确定输入样本为为{X(ns),U(nu),Y}，其中X(ns)为17维状态变量，U(nu)为8维控制变量，17个监测点，4个入口，t为时间步长。

[0067] 为保证训练，输入样本数据时间跨度必须保证Max(ns,nu)个时段连续，一般须保证1小时以上的连续有效的{X(ns),U(nu),Y}数据，有效样本不少于12x24x15＝4320个[0068] 这里，样本数据集为2016年5月27日至2016年6月28日，共35天的数据，采样间隔为
5分钟，连续有效，样本大小为10080。其中5月28日6月至26日的数据用于训练。

[0069] (2)确定模型基本结构，设置其余参数初值，开始训练模型

[0070] 根据经验或者初步调参的效果确定参数的取值范围。nu、ns∈{1,2,…12}，时间步长t＝5分钟，即历史信息最大跨度为60分钟，由于较长的历史信息会使输入冗余，且对提高预测精度并无多大影响；LSTM的隐含层个数layer＝2，相应神经元数量Neurons＝100，DNN的layer＝2，相应Neurons＝96。

[0071] 为了防止深度学习模型出现过拟合现象，本发明在每一层引入Dropout后会随机地更新网络参数，增加模型的泛化能力。本实施例中，正则化的节点抛弃比例dropout rate＝0.3。

[0072] 本实施例采用小批量(Mini‑batch)梯度下降法来优化模型中的各个参数，小批量梯度下降法的样本大小Mini_batch＝32，训练轮数epoch＝100。

[0073] 本实施例激活函数选取ReLU。

[0074] (3)训练迭代

[0075] 在模型训练时，一般通过模型的预测值和实测值y求出均方根作为模型误差，如公式(6)所示。其中，n是输出层神经元节点个数。

[0076]

[0077] 当loss<误差目标ε＝0.3％，达到训练要求，迭代结束。当误差较大时调整模型的各个参数，若误差不符合收敛条件且不再减小，则改变模型基本结构，即重新给定一个{nu,ns,Layers}，再根据各个基本结构调节其他参数，重新迭代训练。

[0078] 4、在线压力预测

[0079] 压力预测数据库中测点的压力、流量值，入口的压力、流量值等连续有效数据，依次输入到模型，模型则给出t+1时刻的压力预测值ym(t+1)，可以提前约t＝5分钟提供给调度人员参考。

[0080] 同时，将压力预测值ym(t+1)存入数据库，与t+1时刻的实测值y(t+1)进行比较，计算Δ＝ym(t+1)‑y(t+1)。设允许预测误差为σ＝5％，若连续三次Δ>σ*y(t+1),则启动模型重新训练(步骤3)，用新近数据，更新模型参数。

[0081] 本实施例将6月27日至6月28日的数据用于测试，通过RMSE(均方根误差)和MAPE(平均绝对百分误差)作为评价性能指标，表2给出各个监测点性能指标,具有很高的预测精度。

[0082] 表2各监测点预测性能指标

[0083]

[0084]

[0085] 为了与传统模型进行比较，分别试算了BP神经网络、SVM支持向量机、VARX、NARX，得到了与传统预测方法比较结果(见表3)。

[0086] 表3与传统预测方法的比较

[0087]预测方法 BP SVM VARX NARX 本发明方法
RMSE*100(各测点平均值) 0.56 0.43 0.30 0.28 0.17

[0088] 由表3得，基于并行LSTM串行DNN深度学习模型预测结果要明显好于传统预测模型。

[0089] 本发明方法，按照图2所示的供水管网监测点压力预测系统应用框架，可用于实际生产。

附图说明

[0040] 图1：基于并行LSTM串联DNN的预测模型；

[0041] 图2：供水管网监测点压力预测系统应用框架。

1基于并行LSTM串联DNN的供水管网压力预测方法