[0035] 如图1和图2所示,本发明具体实现如下:
[0036] 考虑到25个监测站之间的时空相关性和监测站的历史状态,选择了两个或多个CNN层来从历史空气污染物数据中提取长期跨度学习的内在特征,然后使用单热编码。该方法对每小时数据进行编码,并将提取的特征与当前的气象数据和相关的污染物数据相结合,以提高模型的预测性能。使用两个分支来提取空间特征和时间特征,然后使用注意模型来权衡隐藏特征以增强特征的有效性。通过堆叠多层LSTM,可以逐层自动提取具有长期依赖性的空间相关污染物数据的特征,并且可以使用融合特征来预测空气污染物的多尺度时间序列预测。
[0037] 步骤1:利用格兰杰因果分析解决时空相关性问题,格兰杰因果关系作为衡量时间序列之间相互作用的指标,近几十年来一直备受青睐。对于复杂的空间因素,使用格兰杰因果关系来分析空气浓度的时间序列。将一个监测站的空气污染物的时间序列定义为Yi,另一个监测点的时间序列为Xi。格兰杰因果关系的格式和零假设是:
[0038]
[0039]
[0040] 这是Nd空间聚类的邻域集(采用K‑Means算法来考虑所有空间因素对监测点进行聚类);εt是一个白高斯随机向量,n是时间戳的数量,向量Φi是对应的权重Yi;μi表示空间位置Xi和Yi之间的空间权重。
[0041] 然而,大气污染物对不同环境条件的依赖性也不同,污染物在扩散过程中易受风向影响。因此,有必要研究不同监测点之间不同风向下不同污染物的时空因果关系。基于以下实例如图1,可以看到空间和时间之间的因果分析应该反映两个方面:1)时空结构的依赖性,它反映了各种污染物在空间和时间上的传播;2)可预测性,表明不同的环境条件可能导致不同的时空因果关系。
[0042] 针对Xi和Yi的空间权重μi,将风向和距离与空气污染物的浓度扩散过程相结合,提出了一种基于高斯核函数的超参数高斯权重向量,可以描述为:
[0043]
[0044] 其中α(j)是学习率,其中dX/dY和θXY分别代表距离变量和角度变量。距离可以通过欧几里德距离直接计算。使用F检验来确定第一个公式是否比第二个公式更重要。如果是,Xi是Yi的因果关系,所以Xi可以用于预测Yi;注意,使用了一个带宽参数σ,它表示变换后的方向和距离效应之间的折衷。
[0045] 步骤2:空间/时间特征提取,使用历史空气污染物浓度数据建立一个时空关系为三维矩阵作为CNN的输入。假设S监测站Si={s1,s2,…,s25}的总数按空间顺序排列在路段上。S站可以提供一组时间检测数据Di={dt‑r,…,dt‑2,dt‑1},其中在每个时间点t记录的检测数据是 D是时间检测数据,S是监测站,并且ο是属性。根据道路上监测点的空间和时间分布组合了所有数据,得到了一个大小为M={S,D,ο}的三维数据矩阵。本文的预测问题可以定义为:对于给定的一组监测站S在给定的不同时间间隔,将其最新的最大时间步骤{t‑r,…,t‑2,t‑1}历史数据用于时空相关性建模和空气污染物浓度预测。为了提高效率,在模型的第二和第三卷积层之后添加批量标准化。这里使用非线性激活函数SELU函数,SELU具有更好的收敛性并且可以有效地避免梯度消失的问题。
[0046] 步骤3:建立特征图注意力模型,使用卷积核进行卷积运算以获得输出空间和时间特征映射。在注意力模型中,F={f(1),f(2),…,f(j)}是卷积层的输出隐藏特征映射,即j∈R卷积核的数量。使用以下等式通过等式计算:
[0047]
[0048] F′=W⊙F
[0049] 这里,W={ω1,ω2,…,ωj}是一组权重矩阵,其大小与特征映射相同。产生W的注意力模型由三个具有步幅1的卷积层组成。第一卷积层具有k×s滤波器,卷积核尺寸为5×5,第二和第三层具有k个滤波器,卷积核尺寸为3×3,并且每个卷积层有100个滤波器。⊙是元素的乘积。
[0050] 步骤4:建立信道注意力模型,输入模型的三维时空数据矩阵包含许多不同的属性,不同的属性对模型的预测性能有不同的影响。期望将这34种有用信息集成到机器学习模型中,进行有监督的学习和分析,实现准确的预测。同时,来自卷积层的不同信道输出一定对模型具有不相同的影响。因此,对不同的信道进行加权,以提高特征对模型预测性能的有效性。
[0051] 对于输入特征映射F={f(1),f(2),…,f(j)},其中j是特征映射中的通道数,在F中执行最大池化操作以获得每个通道C={c1,c2,…,cj}的最大值。注意力机制将产生注意权重向量V和加权表示F′如下等式计算.
[0052] ci=maxf(j)
[0053] V=softmax(C)
[0054] F′=V⊙F
[0055] 步骤5:多个监测点空气污染浓度预测,从卷积和合并处理获得加权时间特征和空间特征之后,可以通过FST=F′s⊕F′t逐元素地添加两个特征图并将它们压缩成一维特征X=(x1,x2,…,xt)。这些特征被分解为连续的组件并馈送到重复的LSTM单元以进行时间分析。随后使用LSTM层从X=(x1,x2,…,xt)提取时间信息输入,并且另一输入是从最后时间步骤开始的隐藏单元ht‑1。Attention‑CNN‑LSTM的前向训练过程可以用以下等式表示:
[0056] ft=σ(Wf·g[ht‑1,xt]+bf)
[0057] it=σ(Wi·g[ht‑1,xt]+bi)
[0058] Ct=ft×Ct‑1+it×tanh(WC·g[ht‑1,xt]+bC)
[0059] ot=σ(Wo·g[ht‑1,xt]+bo)
[0060] ht=ot·tanh(Ct)
[0061] 其中it,ot和ft分别表示输入门,输出门和遗忘门的激活;Ct和ht分别表示每个细胞和记忆块的激活载体;W和b分别表示权重矩阵和偏差矢量。然后,仅将LSTM的最后一步的输出馈送到完全连接的层中,用于时空空气污染预测。
[0062] 训练结束,模型的权值参数确定,此时的模型在使用格兰杰因果分析空间相关性分析中加入风向影响因素,使用注意力模型来权衡隐藏特征以增强特征的有效性,将实时的气象信息、污染物信息以及时间戳信息作为移动污染源排放物浓度输入到模型中,模型即可输出未来24小时多尺度预测的浓度结果。
[0063] 步骤7:对训练得到的时空深度学习模型进行分析和对比,经分析和对比,相比于其他已有的方法,用基于时空深度学习的预测模型可以更好地对解决的移动污染源排放物浓度时空相关性,且具有较好的预测准确度。
[0064] 以上实施例仅用以说明本发明的技术方案而非限制,仅仅参照较佳实施例对本发明进行了详细说明。本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,均应涵盖在本发明的权利要求范围当中。