首页 > 专利 > 杭州电子科技大学 > 一种基于3D卷积神经网络的短时交通流预测方法专利详情

一种基于3D卷积神经网络的短时交通流预测方法 0 0

有效专利查看PDF

申请进展

基本信息

申请人信息

代理人信息

摘要

法律状态

权利要求

说明书

专利申请流程有哪些步骤？

申请

申请号：指国家知识产权局受理一件专利申请时给予该专利申请的一个标示号码。唯一性原则。

申请日：提出专利申请之日。

2019-07-29

申请公布

申请公布指发明专利申请经初步审查合格后，自申请日（或优先权日）起18个月期满时的公布或根据申请人的请求提前进行的公布。

申请公布号：专利申请过程中，在尚未取得专利授权之前，国家专利局《专利公报》公开专利时的编号。

申请公布日：申请公开的日期，即在专利公报上予以公开的日期。

2019-12-24

授权

授权指对发明专利申请经实质审查没有发现驳回理由，授予发明专利权；或对实用新型或外观设计专利申请经初步审查没有发现驳回理由，授予实用新型专利权或外观设计专利权。

2021-06-29

预估到期

发明专利权的期限为二十年，实用新型专利权期限为十年，外观设计专利权期限为十五年，均自申请日起计算。专利届满后法律终止保护。

2039-07-29

基本信息

有效性	有效专利	专利类型	发明专利
申请号	CN201910688693.0	申请日	2019-07-29
公开/公告号	CN110517482B	公开/公告日	2021-06-29
授权日	2021-06-29	预估到期日	2039-07-29
申请年	2019年	公开/公告年	2021年
缴费截止日
分类号	G08G1/01 、G08G1/065	主分类号	G08G1/01
是否联合申请	独立申请	文献类型号	B
独权数量	1	从权数量	6
权利要求数量	7	非专利引证数量	0
引用专利数量	0	被引证专利数量	0
非专利引证
引用专利		被引证专利
专利权维持	3	专利申请国编码	CN
专利事件		事务标签	公开、实质审查、授权

申请人信息

申请人	杭州电子科技大学	第一申请人	杭州电子科技大学
专利权人	杭州电子科技大学	当前专利权人	杭州电子科技大学
发明人	方景龙、余峰、邵艳利、陈滨	第一发明人	方景龙
地址	浙江省杭州市下沙高教园区2号大街	邮编	310018
申请人数量	1	发明人数量	4
申请人所在省	浙江省	申请人所在市	浙江省杭州市

代理人信息

代理机构

专利代理机构是经省专利管理局审核，国家知识产权局批准设立，可以接受委托人的委托，在委托权限范围内以委托人的名义办理专利申请或其他专利事务的服务机构。

杭州君度专利代理事务所

代理人

专利代理师是代理他人进行专利申请和办理其他专利事务，取得一定资格的人。

杨舟涛

摘要

本发明涉及一种基于3D卷积神经网络的短时交通流预测方法。本发明通过采集城市中各个区域各个时间段的交通流量数据，使用3D卷积神经网络的大规模样本集拟合能力与时空特征提取能力，搭建缺失值补全模型补全原始数据集中的缺失数据，搭建交通流预测模型进行高准确率的短时交通流预测。在模型中，将时间信息处理的网络层均匀分布在所有网络层中，使得时间信息被充分处理，同时使用学习率动态减小的Adam优化算法使得模型得以较快收敛。本发明解决了现有短时交通流预测模型无法高效处理交通流数据中的时空特征以及缺失值补全精度不高的问题。

摘要附图
说明书附图：图1
说明书附图：图2
说明书附图：图3

法律状态

序号	法律状态公告日	法律状态	法律状态信息
1	2021-06-29	授权
2	2019-12-24	实质审查的生效	IPC(主分类): G08G 1/01 专利申请号: 201910688693.0 申请日: 2019.07.29
3	2019-11-29	公开

权利要求

权利要求书是申请文件最核心的部分，是申请人向国家申请保护他的发明创造及划定保护范围的文件。

1.一种基于3D卷积神经网络的短时交通流预测方法，其特征在于，该方法包括以下步骤：将某城市区域划分为多个区域，采集每个区域的交通流数据；基于采集到的交通流数据，将数据划分为缺失数据和完整数据，首先使用完整数据训练基于3D卷积神经网络的缺失值补全模型对缺失数据进行补全，使用3D卷积神经网络模型基于缺失数据处理后的交通流数据进行迭代训练，使用Adam优化算法对3D卷积神经网络的网络参数进行调整；将调整后的3D卷积神经网络模型对短期交通流进行预测；
对缺失数据进行补全的具体方法为：将原始样本集合中的完整数据取出组成训练集，使用该训练集训练基于3D卷积神经网络的缺失值补全模型，模型结构和训练方式与交通流预测模型相同；对于原始样本集合中的缺失数据，使用缺失值补全模型补全。

2.根据权利要求1所述的一种基于3D卷积神经网络的短时交通流预测方法，其特征在于，所述交通流数据为使用某城市出租车上的GPS设备采集得到的该城市范围内各个区域各个时间段车流量信息；遍历收集到的连续时刻的交通流量数据，对于训练样本，取其前12个时间步的交通流量数据作为特征，第13个时间步的交通流数据作为标签，即待预测数据；
依次遍历将原始数据集转化为样本集，取80%的样本作为训练集，10%的样本作为验证集，
10%的样本作为测试集。

3.根据权利要求1所述的一种基于3D卷积神经网络的短时交通流预测方法，其特征在于：所述缺失数据为：由于数据集采样间隔为半个小时，因此理论上每一天的样本数为48个，由于传感器损坏或者系统维护的原因数据集中存在部分缺失数据，将一天样本数少于
48的定义为缺失数据。

4.根据权利要求1所述的一种基于3D卷积神经网络的短时交通流预测方法，其特征在于：使用3D卷积神经网络模型基于缺失数据处理后的交通流数据进行迭代训练，使用Adam优化算法对3D卷积神经网络的网络参数进行调整，具体为：
（1）逐层构建单层3D卷积核，每次构建一个单层网络；每一层从是否对时间信息进行缩减的角度出发分为时间维度缩减层和时间维度非缩减层；将时间维度缩减层均匀分布于网络层中；
（2）当所有层构造完后，每层采用Adam优化算法进行调优，每次仅调整一层，逐层调整。

5.依据权利要求4所述的一种基于3D卷积神经网络的短时交通流预测方法，其特征在于：所述调优的具体方法包括以下步骤：
A、将交通流数据使用第一层的3D卷积核进行处理，得到的结果输入到第二层中，依次向深层传播，最终得到预测值；
B、使用预测值与观测值的残差，使用Adam优化算法从深层向浅层依次调整参数，且在迭代训练过程中Adam优化算法的学习率会随迭代轮数的增加而减小，使模型易于收敛，直至所有层的参数调整完毕。

6.根据权利要求1所述的基于3D卷积神经网络的短时交通流预测方法，其特征在于：数据的训练是通过GPU进行并行运算来实现的。

7.根据权利要求1所述的一种基于3D卷积神经网络的短时交通流预测方法，其特征在于：将城市区域划分为32*32个区域。

说明书

技术领域

[0001] 本发明设计一种基于3D卷积神经网络的短时交通流预测方法，属于交通预测的技术领域。

背景技术

[0002] 随着世界经济的飞速发展和城市化进程的不断加快，城市机动车保有量急剧增长，城市中和高速公路上的交通流量显著增大，城市道路负荷不断加重，与此同时带来了一系列的问题。通过对交通流数据深入挖掘其特征，并在此基础上建立交通流预测模型，能够有效预测可能发生的交通拥堵现象从而引导车辆选择合理的出行路线。

[0003] 短时交通流量预测，尤其是时长半小时甚至15分钟以内的短时交通流预测是智能交通控制和诱导的重要依据，对于解决城市交通拥堵问题更具实际价值。短时交通流预测方法主要包括两部分：交通流历史数据库的建立及预测模型构建。前者为短时交通流预测提供数据保障，后者对未来交通状态的预测提供快速有效的方法。到目前，已经有一系列模型与算法被开发应用于短期交通流的预测，但预测精度不高。

[0004] 传统的交通流预测方法主要有K近邻、支持向量机、决策树等，这些方法在一定规模的交通流数据基础上进行建模，从而进行预测并达到一定精度。但随着大数据时代来临，诸如决策树这类参数较少的模型难以有效拟合海量交通流量数据并发掘其特征，达到预期性能。

发明内容

[0005] 本针对现有技术的不足，提供一种基于3D卷积神经网络的短时交通流预测方法。本发明的方法可以对交通流数据进行更深入的挖掘分析，有效提取时空特征，因此在对交通流进行短期预测时更为精准，性能更优秀。

[0006] 本发明一种基于3D卷积神经网络的短时交通流预测方法，该方法具体如下：将某城市区域划分为32×32个区域，采集每个区域的交通流数据；基于采集到的交通流数据，将数据划分为缺失数据和完整数据，首先使用完整数据训练基于3D卷积神经网络的缺失值补全模型对缺失数据进行补全，使用3D卷积神经网络模型基于缺失数据处理后的交通流数据进行迭代训练，使用Adam优化算法对3D卷积神经网络的网络参数进行调整；将调整后的3D卷积神经网络模型对短期交通流进行预测；其中数据的训练是通过GPU进行并行运算来实现的。

[0007] 作为优选，所述交通流数据为使用某城市出租车上的GPS设备采集得到的该城市范围内各个区域各个时间段车流量信息；遍历收集到的连续时刻的交通流量数据，对于训练样本，取其前12个时间步的交通流量数据作为特征，第13个时间步的交通流数据作为标签，即待预测数据。依次遍历将原始数据集转化为样本集，取80％的样本作为训练集，10％的样本作为验证集，10％的样本作为测试集。

[0008] 作为优选，所述缺失数据为：由于数据集采样间隔为半个小时，因此理论上每一天的样本数为48个，由于传感器损坏或者系统维护的原因数据集中存在部分缺失数据，将一天样本数少于48的定义为缺失数据。

[0009] 作为优选，使用完整数据训练基于3D卷积神经网络的缺失值补全模型对缺失数据进行补全；具体为：将原始样本集合中的完整数据取出组成训练集，使用该训练集训练基于3D卷积神经网络的缺失值补全模型，模型结构和训练方式与交通流预测模型相同；对于原始样本集合中的缺失数据，使用缺失值补全模型补全。

[0010] 作为优选，使用3D卷积神经网络模型基于缺失数据处理后的交通流数据进行迭代训练，使用Adam优化算法对3D卷积神经网络的网络参数进行调整，具体为：

[0011] (1)逐层构建单层3D卷积核，每次构建一个单层网络。每一层从是否对时间信息进行缩减的角度出发分为时间维度缩减层和时间维度非缩减层。将时间维度缩减层均匀分布于网络层中，这种方法可对时间信息进行充分处理；

[0012] (2)当所有层构造完后，每层采用Adam优化算法进行调优，每次仅调整一层，逐层调整。

[0013] 其中所述调优的具体方法包括以下步骤：

[0014] A.将交通流数据使用第一层的3D卷积核进行处理，得到的结果输入到第二层中，依次向深层传播，最终得到预测值。

[0015] B.使用预测值与观测值的残差，使用Adam优化算法从深层向浅层依次调整参数，且在迭代训练过程中Adam优化算法的学习率会随迭代轮数的增加而减小，使模型易于收敛，直至所有层的参数调整完毕。

[0016] 随着车辆的增多，各种交通流数据不断产生，处理大量的交通流数据就需要一种能处理海量数据的模型，卷积神经网络模型在这一方面具有明显优势，它可以称为未来处理大数据，特别使图像数据以及与图像数据类似的二维、三维数据的过程中不可或缺的模型工具。而3D卷积神经网络在传统卷积神经网络的基础上解决了无法有效处理时间特征的缺点，使预测性能得到有效提升。本发明将3D卷积神经网络模型应用于交通流的处理上面，将对车辆安排合理出行带来极大方便，一方面可以缓解道路的拥堵现状，另一方面可以减少车辆在等待的过程中对人们时间、精力的消耗与车辆能源的消耗，从而有效提升城市运转效率与缓解空气污染的现状。

附图说明

[0017] 图1是本发明的基本步骤流程图。

[0018] 图2是本发明的模型结构图；

[0019] 图3为3D卷积神经网络模型结构图。具体实施方案

[0020] 下面结合实施例对本发明作进一步的说明，但并不作为本发明限制的依据。

[0021] 实施例。一种基于3D卷积神经网络的短时交通流预测方法，如图1、图2、图3所示，包括以下步骤：

[0022] 步骤一、交通流数据采集；

[0023] 步骤二、交通流数据预处理；

[0024] 步骤三、模型构建与训练；

[0025] 步骤四、基于模型进行交通流预测。

[0026] 一、交通流数据的采集

[0027] 使用某城市出租车上的GPS设备采集得到该城市范围内各个区域各个时间段车流量信息，为后续3D卷积神经网络的训练提供丰富的当前数据和历史数据。原始数据为：将整T×K×I×J个城市划分为I×J个网格，可以将整个城市的交通流数据定义为张量形式：X∈R ，其中T为时间，K为流量类型(输入流量或输出流量)，I为经度，J为维度。

[0028] 二、交通流数据预处理

[0029] 由于数据集采样间隔为半个小时，每一天的样本数为48个，将一天样本数少于48的定义为缺失数据。将原始样本集合中的完整数据取出组成训练集，使用其训练基于3D卷积神经网络的缺失值补全模型，模型结构和训练方式与后续交通流预测模型相同。对于原始样本集合中的缺失数据，使用缺失值补全模型补全。补全完成后，从补全后的数据中得到训练样本(X1,X2,...Xt‑1,Xt)，其中(X1,X2,...Xt‑1)为样本特征，Xt为待预测点的交通流数据。例如：当前时间点t为8：00，由于采样间隔为30分钟，Xt‑1为7：30，依次类推。因此，本发明的交通流量任务可抽象为：给定观测到的交通流数据序列和包括节假日和天气状况的不确I×J定因素{Xt,Yn,Znt＝1,2,3,......n‑1}来预测Xn，其中Xt如前所述，Yn∈R 表示T时刻整个I×J
城市各个区域的天气状况，Zn∈R 表示T时刻整个城市是否处于节假日的时间范围内。

[0030] 三、模型构建与训练

[0031] 3‑1.模型构建

[0032] 3d卷积神经网络是一种从多维原始数据中提取时空特征进行拟合并将预测结果与观测结果的残差使用优化算法对参数进行迭代逼近的深度学习神经网络架构。一般的3D CNN模型由3D卷积层、3D池化层和全连接层组成。由于本任务中输入与输出的尺寸(长与宽)一致，因此无需池化层与全连接层。卷积层是网络层输入yn‑1到网络层输出yn的映射，表示T为：yn＝fn(x)＝g(Wnyn‑1+bn)，其中，n表示第n层，W为参数，b表示偏置，g()是非线性激活函数，一般使用ReLU函数，其表达式为：

[0033]

[0034] 3D卷积神经网络模型的搭建是一个复杂的过程，其中对预测精度影响最大的为网络模型的超参数，如学习率、正则化参数、激活函数选择、网络层数选择与每一个3D卷积层的卷积核个数等等。

[0035] 对于学习率与正则化参数这两个对模型训练与预测结果影响最大的超参数，使用网格搜索法与随机搜索法相结合的方式。网格搜索法与随机搜索法都是比较常用的超参数搜索算法。本专利在部分超参数调优时，在大范围内使用网格搜索法确定超参数最优值的大致范围，再使用随机搜索法定位到准确值。这种将两者相结合的方法比网格搜索法速度更快，同时搜索效果比随机搜索法更好。在模型中，学习率选择0.008，正则化参数选择0.002。对于激活函数选择、网络层数选择等超参数，本专利采取模型调参经验与实验验证相结合的方式来确定。激活函数如上所述使用ReLU激活函数，网络层数选择7层。

[0036] 同时在网络层的搭建过程中，由于本任务时基于前十二个时间步的交通流量信息对后一个时间步的交通流量信息进行预测，本模型使用时间维度上步长为2的3D卷积核设置对时间信息进行缩减，每次缩减一半，而不是3D池化层。这两种方式的效果差不多，但前者使网络结构更加简洁。在网络层搭建中，将缩减时间信息的网络层均匀分布在所有网络层中，使得时间信息能够被充分提取与处理。

[0037] 3‑2.模型训练

[0038] 本专利使用回归问题中常用的均方根误差作为模型的损失函数，表达式为：

[0039]

[0040] 其中，Y为交通流预测模型中待预测时间点的真实值，X为模型输入，f(X)为模型输出，即待预测时间点的预测值。由于深度学习模型强大的表示能力，需要在损失函数中引入正则化项来减缓模型的过拟合程度。因此在模型的损失函数中本文引入了L2正则化来防止模型陷入严重的过拟合状态中。损失函数的最终表达式为：

[0041]

[0042] 其中Ω(θ)表示模型中所有参数，α表示L2正则化参数。

[0043] 本模型使用Adam优化算法进行训练，并且使用mini‑batch在每次训练时随机选取一部分训练样本对模型进行训练。与传统梯度下降法相比，其训练速度更快，同时给训练过程引入了随机性。在训练中，先使用当前模型生成预测值，再根据预测值与观测值的差与模型的参数分布对模型进行参数迭代优化。模型基本步骤如下：

[0044] 1)使用mini‑batch方法，随机选取一部分有标签数据样本用梯度反向传播算法对3D卷积神经网络进行训练，计算各层的输出；

[0045] 2)使用模型输出与观测值的残差对各层参数进行调整，随着迭代次数的增加，学习率会逐渐减小，使模型趋于稳定；

[0046] 3)根据性能指数判定误差是否满足条件，如果未能满足要求则重复步骤1)和2)，直至整个网络输出满足期望要求。

[0047] 4)得到最终的3D卷积神经网络模型。

[0048] 四、基于模型进行交通流预测

[0049] 当实时待预测数据到来时，将待预测时间点前12个时间步的交通流数据堆叠输入到步骤三训练完成的交通流预测模型中，即可输出待预测时间点的交通流数值。

1城市轨道交通短时客流容错预测系统及方法 2城市轨道交通站点短时客流预测系统及方法 3一种基于Adaboost算法的交通流特性分析与预测方法 4一种基于3D卷积神经网络的短时交通流预测方法 5一种数据稀疏时间段的道路交通流状况预测方法 6基于时空缓冲区的轨迹数据补全及交通流预测方法 7基于灰熵分析和改进贝叶斯融合的交通流预测方法 8针对行驶中交通工具的预警监测方法、系统及移动终端 9一种基于大数据的交通拥堵预测系统、方法及存储介质 10一种基于物联网和边缘计算的交通流预测系统及云平台