首页 > 专利 > 杭州电子科技大学 > 一种基于车载诊断系统数据的路况分析预警方法专利详情

一种基于车载诊断系统数据的路况分析预警方法 0 0

有效专利查看PDF

申请进展

基本信息

申请人信息

代理人信息

摘要

法律状态

权利要求

说明书

专利申请流程有哪些步骤？

申请

申请号：指国家知识产权局受理一件专利申请时给予该专利申请的一个标示号码。唯一性原则。

申请日：提出专利申请之日。

2018-04-11

申请公布

申请公布指发明专利申请经初步审查合格后，自申请日（或优先权日）起18个月期满时的公布或根据申请人的请求提前进行的公布。

申请公布号：专利申请过程中，在尚未取得专利授权之前，国家专利局《专利公报》公开专利时的编号。

申请公布日：申请公开的日期，即在专利公报上予以公开的日期。

2018-11-30

授权

授权指对发明专利申请经实质审查没有发现驳回理由，授予发明专利权；或对实用新型或外观设计专利申请经初步审查没有发现驳回理由，授予实用新型专利权或外观设计专利权。

2021-01-08

预估到期

发明专利权的期限为二十年，实用新型专利权期限为十年，外观设计专利权期限为十五年，均自申请日起计算。专利届满后法律终止保护。

2038-04-11

基本信息

有效性	有效专利	专利类型	发明专利
申请号	CN201810319388.X	申请日	2018-04-11
公开/公告号	CN108769104B	公开/公告日	2021-01-08
授权日	2021-01-08	预估到期日	2038-04-11
申请年	2018年	公开/公告年	2021年
缴费截止日
分类号	H04L29/08 、G08G1/01 、G06K9/62 、G06N3/08	主分类号	H04L29/08
是否联合申请	独立申请	文献类型号	B
独权数量	3	从权数量	0
权利要求数量	3	非专利引证数量	1
引用专利数量	1	被引证专利数量	0
非专利引证	1、2011.10.27CN 106845371 A,2017.06.13CN 103531042 A,2014.01.22CN 102136190 A,2011.07.27CN 106225800 A,2016.12.14刘迪《. 用于园区车辆预警系统的物联网框架研究》《.计算机应用与软件》.2012,万单盼《.驾驶员转向行为特性辨识方法研究》《.吉林大学硕士学位论文》.2018,1-77.;
引用专利	WO2011133309A	被引证专利
专利权维持	4	专利申请国编码	CN
专利事件		事务标签	实质审查、授权

申请人信息

申请人	杭州电子科技大学	第一申请人	杭州电子科技大学
专利权人	杭州电子科技大学	当前专利权人	杭州电子科技大学
发明人	张辰婷、陈媛芳、徐明、陈中渊、杨豪杰、陈奔	第一发明人	张辰婷
地址	浙江省杭州市下沙高教园区2号大街	邮编	310018
申请人数量	1	发明人数量	6
申请人所在省	浙江省	申请人所在市	浙江省杭州市

代理人信息

代理机构

专利代理机构是经省专利管理局审核，国家知识产权局批准设立，可以接受委托人的委托，在委托权限范围内以委托人的名义办理专利申请或其他专利事务的服务机构。

杭州君度专利代理事务所

代理人

专利代理师是代理他人进行专利申请和办理其他专利事务，取得一定资格的人。

朱月芬

摘要

本发明涉及一种基于车载诊断系统数据的路况分析预警方法。本发明通过读取车辆上安装的OBD样本数据来获取车辆行驶的数据，监听异常行为，然后上传到云端数据分析中心利用多种深度学习算法分析并学习用户的驾驶行为，对样本数据进行多次建模和评估，以判断当前道路的拥塞状况、是否容易产生急刹车等危险行为。在获取并分析了足够多的数据之后，系统会根据用户的驾驶行为二次建模，告知用户当前路况。本发明巧妙地避开了实地收集路况的环节。推测路况而不是耗费大量资金去收集路况信息，这既降低了项目的部署难度，也节约了资金消耗。具有智能分析和提醒功能，有限避免不良驾驶行为，躲避拥塞道路，预警事故多发地段。

摘要附图
说明书附图：图1
说明书附图：图2

法律状态

序号	法律状态公告日	法律状态	法律状态信息
1	2021-01-08	授权
2	2018-12-14	著录事项变更	发明人由陈媛芳徐明张辰婷陈中渊杨豪杰陈奔变更为张辰婷陈媛芳徐明陈中渊杨豪杰陈奔
3	2018-11-30	实质审查的生效	IPC(主分类): H04L 29/08 专利申请号: 201810319388.X 申请日: 2018.04.11

权利要求

权利要求书是申请文件最核心的部分，是申请人向国家申请保护他的发明创造及划定保护范围的文件。

1.一种基于车载诊断系统数据的路况分析预警方法，其特征在于：包括如下步骤：
步骤一、将用户个人信息与车辆信息录入云端数据分析中心，每个用户建立一个数据库，并设置密码；通过车辆上强制安装的汽车诊断第二代系统接口，按照汽车诊断第二代系统协议读取车辆数据后，将车辆数据上传至云端数据分析中心中对应该车辆用户的数据库；
步骤二、云端数据分析中心利用深度学习算法分析步骤一中得到的车辆数据并建立分类模型：
1、对车辆数据进行处理，使用欠采样使数据集达到平衡；避免出现正常数据比例过大，异常数据比例过小的现象；
2、对车载数据集建立分类模型，辅助路况分析与行为分析；将数据贴上正常与异常两个标签，然后按相同比例分为两部分：去除标签的数据集和保留标签数据集；
采用基于k-means算法与高斯混合模型相结合的异常检测机制对无标签数据集进行聚类分析，采用基于k-means算法的异常检测机制对有标签数据集进行同样聚类分析；从汽车诊断第二代系统接口上收集到的数据视为一系列的向量，代表高维空间的一系列特征点；
K-means算法对特征点进行分簇，分为异常和正常两簇；对于单个数据点的车辆行驶状态，观察它相对于哪个簇中心的欧几里得距离更近，然后比较其他数据点到簇中心的距离方差，即可判断该点是异常状态还是正常状态；无标签的数据集还需要在后期加入高斯混合模型来计算数据被分在不同类中的概率，进而实现数据点的细分类，获得更为精确的结果，避免过拟合的产生；
3、对实时数据集建立路况预测模型，为预警提供技术支持；使用车辆行驶中出现的异常数据点来刻画道路的整体状态，利用自编码器进行异常信息的检测，并且用BP算法进行模型训练；对驾驶数据进行分析，得到路况模型，避开了实地收集路况的环节；自编码器中的模型有压缩数据和恢复数据的作用，压缩和恢复主要针对隐藏层中的特征数据；被提取出的特征数据将经过sigmoid函数，以实现车辆数据的离散化，进而满足了K-means算法的使用条件；通过BP神经网络赋予每个属性权值，以克服K-means算法各属性等权的缺点；自编码器对驾驶员驾驶习惯的再次建模可以给所有用户匹配个性化路况预警，有针对性地改良不良驾驶习惯，大幅度提高个性智能化预警的水平；步骤三、云端数据分析中心将步骤二中分析完成的数据存储至对应车辆用户的数据库中，并将分析结果发送至用户移动端，查看时需输入步骤一中设置的密码，确保数据安全性；移动端根据数据，告知用户当前路况，提示危险路段和拥塞路段，同时纠正用户不良驾驶行为，实现实时预测；
步骤四、采用无监督学习路况分析模型，通过无标签数据验证模型的准确性；使用聚类结果的簇划分；令簇划分为：
C＝{C1,C2,...,Ck}， dcen(Ci,Cj)＝dist(μi,
μj)，avg(C)代表簇内样本间的平均距离，dcen(Ci,Cj)对应于簇Ci和簇Cj的质心距离，dist()用于计算两个样本之间的距离，μ代表簇的质心；采用DBI指数对K-means的聚类结果进行内部评价见式(1)：
DBI指数越小，聚类结果越好；设现有数据集D＝{x1,x2,......xm}，簇划分C＝{c1,c2,........ck}，参考模型簇划分C*＝{c*1,c*2,......c*s}，令λ与λ*分别表示C和C*对应的簇标记向量；考虑所有样本对在两个组划分中的归属情况a、b、c、d见式⑵：
a＝|SS|,SS＝{(xi,xj)|λi＝λj,λi*＝λj*,i＜j}
b＝|SD|,SD＝{(xi,xj)|λi＝λj,λi*≠λj*,i＜j}
c＝|DS|,DS＝{(xi,xj)|λi≠λj,λi*＝λj*,i＜j}
d＝|DD|,DD＝{(xi,xj)|λi≠λj,λi*≠λj*,i＜j} ⑵；
然后采用Rand指数评价模型，m为总类别数，评价结果在0～1之间，结果越高说明聚类效果准确性越高。

说明书

技术领域

[0001] 本发明属于车联网安全技术领域，涉及一种基于车载诊断系统数据的路况分析预警方法。

背景技术

[0002] 随着经济社会的快速发展，人、车、路等交通元素急剧增加，全国各地交通问题成为焦点。现有驾驶行为预测技术都只是简单地对驾驶时间和驾驶里程进行分析，仅仅是收集了行驶速度、行驶时间、行驶里程、急刹车次数等数据，然后参考固定标准进行判断，智能程度非常低。并不能根据用户的不同和路段的不同进行智能提醒。只是依托于空调及车窗开关系统的附属功能，所以不能广泛应用于各式各样的车型，无法满足用户的需求。且市面上的原有技术，大多是机械式的安全提醒，并没有处理突发情况等等的智能化功能。智能化程度低，只能根据固定标准判断路况和评价行驶状态，适用范围狭隘，无法响应时代对于车联网的需求。路况分析预警系统能使车辆提醒功能摆脱传统的机械式提醒，响应时代对于车联网的需求，发展开展智能化提醒系统。

发明内容

[0003] 本发明的目的就是提供一种基于车载诊断系统数据的路况分析预警方法。

[0004] 本发明包括如下步骤：

[0005] 步骤一、将用户个人信息与车辆信息录入云端数据分析中心，每个用户建立一个数据库，并设置密码；通过车辆上强制安装的汽车诊断第二代系统接口，按照汽车诊断第二代系统协议读取车辆数据后，将车辆数据上传至云端数据分析中心中对应该车辆用户的数据库。

[0006] 步骤二、云端数据分析中心利用深度学习算法分析步骤一中得到的车辆数据并建立分类模型：

[0007] 1、对不平衡数据集进行处理，使用欠采样使数据集达到平衡。避免出现正常数据比例过大，异常数据比例过小的现象。

[0008] 2、对车载数据集建立分类模型，辅助路况分析与行为分析。将数据贴上正常与异常两个标签，然后按相同比例分为两部分：去除标签的数据集和保留标签数据集。

[0009] 采用基于k-means算法与高斯混合模型相结合的异常检测机制对无标签数据集进行聚类分析，采用基于k-means算法的异常检测机制对有标签数据集进行同样聚类分析。从汽车诊断第二代系统接口上收集到的数据视为一系列的向量，代表高维空间的一系列特征点。K-means算法对特征点进行分簇，分为异常和正常两簇。对于单个数据点的车辆行驶状态，观察它相对于哪个簇中心的欧几里得距离更近，然后比较其他数据点到簇中心的距离方差，即可判断该点是异常状态还是正常状态。无标签的数据集还需要在后期加入高斯混合模型来计算计算数据被分在不同类中的概率，进而实现数据点的细分类，获得更为精确的结果，避免过拟合的产生。

[0010] 3、对实时数据集建立路况预测模型，为预警提供技术支持。使用车辆行驶中出现的异常数据点来刻画道路的整体状态，利用自编码器进行异常信息的检测，并且用BP算法进行模型训练。对驾驶数据进行分析，得到路况模型，避开了实地收集路况的环节。自编码器中的模型有压缩数据和恢复数据的作用，压缩和恢复主要针对隐藏层中的特征数据。被提取出的特征数据将经过sigmoid函数，以实现车辆数据的离散化，进而满足了K-means算法的使用条件。通过BP神经网络赋予每个属性权值，以克服传统K-means算法各属性等权的缺点。自编码器对驾驶员驾驶习惯的再次建模可以给所有用户匹配个性化路况预警，有针对性地改良不良驾驶习惯，大幅度提高个性智能化预警的水平。

[0011] 步骤三、云端数据分析中心将步骤二中分析完成的数据存储至对应车辆用户的数据库中，并将分析结果发送至用户移动端，查看时需输入步骤一中设置的密码，确保数据安全性。移动端根据数据，告知用户当前路况，提示危险路段和拥塞路段，同时纠正用户不良驾驶行为，实现实时预测。

[0012] 步骤四、建立度量指标。量化模型的性能，检验模型的正确性、稳定性和可依赖性，进而辅助后续的改进。

[0013] 采用无监督学习路况分析模型，通过无标签数据验证模型的准确性。

[0014] 或使用聚类结果的簇划分。令簇划分为：

[0015] C＝{C1,C2,...,Ck}， dcen(Ci,Cj)＝dist(μi,μj)，avg(C)代表簇内样本间的平均距离，dcen(Ci,Cj)对应于簇Ci和簇Cj的质心距离，dist()用于计算两个样本之间的距离，μ代表簇的质心。采用DBI指数对K-means的聚类结果进行内部评价见式(1)：

[0016]

[0017] DBI指数越小，聚类结果越好。设现有数据集D＝{x1,x2,......xm}，簇划分C＝{c1,c2,........ck}，参考模型簇划分C*＝{c*1,c*2,......c*s}，令λ与λ*分别表示C和C*对应的簇标记向量。考虑所有样本对在两个组划分中的归属情况分为类别a、b、c、d见式⑵：

[0018] a＝|SS|,SS＝{(xi,xj)|λi＝λj,λi*＝λj*,i＜j}

[0019] b＝|SD|,SD＝{(xi,xj)|λi＝λj,λi*≠λj*,i＜j}

[0020] c＝|DS|,DS＝{(xi,xj)|λi≠λj,λi*＝λj*,i＜j}

[0021] d＝|DD|,DD＝{(xi,xj)|λi≠λj,λi*≠λj*,i＜j} ⑵；

[0022] 然后采用Rand指数评价模型，m为总类别数，评价结果在0～1之间，结果越高说明聚类效果准确性越高。

[0023] 所述的准确性评估指标采用F2系数评估方法，引入精确率和召回率两个指标。

[0024] 精确率P TP为正类判定为正类的数量，FP为负类判定为正类。

[0025] 召回率 TP为正类判定为正类的数量，Fn为正类判定为负类的数量。使用F2分数对精确率和召回率进行评估，同时报告混淆矩阵，研究错误的分布情况。

[0026] 本发明数据获取方便，针对OBD硬件(车载诊断系统)进行开发，拥有提供数据的设备。该设备在市场上的绝大部分车辆都有安装，不用担心数据收集的问题。采用多种神经网络和无监督深度学习算法，如对不平衡数据集进行欠采样，基于k-means算法的异常检测机制，自编码器，前馈神经网络等，减小测量误差。使用无监督的学习方法来训练深度神经网络，在这种学习方法中，性质类似的数据点会自动聚焦到一起。所有数据只有特征向量没有标签，但是可以发现这些数据呈现出聚群的结构，进而获得更准确的簇划分。实地路况分析通常需要耗费大量的人力物力，而我们的核心算法跳过了最繁琐的实地路况分析，极大地减少了部署开支。我们采用基于k-means算法的异常检测机制，对驾驶数据进行分析，得到路况模型，十分巧妙地避开了实地收集路况的环节。推测路况而不是耗费大量资金去收集路况信息，这既降低了项目的部署难度，也节约了资金消耗。具有智能分析和提醒功能，有限避免不良驾驶行为，躲避拥塞道路，预警事故多发地段。

实施方案

[0029] 一种基于车载诊断系统数据的路况分析预警方法，首先通过读取车辆上安装的OBD样本数据来获取车辆行驶的数据(速率、行驶方向、加速度、位置等)，监听异常行为(急刹车、急速行驶等)，然后上传到云端数据分析中心利用多种深度学习算法分析并学习用户的驾驶行为，对样本数据进行多次建模和评估，以判断当前道路的拥塞状况、是否容易产生急刹车等危险行为。在获取并分析了足够多的数据之后，系统会根据用户的驾驶行为二次建模，告知用户当前路况，在易堵车的路段和事故高发路段提前警示用户，从而大幅度降低堵车概率和事故发生概率。

[0030] 如图1所示，一种基于车载诊断系统数据的路况分析预警方法，具体包括如下步骤：

[0031] 步骤一、将用户个人信息与车辆信息录入云端数据分析中心，每个用户建立一个数据库，并设置密码；通过车辆上强制安装的汽车诊断第二代系统(OBD2,the Second On—Board Diagnostics)接口，按照汽车诊断第二代系统协议读取车辆数据后，将车辆数据上传至云端数据分析中心中对应该车辆用户的数据库。

[0032] 步骤二、云端数据分析中心利用深度学习算法分析步骤一中得到的车辆数据并建立分类模型，如图2所示：

[0033] 1、对不平衡数据集进行处理，使用欠采样使数据集达到平衡。避免出现正常数据比例过大，异常数据比例过小的现象。

[0034] 2、对车载数据集建立分类模型，辅助路况分析与行为分析。将数据贴上正常与异常两个标签，然后按相同比例分为两部分：去除标签的数据集和保留标签数据集。

[0035] 采用基于k-means算法与高斯混合模型相结合的异常检测机制对无标签数据集进行聚类分析，采用基于k-means算法的异常检测机制对有标签数据集进行同样聚类分析。从汽车诊断第二代系统接口上收集到的数据视为一系列的向量，代表高维空间的一系列特征点。K-means算法对特征点进行分簇，分为异常和正常两簇。对于单个数据点的车辆行驶状态，观察它相对于哪个簇中心的欧几里得距离更近，然后比较其他数据点到簇中心的距离方差，即可判断该点是异常状态还是正常状态。无标签的数据集还需要在后期加入高斯混合模型来计算计算数据被分在不同类中的概率，进而实现数据点的细分类，获得更为精确的结果，避免过拟合的产生。

[0036] 3、对实时数据集建立路况预测模型，为预警提供技术支持。使用车辆行驶中出现的异常数据点来刻画道路的整体状态，利用自编码器进行异常信息的检测，并且用BP算法进行模型训练。自编码器中的模型有压缩数据和恢复数据的作用，压缩和恢复主要针对隐藏层中的特征数据。被提取出的特征数据将经过sigmoid函数，以实现车辆数据的离散化，进而满足了K-means算法的使用条件。通过BP神经网络赋予每个属性权值，以克服传统K-means算法各属性等权的缺点。自编码器对驾驶员驾驶习惯的再次建模可以给所有用户匹配个性化路况预警，有针对性地改良不良驾驶习惯，大幅度提高个性智能化预警的水平。

[0037] 步骤三、云端数据分析中心将步骤二中分析完成的数据存储至对应车辆用户的数据库中，并将分析结果发送至用户移动端，查看时需输入步骤一中设置的密码，确保数据安全性。移动端根据数据告知用户当前路况，提示危险路段和拥塞路段，同时纠正用户不良驾驶行为，实现实时预测。

[0038] 步骤四、建立度量指标。量化模型的性能，检验模型的正确性、稳定性和可依赖性，进而辅助后续的改进。

[0039] 采用将带标签的数据去除标签后重新投入路况分析模型，将结果与原标签数据对比，验证模型的准确性。

[0040] 或是使用聚类结果的簇划分。令簇划分为：C＝{C1,C2,...,Ck}，定义dcen(Ci,Cj)＝dist(μi,μj)，avg(C)代表簇内样本间的平均距离，dcen(Ci,Cj)对应于簇Ci和簇Cj的质心距离，dist()用于计算两个样本之间的距离，μ代表簇的质心。采用DBI指数对K-means的聚类结果进行内部评价见式(1)：

[0041]

[0042] DBI指数越小，聚类结果越好。通过收集用户体反馈数据或者其他途径得到了比较权威的参考模型，就可以考虑性能度量的“外部指标”了：设现有数据集D＝{x1,x2,......xm}，簇划分C＝{c1,c2,........ck}，参考模型簇划分C*＝{c*1,c*2,......c*s}，令λ与λ*分别表示C和C*对应的簇标记向量。考虑所有样本对在两个组划分中的归属情况分为类别a、b、c、d见式⑵：

[0043] a＝|SS|,SS＝{(xi,xj)|λi＝λj,λi*＝λj*,i＜j}

[0044] b＝|SD|,SD＝{(xi,xj)|λi＝λj,λi*≠λj*,i＜j}

[0045] c＝|DS|,DS＝{(xi,xj)|λi≠λj,λi*＝λj*,i＜j}

[0046] d＝|DD|,DD＝{(xi,xj)|λi≠λj,λi*≠λj*,i＜j} ⑵；

[0047] 然后采用Rand指数评价模型，m为总类别数，评价结果在0～1之间，结果越高说明聚类效果准确性越高。

[0048] 通常用于检测正常类的简单模型将会检测出超过99％的准确率，所以不能用简单的准确率作为评估指标，而是采用F2系数评估方法，引入精确率和召回率两个指标。在机器学习领域当中的python模块Sklearn的资料中显示：理想的系统兼具高精确率与高召回率，在返回大量结果的同时，所有结果的标签也都是正确的。

[0049] 精确率P被定义为：正类判定为正类的数量TP除以正类判定为正类的数量加上负类判定为正类的数量FP的总和

[0050] 召回率R被定义为：正类判定为正类的数量TP除以正类判定为正类的数量加上正类判定为负类的数量Fn的总和，

[0051] 由于正类判定为负类的后果会比负类判定为正类的后果更加严重，因此高召回率，意味着误将负类判定为正类的概率会增加；同时，为避免负类判定为正类的概率太大，使用F2分数它兼顾精确率与召回率评估，更加重视召回率。同时报告混淆矩阵，研究错误的分布情况。

附图说明

[0027] 图1为本发明的设计框图；

[0028] 图2为本发明实施例中步骤二与步骤四的流程图。

1一种安全的车联网数据通信实现方法 2一种基于车联网的安全报警系统的实现方法 3一种基于车联网的道路安全信息实时通信方法 4一种基于物联网的夜间行车安全的智能型新能源汽车 5一种基于车联网V2X与视频融合的港区行车安全监测方法 6基于soeks的智能网联车多域信息安全机制协同方法