[0070] 下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
[0071] 在本发明的描述中,除非另有规定和限定,需要说明的是,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是机械连接或电连接,也可以是两个元件内部的连通,可以是直接相连,也可以通过中间媒介间接相连,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语的具体含义。
[0072] 本发明提供了一种道路事故热点成因分析和破坏度评估方法,其包括以下步骤:
[0073] 第一步:输入道路事故信息,所述道路事故信息的特征向量为As=[A,H,V],其中A为事故属性,包括事故发生的时间,地点,涉及车辆数以及道路状况描述,H为人员伤亡属性,包括事故伤亡人数和伤亡程度,V为事故涉及车辆属性,包括每一辆事故车的车辆型号和损伤程度。
[0074] 在本发明的一种优选实施方式中,可以采用STATs19数据库,STATs19数据库被认为是目前最为详细的交通数据库,并被广泛应用于道路安全评价,STATs19数据分为碰撞、人员伤亡和车辆三大类,总共包含82个变量。本发明可以运用此数据库详细说明道路事故热点成因分析和复合安全性能指数构造方法。
[0075] 第二步:构造最小邻居图,对所述最小邻居图中的所有事故点进行聚类得到事故热点。
[0076] 在本实施方式中,最小邻居图构造方法为:
[0077] S211,得到目标区域每个事故点对应的自然最近领域NNr(i)以及每个事故点的自然最近邻居数nb(i),从而得到整个目标区域所有事故点自然最近邻居数的平均值supk,本发明中,计算以上三个数值的方法采用现有的方法。
[0078] S212,将目标区域每个事故点的min(nb(i),supk)个,即nb(i),supk中最少的自然最近邻域连接起来,构成最小自然邻域图,即最小邻居图。
[0079] 对最小邻居图中的所有事故点进行聚类得到事故热点包括如下步骤:
[0080] S221,现有方法中直接对最小邻居图中的所有点进行聚类得到事故热点,该算法能够解释道路网络的关系,却不能很好的划分热点的边界,容易造成一个簇里面包含多个事故热点的情况,这会造成事故热点成因分析和破坏度评估结果出现较大的误差。本发明对现有方法进行改进,首先将最小邻居图中的事故点分为两类,拥有自然最邻近的事故点以及离群事故点,并依次将两种事故点归入集合TN和集合TO,具体的流程为:
[0081]
[0082] 其中,FLAG-INVISITIED和FLAG-VISITED是标记,分别表示该点未被搜索和已被搜索。
[0083] S222,对最小邻居图中未被搜索的顶点进行搜索,确定在没有被搜索的事故点中找出一个最近邻居数最多的事故点作为簇的起始搜索点,即簇中心点。在本实施方式中,搜索过的点会被标记为已搜索,未搜索的点被标记为未搜索。
[0084] S223,定义THLD为聚类中心的最长距离阈值,对集合TN中的每一个事故点进行聚类,如果集合TN中的一个事故点与某个簇中心的距离小于THLD,则将该点归入该簇中心所在的簇中,并将该顶点标记为已搜索,获得初始聚类结果,具体算法为:
[0085]
[0086] S224,设定最短距离阈值THSD,计算集合TO中的点与所有簇中心的距离,在不大于最短距离阈值THSD的距离中,选取最小的距离并则将其归入得到最小距离的簇中,以此对TO中的每个点进行聚类,得到最终聚类结果,实现事故热点的发现。具体算法为:
[0087]
[0088] 表1.程序中用到的函数解释。
[0089]函数名称 含义解释
Lable() 每个事故的标记
Size() 数据集中事故总数
TN 存在自然最邻近点的集合
Unique() 删除TN中重复的点
[0090]TO 不存在自然最邻近的点的集合,即离群点集合
Find(max(nb())) 决定事故点是否拥有最大的自然最邻近点数目
Visited() 事故点已经聚类的标志
DTHU() 簇
DCR() 事故点与簇中心的距离
INN() 事故点的自然最邻近点
Nb() 事故点拥有自然最邻近点的数目
Mindis() 离群点与各簇中心的最小距离
[0091] 本发明对事故点进行分类,并运用阈值THLD和THSD分别对两类点进行聚类。该聚类算法相比于现有方法,能够更好的反映道路网络,实现热点边界的区分,能够为事故成因分析和破坏度评估提供更精确的热点信息。
[0092] 第三步:道路和街道的事故热点形成原因包括道路物理成因Croad和区域社会成因Csociety。通过聚类算法得到的道路事故热点中的事故数据将反应这两种成因的综合作用,因此需要将成因从现有数据中提取出来。对第二步中得到的事故热点的形成原因进行分析,判断每个事故热点的道路物理成因Croad和区域社会成因Csociety。具体包括如下步骤:
[0093] S31,道路物理成因Croad和区域社会成因Csociety由事故热点的特征向量[Xi]与特征权重[CRi]和[CSi]的内积组成:
[0094] Croad=[Xi]·[CRi]T,i=1…p,
[0095] Csociety=[Xi]·[CSi]T,i=1…p,
[0096] 其中,p为正整数。
[0097] S32,具体主成分分析过程为:设F1表示原变量的第一个线性组合所形成的主成分指标,即F1=a11X1+a21X2+…+ap1Xp,在所有的线性组合中选取的F1所含的信息量最大,故称F1为第一主成分,如果第一主成分不足以代表原来p个指标的信息,再考虑选取第二个主成分指标F2,为有效地反映原信息,F2与F1要保持独立、不相关,依此类推构造出的F1、F2……Fm为原变量指标X1、X2……Xp第一、第二、……、第m个主成分,F1、F2……Fm(m≤p)为构造的新变量综合指标,即原变量指标的第一、第二、……、第m个主成分:
[0098]
[0099] Fi与Fj互不相关,即Cov(Fi,Fj)=0,并有Var(Fi)=ai'Σai,Σ为事故热点数据矩阵X的协方差阵Σ=(sij)p×p,其中
[0100]
[0101] 其中, 和 分别为每行和每列的平均值,xki和xkj为矩阵中的点,n为矩阵X中点的数目;
[0102] 求出Σ的特征值λi及相应的正交化单位特征向量ai,
[0103] Σ的前m个较大的特征值λ1≥λ2≥…≥λm>0,就是前m个主成分对应的方差,λi对应的单位特征向量ai就是主成分Fi的关于原变量的系数,则原变量的第i个主成分Fi为:
[0104] Fi=ai'X,
[0105] 选择主成分,最终要选择几个主成分,即F1、F2……Fm中m的确定是通过方差累计贡献率G(m)来确定:
[0106]
[0107] 当累计贡献率大于门限值时,就认为能足够反映原来变量的信息了,对应的m就是抽取的前m个主成分;
[0108] S33,为了简化计算和提高评价效率,将对每一个道路事故热点进行主成分分析,用得到的F1、F2……Fm(m≤p)替换X1、Xp……Xp,其中缺省数据项用零值替代。
[0109] 分别得到该事故热点的道路成因和社会成因:
[0110] Croad=[Fi]·[CRi]T,i=1…p
[0111] Csociety=[Fi]·[CSi]T,i=1…p。
[0112] 特征权重[CRi]和[CSi]利用区域数据集对Croad和Csociety进行参数拟合,具体过程为:
[0113] 将每一个聚合的事故热点中的事故分为涉及行人的事故和不涉及行人的事故,再分别对两种事故进行主成分分析,将事故发生区域的社会属性(比如犯罪率、恶性犯罪率、受教育程度和事故涉及人员的年龄)归入事故属性中,与其他事故信息一起进行主成分分析。
[0114] 对涉及行人的事故进行主成分分析后得到的Fi将替换Csociety中的Xi,由于主成分的方差贡献率用来反映信息量的大小,所以CSi为该主成分特征值与所有主成分特征值之和的比值,即:
[0115]
[0116]
[0117] 对不涉及行人的事故进行主成分分析后得到的Fi将替换Croad中的Xi,CRi为该主成分的特征值与所有主成分特征值之和的比值。
[0118] 第四步:交通控制与导航决策关心的是交通事故可能导致的拥塞信息,即时间延误,因此,本发明用一个时间参量来表示区域破坏度,通过计算事故热点的区域破坏度并传输给控制中心进行交通管理和/或者发送给驾驶者进行驾驶指导,寻找最安全可靠的路线,其中,区域破坏度的计算方法为:
[0119] S41,计算事故破坏度,计算每个事故的安全性能指数CSPI来间接反映每个事故i的破坏度CSPI(i), 其中c为常数c=1+e2,e为欧拉常数,ai和bi为第i个事故的六个安全指标间的关联关系,六个指标包括碰撞次数、涉及车辆数、死亡人数、严重受伤人数、无死亡和严重受伤人员的碰撞次数以及无死亡和严重受伤人员碰撞涉及车辆数,根据每个事故的事故信息,可以确定每个事故六个指标的具体数值,最终计算得到归一化的CSPI值;
[0120] S42,计算事故重要度,所述事故重要度由事故位置重要度和事故时间重要度组成,
[0121] a.事故位置重要度
[0122] 由区域发现聚类结果可获得事故热点的中心位置,据此可以得到事故i与热点中心之间的距离di,定义di越大,对事故热点的影响度越低,即事故位置重要度越低,假设事故热点的最大覆盖半径为dmax,得到归一化的事故位置重要度:
[0123] Wposition=di/dmax,
[0124] b.事故时间重要度
[0125] 由事故发生时间可获得时间重要度,事故发生时间区域车辆密度越大,事故重要度越高,选取车流峰值时间点和车流量最低时间点,可得归一化时间重要度:
[0126]
[0127] 在本发明的一种优选实施方式中,根据国家法定作息时间规定可知车流峰值时间为早8点,晚18点,与这两个时间距离差值越大,则可认为时间重要度越低,以凌晨1点为车流量最低时间点,可得归一化时间重要度:
[0128]
[0129] 得到事故i的事故重要度Wdelay=Wposition+Wtime。
[0130] S43,计算区域破坏度,综合每个事故的破坏度,得到区域平均破坏度:
[0131]
[0132] 通过区域平均破坏度的值来反映事故热点的区域破坏度大小, 的值越大,则说明该事故热点对区域的破坏度越大。对于破坏度较大的区域,可以通过增设交通设施以及加强该区域的交通管理来提高该区域的安全度。
[0133] 本发明的聚类算法能够有效地减少人为主观因素的影响,簇的数量取决于自然的邻居关系,具有一定的连贯性,同时该方法不仅能够聚合任意不规则形状的数据区域,还能与道路路段相结合,将交叉路段和非交叉路段分离,完全的说明道路网络特性,有利于热点的评估。
[0134] 在热点成因分析方面,本发明运用主成分分析法,去除事故属性之间的关联性,并运用数据集分析得到各成分的权值,可以找出最能反映事故形成原因的成分,最终分别得到道路成因和社会成因。如果道路成因较严重,则可以对该区域进行道路改进或者增设交通设施;如果社会成因较为严重,则可以结合车辆导航避开该路段,选择其他更为安全可靠的路线。
[0135] 最后通过区域平均破坏度的计算来反映事故热点的区域破坏度,有效地简化了计算。同时结合热点成因,对高破坏度的区域进行道路改进或者车辆导航。
[0136] 在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
[0137] 尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。