[0037] 下面结合具体实施例对本发明做进一步的说明,但本发明的保护范围并不限于此。
[0038] 如图1所示,一种基于隐马尔可夫模型的行车危险度预测方法,包括步骤:
[0039] 步骤一:基于车辆运行特征通过聚类分析方法对行车风险状态进行划分;
[0040] 通过k-means聚类分析方法对行车风险状态进行划分实现方法如下:
[0041] 步骤1:获取自然驾驶数据库中的事故数据样本及邻近事故数据样本共N组{X1,X2,...,XN},其中每个样本Xi(i=1,2,...,N)为时长为Ti时间序列,包括如下车辆、驾驶员、道路和环境信息共16个变量维度:
[0042] ①车辆行驶信息:本车速度x1,本车加速度x2,本车与前车之间距离x3,本车与前车之间的距离变化率x4;
[0043] ②驾驶员信息:(邻近)事故发生前驾驶员操纵行为x5,驾驶员注意力区域x6,驾驶员非驾驶任务数目x7,驾驶员非驾驶任务等级x8,驾驶员方向盘使用情况x9;
[0044] ③道路信息:车道数x10,交通流密度x11,道路线形x12,道路纵坡x13;
[0045] ④环境信息:照明情况x14,天气状况x15,路面状况x16。
[0046] 步骤2:采用滚动时间窗的方式对时间序列数据样本进行分割,滚动时间窗长度为w,时间窗滚动间隔δ为自然驾驶数据库中采样间隔的整数倍,为提高预测模型的实时性和准确性,滚动时间窗参数的推荐值为w=5秒,δ=1秒;对每个样本Xi(i=1,2,...,N)时间序列进行时间窗划分,获得共 个时间窗;对每个样本Xi(i=1,2,...,N)分别计算每个滚动时间窗内车辆行驶信息变量x1-x4的期望值E和方差值σ,得到共N′组统计值向量,每组统计值向量包括[E(x1),σ(x1),E(x2),σ(x2),E(x3),σ(x3),E(x4),σ(x4)]共8个维度;
[0047] 步骤3:对步骤2中得到的具有8个维度的N′组统计值向量进行k-means聚类分析,推荐类别数K=5,计算每个类别中所有样本的平均碰撞时间TTC(可由x3和x4的比值计算获取)及平均车间时间THW(可由x3和x1的比值计算获取),对TTC和THW大小进行排序,得到行车过程的K=5个等级的风险类别,分别定义为S1=安全状态,S2=低风险状态,S3=中风险状态,S4=高风险状态,S5=事故状态。
[0048] 步骤二:对于不同的行车风险状态,通过多项logistic模型估计驾驶员行为和周围交通环境特征对行车风险状态之间转移概率的影响;
[0049] 驾驶员行为和周围交通环境(道路和环境)特征对行车风险状态之间转移概率的影响估计方法如下:
[0050] 与步骤一中的滚动时间窗定义一致,在每一个样本时间序列中,以时刻t时间窗的起始时刻t′观测得到的驾驶员、道路和环境信息变量x5-x16为自变量,自变量表示为Zt=[x5t′,x6t′,...,x16t′],以下一个时间窗t+1的行车风险类别qt+1为因变量,最后得到共组自变量-因变量回归样本(Nr为回归样本的个数),建立驾驶员行为和周围交通环境特征与行车风险状态类别的多项logistic回归模型如下:
[0051]
[0052] 其中:aij(Zt)=P(qt+1=Sj|qt=Si)表示风险状态由时刻t的Si状态转移至时刻t+1的Sj状态的概率,即状态间转移概率,其大小与时刻t时间窗内的自变量Zt有关, 表示属于风险类别i的自变量样本, 表示在风险类别i条件下多项logistic回归中第j风险类别项的回归系数, 表示在风险类别i条件下多项logistic回归中第k风险类别项的回归系数,K=5为步骤一划分的风险类别数。
[0053] 步骤三:以步骤一得到的风险状态为隐含状态,以实际观测的车辆运动变量为状态输出值,以步骤二得到的多项logistic模型参数为状态转移概率矩阵的参数初始值,建立反映行车状态演变规律的隐马尔可夫链模型(图2);
[0054] 建立反映行车状态演变规律的隐马尔可夫链模型的方法为:
[0055] 步骤1:以步骤一得到的风险状态为隐含状态,以实际观测的车辆运动变量O=(o1,o2,...,oT)为状态输出值(其中每一个观测值 是时刻t时间窗的起始时刻t′观测得到的由步骤一中x1-x4组成的d=4维车辆行驶信息变量向量[x1t′,x2t′,x3t′,x4t′],t=1…T),定义具有连续观测值的基于高斯混合的隐马尔可夫链模型λ={Π,A,C,M,U},其中Π={πi},i=1,2,...,K为隐含状态{S1,S2,...,SK}(即由步骤一划分的K=5个行车风险状态)的概率分布,其中,A={aij(Zt)},i,j=1,2,...,5为状态转移概率矩阵,其中Zt=[x5t′,x6t′,…,x16t′]与步骤二中定义一致,x5t′,x6t′,...,x16t′为时刻t时间窗的起始时刻t′观测得到的驾驶员、道路和环境信息变量,c={cjm}为高斯混合系数(权重),其中j表示风险状态等级,cjm是风险状态Sj下第m个高斯分布的权值,m=1,...,nj表示风险状态Sj下的高斯混合数,M={μjm}表示高斯混合均值向量,U={∑jm}表示高斯混合协方差矩阵,μjm和∑jm分别是风险状态Sj下第m个高斯分布的均值向量和协方差矩阵;
[0056] 步骤2:以步骤二得到的多项logistic模型参数作为状态转移概率矩阵参数的初始值,其余初始模型参数根据实际样本统计特征确定,通过Baum-Welch算法迭代得到模型λ参数的最优解;考虑驾驶员、道路和环境信息后修正的状态转移概率矩阵参数A={aij(Zt)}的迭代方法如下,其余参数迭代方法与标准Baum-Welch算法相同,在此不予冗述;
[0057] a)根据前向和后向算法,得到在给定状态输出值序列O=(o1,o2,…,oT)和模型参数λ的条件下,模型时刻t处于Si状态且时刻t+1处于Sj状态的联合概率为:
[0058]
[0059] 其中:aij(Zt)为步骤二中获取的与时刻t时间窗内行车风险类别、驾驶员、道路和环境信息相关的基于多项logistic回归模型的状态转移概率,为提高算法收敛速度,可由项代替时变的aij(Zt)项,其中 表示风险类别i下所有观测样本中多项logistic回归自变量向量的均值;bj(ot+1)表示风险状态j下观测到ot+1的概率:
[0060]
[0061] 其中;N(ot+1,μjm,∑jm)为第m个高斯分布下观测值ot+1的概率,αt(i)为前向变量,表示给定模型参数λ的条件下,从初始时刻到时刻t的部分观测值序列o1,o2,...,ot和时刻t模型处于状态Si的联合概率,即:
[0062] αt(i)=P(o1,o2,…ot,qt=Si|λ) (4)
[0063] αt(i)的大小可由前向算法递推过程计算获取;βt+1(j)为后向变量,表示给定模型参数λ和时刻t+1模型处于状态Sj的条件下,从时刻t+2时刻到最终时刻模型的部分观测值序列(ot+2,ot+3,...,oT)的联合概率,即:
[0064] βt+1(j)=P(ot+2,ot+3,...,oT|,qt+1=Sj,λ) (5)
[0065] βt+1(j)的大小可由后向算法递推过程计算获取;
[0066] b)根据前向和后向算法,得到在给定观测值序列O=(o1,o2,...,oT)和模型参数λ的条件下,模型时刻t处于Si状态的概率为:
[0067]
[0068] c)对ξt(i,j)按时间维度进行求和获得从状态Si转移至状态Sj的期望次数为同理对γt(i)按时间维度进行求和获得从状态Si发生状态转移的期望次数为
则从状态Si转移至状态Sj的期望概率为:
[0069]
[0070] 同时由步骤二中多项logistic模型估计的转移概率 为:
[0071]
[0072] 其中:定义狄拉克函数 表示风险类别i下所有观测样本中多项logistic回归自变量向量的均值;
[0073] 则对于风险状态Si,其下一时刻转移至各风险状态的概率比值为:
[0074]
[0075] 根据前向算法和后向算法的递推结果 更新多项logistic模型参数,即令 等于 等价于令以下等式成立:
[0076]
[0077] 其中: 表示修正后的模型参数,公式(10)两边同时取对数:
[0078]
[0079] 假设每个类别项参数向量 内的各元素以相同比例 进行调整修正,则修正后的回归系数应满足如下迭代等式:
[0080]
[0081] 根据多项logistic模型效用值的相对性性质可令 进而迭代求解式(12),获得修正后的第k项回归系数
[0082] d)不断迭代更新模型参数 及其他模型参数(按Baum-Welch标准算法),直到连续两次重估的模型参数对应的概率 的增量小于给定的收敛阈值,最终得到的模型参
数 即为给定观测样本下最优的隐马尔可夫模型,相应的由模型参数
即为最终求得的可以反映驾驶员、道路和环境特征的行车风险状态转移概率矩阵。
[0083] 步骤四:实时获取步骤一中列出的车辆、驾驶员、道路和环境信息数据,并以步骤三得到的反映行车状态演变规律的隐马尔可夫链模型为基础,实时预测未来风险状态;
[0084] 实时预测未来风险状态的方法为:
[0085] 步骤1:在车联网环境下,信息采集设备实时采集步骤一中列出的车辆、驾驶员、道路和环境信息变量x1-x16,将当前时刻设为第T个时间窗的起始时刻,结合由存储设备存储的前T-1个滚动时间窗起始时刻的车辆行驶信息变量向量(即步骤三定义的隐马尔可夫实际观测的车辆运动变量ot=[x1t′,x2t′,x3t′,x4t′],其中t′为时刻t时间窗的起始时刻)和驾驶员、道路和环境信息变量向量(即步骤二定义的多项logistic回归模型自变量Zt=[x5t′,x6t′,...,x16t′],其中t′为时刻t时间窗的起始时刻),获得时长均为T的观测样本O=(o1,o2,...,oT)和Z=(Z1,Z2,...,ZT);
[0086] 步骤2:根据步骤三得到的隐马尔可夫模型 以及步骤1中的观测样本O=(o1,o2,...,oT)和Z=(Z1,Z2,...,ZT),通过Viterbi算法获得与观测样本O对应的最优隐含状态序列为Q=(q1,q2,...,qT),则预测得到以当前时刻为起始时刻的第T个时间窗内的行车风险状态为qT,即从当前时刻开始至未来w(滚动时间窗时长)时长内的行车风险状态预测为qT;
[0087] 步骤3:根据步骤2得到的未来时间窗时长w内行车风险状态为qT,制定相应的车辆预警策略:当qT={S1,S2}时,车辆处于低风险状态,此时驾驶员无需采取任何处理措施;qT=S3时,车辆处于临近碰撞风险状态,此时驾驶员应采取减速或转向避让措施;当qT={S4,S5},两车处于紧急碰撞风险状态,此时驾驶员或车辆应采取紧急制动或紧急转向避让措施。以上三级策略分别对应的风险状态最终取值应由驾驶员行为特性和用户接受度特性决定,可通过设计不同车速和车头时距条件下的同车道双车跟车实验最终确定。
[0088] 以上所述对本发明进行了简单说明,并不受上述工作范围限值,只要采取本发明思路和工作方法进行简单修改运用到其他设备,或在不改变本发明主要构思原理下做出改进和润饰的等行为,均在本发明的保护范围之内。