[0030] 基于K‑means模型的双视点立体视频融合方法,具体是:
[0031] 步骤(1)对左视点深度图和右视点深度图进行预处理,得到左视点深度图像和右视点深度图像;预处理包括噪声去除处理和图像平滑处理;其中,噪声去除处理是选取残差神经网络进行处理,图像平滑处理是对噪声去除处理后图像进行开运算处理。
[0032] 步骤(2)分别对左视点深度图像和右视点深度图像运用K‑means方法进行分割,分为前景区域深度图像和背景区域深度图像,分别对前景区域深度图像和背景区域深度图像进行三维投射运算(3d‑warping),得到左视点的前景绘制图像和背景绘制图像、右视点的前景绘制图像和背景绘制图像;具体是:
[0033] 通过K‑means方法对输入的左视点深度图像进行聚类运算并进行分割,K‑means方法为基于数据统计的聚类方法,将一组数据中相似度较高的数据聚集成一类,然后将数据分为k组集群,使集群之间的距离尽可能达到最大,方法是:
[0034] 输入深度图像的像素点像素值分布概率为{p0,p1,…,p255},pi为像素值为i的像素点的分布概率,i=0,1,…,255;
[0035] 设置k个阈值{τ1,τ2,…,τk}输入到K‑means运算中,计算每个像素值与每个阈值间的最小欧式距离 最小欧式距离对应的阈值作为第一次填充值;同时输出新的k个阈值{τ1′,τ2′,…,τk′}作为下一次迭代运算的输入;
[0036] 每经过一次迭代,选取的阈值τj发生改变;将τj调整为集合Cj内所有元素的统计平均值,Cj为在τj至τj+1之间的像素集合: x为Cj中的像素;
[0037] 前景区域掩模图 前景区域深度图像FG=Depth×MODFG;
[0038] 背景区域掩模图 背景区域深度图像BG=Depth×MODBG;
[0039] K(i,j)表示填充结果像素值,对应的像素坐标为(i,j),Depth表示深度图像。
[0040] 对前景区域深度图像和背景区域深度图像分别进行三维投射运算,获得前景区域绘制深度图像和背景区域绘制深度图像;三维投射运算方法是:
[0041] 其中Mv和M分别表示虚拟视点和原视点的坐标向量;Iv和I分别表示虚拟视点和原视点的相机内部参数矩阵,只与相机的内部性能相关;Rv和R分别表示虚拟视点和原视点的相机外部旋转矩阵,大小为3×3,表示相机在三维空间中旋转角度;Tv和T分别表示虚拟视点和原视点的相机平移向量,大小为3×1,表示相机在三维空间中的平移量。
[0042] 以大小为4×1的原视点坐标向量M为例,M=[x,y,C,D(x,y)]T;T表示转置,x为M的横坐标,y为M的纵坐标,C表示常数系数,本实施例中C=1,D(x,y)为M的深度值,深度值反映图像中景物距离相机的距离,通过深度图像信息可计算得到深度值:
[0043] 其中,Depth(x,y)表示深度图(x,y)处的像素值,MAXZ表示深度图中可取的最大值,本实施例中MAXZ=255;Zmin和Zmax分别表示最小实际深度和最大实际深度,即分别表示拍摄物体据相机最近和最远的距离。
[0044] 分别将前景区域绘制深度图像和背景区域绘制深度图像与原视点的彩色图像分别进行三维投射运算,获得左视点的前景绘制图像和背景绘制图像;
[0045] 对右视点深度图像进行相同操作,获得右视点的前景绘制图像和背景绘制图像。
[0046] 步骤(3)分别将左视点和右视点的前景绘制图像和背景绘制图像进行融合:以前景绘制图像为蓝本,用背景绘制图像填充前景绘制图像的空缺区域;得到左视点绘制图像和右视点绘制图像;将填充后的左视点绘制图像和右视点绘制图像进行图像融合,获得虚拟视点绘制图像,图像中坐标为(x,y)的像素点的像素值Iblend(x,y)为:
[0047] 其中,l(x,y)∈⊙和r(x,y)∈⊙分别表示左视点和右视点在坐标(x,y)处为空洞区域,l(x,y)和 分别表示左视点和右视点在坐标(x,y)处不是空洞区域;IL(x,y)和IR(x,y)分别表示左视点绘制图像和右视点绘制图像在坐标(x,y)处的像素值;
[0048] 左视点权重 右视点权重 RL和RR分别为左视点和右视点的空间旋转矩阵,TL和TR分别为左视点和右视点的空间平移向量。
[0049] 步骤(4)将虚拟视点绘制图像的空洞区域根据空洞周围的像素信息进行加权填充,获得最终输出图像。空洞区域由所有Iblend(x,y)=0的像素构成,以每个Iblend(x,y)=0的像素的坐标(x,y)为中心5×5大小的区域作为填充区域Ω,填充区域Ω内除(x,y)外的其他24个像素点分为四组,每组六个像素。
[0050] 最终输出图像坐标为(x,y)的像素点的像素值
[0051] 第m组内非空洞像素均值 其中,H(x,y)表示坐标(x,y)处是否为空洞区域,如果是空洞区域则H(x,y)=0,如果不是空洞区域则H(x,y)=
1;加权像素总和 Y(x,y)为坐标(x,y)的优先级,W
为优先级权重, t为优先级Y(x,y)简写。