首页 > 专利 > 宁波大学 > 基于双目恰可觉察失真的多视点彩色视频快速编码方法专利详情

基于双目恰可觉察失真的多视点彩色视频快速编码方法 0 0

有效专利查看PDF

申请进展

基本信息

申请人信息

代理人信息

摘要

法律状态

权利要求

说明书

专利申请流程有哪些步骤？

申请

申请号：指国家知识产权局受理一件专利申请时给予该专利申请的一个标示号码。唯一性原则。

申请日：提出专利申请之日。

2013-07-30

申请公布

申请公布指发明专利申请经初步审查合格后，自申请日（或优先权日）起18个月期满时的公布或根据申请人的请求提前进行的公布。

申请公布号：专利申请过程中，在尚未取得专利授权之前，国家专利局《专利公报》公开专利时的编号。

申请公布日：申请公开的日期，即在专利公报上予以公开的日期。

2014-03-19

授权

授权指对发明专利申请经实质审查没有发现驳回理由，授予发明专利权；或对实用新型或外观设计专利申请经初步审查没有发现驳回理由，授予实用新型专利权或外观设计专利权。

2016-08-17

预估到期

发明专利权的期限为二十年，实用新型专利权期限为十年，外观设计专利权期限为十五年，均自申请日起计算。专利届满后法律终止保护。

2033-07-30

基本信息

有效性	有效专利	专利类型	发明专利
申请号	CN201310325370.8	申请日	2013-07-30
公开/公告号	CN103442226B	公开/公告日	2016-08-17
授权日	2016-08-17	预估到期日	2033-07-30
申请年	2013年	公开/公告年	2016年
缴费截止日
分类号	H04N19/00 、H04N13/00	主分类号	H04N19/00
是否联合申请	独立申请	文献类型号	B
独权数量	1	从权数量	4
权利要求数量	5	非专利引证数量	2
引用专利数量	3	被引证专利数量	0
非专利引证	1、Zhao Y,Chen Z Z,Zhu C.Binocular Just-Noticeable-Difference Model for Stereoscopic Image.《Signal Processing Letters IEEE》.2010,第18卷(第1期),19-22.; 2、连凤宗.JND模型及其在视频编码中的应用.《中国优秀硕士学位论文全文数据库(信息科技辑)》.2012,(第05期),I136-364.;
引用专利	WO2008136607A1、CN101404766A、CN102724525A	被引证专利
专利权维持	5	专利申请国编码	CN
专利事件		事务标签	公开、实质审查、授权

申请人信息

申请人	宁波大学	第一申请人	宁波大学
专利权人	宁波大学	当前专利权人	宁波大学
发明人	蒋刚毅、朱亚培、郁梅、邵枫、彭宗举、陈芬、王晓东、李福翠	第一发明人	蒋刚毅
地址	浙江省宁波市江北区风华路818号	邮编
申请人数量	1	发明人数量	8
申请人所在省	浙江省	申请人所在市	浙江省宁波市

代理人信息

代理机构

专利代理机构是经省专利管理局审核，国家知识产权局批准设立，可以接受委托人的委托，在委托权限范围内以委托人的名义办理专利申请或其他专利事务的服务机构。

宁波奥圣专利代理事务所

代理人

专利代理师是代理他人进行专利申请和办理其他专利事务，取得一定资格的人。

周珏

摘要

本发明公开了一种基于双目恰可觉察失真的多视点彩色视频快速编码方法，其首先利用左视点视频和右视点视频的视差信息确定右视点视频中的每帧右视点图像中的非边界区域内的每个宏块的双目恰可觉察失真值，其次根据双目恰可觉察失真值的大小提前终止宏块模式选择，该快速编码方法在不造成率失真性能下降的基础上，能够有效地提高多视点彩色视频的编码效率，节约的编码时间可达66.48%到71.90%，平均节约编码时间68.46%。

摘要附图
说明书附图：图1
说明书附图：图2a
说明书附图：图2b
说明书附图：图2c
说明书附图：图3a
说明书附图：图3b
说明书附图：图3c
说明书附图：图3d
说明书附图：图3e
说明书附图：图3f
说明书附图：图4a
说明书附图：图4b
说明书附图：图4c
说明书附图：图5a
说明书附图：图5b
说明书附图：图5c
说明书附图：图6
说明书附图：图5d

法律状态

序号	法律状态公告日	法律状态	法律状态信息
1	2016-08-17	授权
2	2014-03-19	实质审查的生效	IPC(主分类): H04N 7/26 专利申请号: 201310325370.8 申请日: 2013.07.30
3	2013-12-11	公开

权利要求

权利要求书是申请文件最核心的部分，是申请人向国家申请保护他的发明创造及划定保护范围的文件。

1.一种基于双目恰可觉察失真的多视点彩色视频快速编码方法，其特征在于包括以下步骤：
①将多视点彩色视频的左视点视频记为{CL(k)}，将多视点彩色视频的右视点视频记为{CR(k)}，其中，CL(k)表示{CL(k)}中的第k帧左视点图像，CR(k)表示{CR(k)}中的第k帧右视点图像，1≤k≤K，K表示左视点视频和右视点视频中包含的图像的帧数；
②将{CR(k)}中的每帧右视点图像划分为边界区域和非边界区域，其中，边界区域由右视点图像中的第一行宏块、最后一行宏块、第一列宏块和最后一列宏块构成；然后计算{CR(k)}中的每帧右视点图像中的非边界区域内的每个宏块的双目恰可觉察失真值，假设{CR(k)}中的第k帧右视点图像CR(k)中坐标位置为(i,j)的宏块属于{CR(k)}中的第k帧右视点图像CR(k)中的非边界区域，则将{CR(k)}中的第k帧右视点图像CR(k)中坐标位置为(i,j)的宏块的双目恰可觉察失真值记为其中，2≤i≤W/16-1,2≤j≤H/16-1，W表示{CL(k)}中的每帧左视点图像和{CR(k)}中的每帧右视点图像的宽度，H表示{CL(k)}中的每帧左视点图像和{CR(k)}中的每帧右视点图像的高度；
③在多视点视频编码校验模型JMVC上，采用HBP预测编码结构对{CL(k)}中的每帧左视点图像中的每个宏块和{CR(k)}中的每帧右视点图像中的每个宏块进行编码，在编码过程中为每个宏块选择最优宏块编码模式的过程为：
③-1、将当前待编码的宏块定义为当前宏块；
③-2、当当前宏块为{CL(k)}中的宏块时，编码器采用H.264的模式选择过程搜索SKIP、Inter16×16、Inter16×8、Inter8×16、Inter8×8、Inter8×8Frext、Intra16×16、Intra8×8和Intra4×4宏块编码模式，从这些宏块编码模式中选出率失真代价最小的宏块编码模式作为当前宏块的最优宏块编码模式进行编码；
当当前宏块为{CR(k)}中的宏块时，判断当前宏块属于边界区域还是属于非边界区域，如果当前宏块属于边界区域，则编码器采用H.264的模式选择过程搜索SKIP、Inter16×16、Inter16×8、Inter8×16、Inter8×8、Inter8×8Frext、Intra16×16、Intra8×8和Intra4×4宏块编码模式，从这些宏块编码模式中选出率失真代价最小的宏块编码模式作为当前宏块的最优宏块编码模式进行编码；如果当前宏块属于非边界区域，则再判断当前宏块的双目恰可觉察失真值是否大于或等于设定的判定阈值，如果是，则编码器采用H.264的模式选择过程搜索SKIP、Inter16×16、Inter16×8、Inter8×16、Inter8×8、Inter8×8Frext、Intra16×16、Intra8×8和Intra4×4宏块编码模式，从这些宏块编码模式中选出率失真代价最小的宏块编码模式作为当前宏块的最优宏块编码模式进行编码；否则，编码器采用H.264的模式选择过程只搜索SKIP和Inter16×16宏块编码模式，从这两种宏块编码模式中选出率失真代价最小的宏块编码模式作为当前宏块的最优宏块编码模式进行编码；
③-3、将下一个待编码的宏块作为当前宏块，然后返回步骤③-2继续执行，直至{CL(k)}中的每帧左视点图像中的每个宏块和{CR(k)}中的每帧右视点图像中的每个宏块均完成编码。

2.根据权利要求1所述的基于双目恰可觉察失真的多视点彩色视频快速编码方法，其特征在于所述的步骤②中{CR(k)}中的第k帧右视点图像CR(k)中坐标位置为(i,j)的宏块的双目恰可觉察失真值
其中，d表示{CR(k)}中的第k帧右视点图像CR(k)中坐标位置为(i,j)的宏块的视差值，bgL(i+d,j)表示{CL(k)}中的第k帧左视点图像CL(k)中坐标位置为(i+d,j)的宏块中的所有像素点的亮度值的平均值，bgL(i+d,j)∈[0,255]，
bgL(i×16+d×16+m,j×16+n)表示{CL(k)}中的第k帧左视点图像CL(k)中坐标位置为(i×
16+d×16+m,j×16+n)的像素点的亮度值，0≤m≤15,0≤n≤15，ehL(i+d,j)表示{CL(k)}中的第k帧左视点图像CL(k)中坐标位置为(i+d,j)的宏块中的所有像素点的边缘强度值的平均值，
bgL
(i×16+d×16+m-3+h,j×16+n-3+v)表示{CL(k)}中的第k帧左视点图像CL(k)中坐标位置为(i×16+d×16+m-3+h,j×16+n-3+v)的像素点的亮度值，GH(h,v)表示5×5的水平Sobel算子GH中坐标位置为(h,v)处的元素， GV(h,v)表示5×5的垂直Sobel算子GV中坐标位置为(h,v)处的元素， 1≤h≤5,1≤v≤5，Alimt(bgL(i+d,j),ehL(i+d ,j))＝Alimit(bgL(i+d ,j))+K(bgL(i+d ,j))×ehL(i+d,j)，
K(bgL(i+d,j))＝-10-6×(0.7×(bgL(i+d,j))2+32×bgL(i+d,j))+0.07，λ表示控制右视点噪声影响的参数，nL(i+d,j)表示{CL(k)}中的第k帧左视点图像CL(k)中坐标位置为(i+d,j)的宏块的噪声幅值。

3.根据权利要求2所述的基于双目恰可觉察失真的多视点彩色视频快速编码方法，其特征在于所述的控制右视点噪声影响的参数λ取值为1.25。

4.根据权利要求3所述的基于双目恰可觉察失真的多视点彩色视频快速编码方法，其特征在于所述的{CL(k)}中的第k帧左视点图像CL(k)中坐标位置为(i+d,j)的宏块的噪声幅值nL(i+d,j)取值为0.3。

5.根据权利要求1至4中任一项所述的基于双目恰可觉察失真的多视点彩色视频快速编码方法，其特征在于所述的步骤③-2中设定的判定阈值取值为5。

说明书

技术领域

[0001] 本发明涉及一种多视点彩色视频信号的处理方法，尤其是涉及一种基于双目恰可觉察失真的多视点彩色视频快速编码方法。

背景技术

[0002] 三维电视与自由视点电视广泛使用多视点彩色视频进行场景描述。多视点彩色视频包括多个视点的彩色，通过编码、传输、解码后在显示端进行虚拟视点绘制。在多视点彩色加深度视频中，多视点彩色视频编码已经得到广泛的研究，其中较为适用的编码平台有联合多视点视频模型和联合多视点视频编码。但是由于有关人眼视觉的特性的研究正在发展中，因此在多视点彩色视频的压缩中利用人眼视觉系统的感知特性有待进一步的研究。

[0003] 目前，研究人眼视觉系统的诸多特性中，恰可觉察失真是广大研究者所倾向的特征之一。恰可觉察失真表征人眼观看一幅图像时对图像像素的变化所能感知的可见阈值，主要依赖于图像的亮度和对比度。Liu等人利用恰可觉察失真模型区分图像的边界和纹理区域。最近，一些针对人眼感知三维图像和视频的可见阈值的研究正在盛行，如深度恰可觉察失真和双目恰可觉察失真。深度恰可觉察失真表征的是深度视频中最小能被感知的阈值，因此可将深度视频中低于该阈值的像素进一步进行压缩。双目恰可觉察失真是利于基于双眼的亮度掩蔽和对比度掩蔽实验得到的模型，其表示在其中一个视点的图像或视频的失真低于双目恰可觉察失真时，双目不会觉察到该图像或视频的失真。

[0004] 为了进一步压缩多视点彩色加深度视频庞大的数据量，适用的编码平台采用全搜索模式选择，确定宏块的最小率失真代价，从而确定最佳预测模式。针对全搜索模式较高的计算复杂度，研究人员提出了一些快速模式选择算法。Shen等人提出了一种低复杂度模式选择算法，包括四种有效地模式选择技术，预先判定SKIP模式，自适应提前终止，快速模式大小选择和有选择的帧内编码方法，这种方法有效地节约了多视点彩色视频的编码时间，同时能够保持几乎和全搜索模式选择相同的编码结果。Zeng等人利用量化步长和率失真代价之间的关系作为阈值，利用相邻块的运动矢量计算当前块的运动矢量。上述的方法都能在不降低编码质量的前提下有效地节约编码复杂度，然而在多视点彩色视频的编码过程中，人眼的视觉特性并不能完全利用到这些方法中，关于感知方向的多视点彩色视频依然有很多的研究空间。

发明内容

[0005] 本发明所要解决的技术问题是提供一种基于双目恰可觉察失真的多视点彩色视频快速编码方法，其能够在维持重建视点视频性能的基础上，有效地减少多视点彩色视频的编码时间。

[0006] 本发明解决上述技术问题所采用的技术方案为：一种基于双目恰可觉察失真的多视点彩色视频快速编码方法，其特征在于包括以下步骤：

[0007] ①将多视点彩色视频的左视点视频记为{CL(k)}，将多视点彩色视频的右视点视频记为{CR(k)}，其中，CL(k)表示{CL(k)}中的第k帧左视点图像，CR(k)表示{CR(k)}中的第k帧右视点图像，1≤k≤K，K表示左视点视频和右视点视频中包含的图像的帧数；

[0008] ②将{CR(k)}中的每帧右视点图像划分为边界区域和非边界区域，其中，边界区域由右视点图像中的第一行宏块、最后一行宏块、第一列宏块和最后一列宏块构成；然后计算{CR(k)}中的每帧右视点图像中的非边界区域内的每个宏块的双目恰可觉察失真值，假设{CR(k)}中的第k帧右视点图像CR(k)中坐标位置为(i,j)的宏块属于{CR(k)}中的第k帧右视点图像CR(k)中的非边界区域，则将{CR(k)}中的第k帧右视点图像CR(k)中坐标位置为(i,j)的宏块的双目恰可觉察失真值记为其中，2≤i≤W/16-1,2≤j≤H/16-1，W表示{CL(k)}中的每帧左视点图像和{CR(k)}中的每帧右视点图像的宽度，H表示{CL(k)}中的每帧左视点图像和{CR(k)}中的每帧右视点图像的高度；

[0009] ③在多视点视频编码校验模型JMVC上，采用HBP预测编码结构对{CL(k)}中的每帧左视点图像中的每个宏块和{CR(k)}中的每帧右视点图像中的每个宏块进行编码，在编码过程中为每个宏块选择最优宏块编码模式的过程为：

[0010] ③-1、将当前待编码的宏块定义为当前宏块；

[0011] ③-2、当当前宏块为{CL(k)}中的宏块时，编码器采用H.264的模式选择过程搜索SKIP、Inter16×16、Inter16×8、Inter8×16、Inter8×8、Inter8×8Frext、Intra16×16、Intra8×8和Intra4×4宏块编码模式，从这些宏块编码模式中选出率失真代价最小的宏块编码模式作为当前宏块的最优宏块编码模式进行编码；

[0012] 当当前宏块为{CR(k)}中的宏块时，判断当前宏块属于边界区域还是属于非边界区域，如果当前宏块属于边界区域，则编码器采用H.264的模式选择过程搜索SKIP、Inter16×16、Inter16×8、Inter8×16、Inter8×8、Inter8×8Frext、Intra16×16、Intra8×8和Intra4×4宏块编码模式，从这些宏块编码模式中选出率失真代价最小的宏块编码模式作为当前宏块的最优宏块编码模式进行编码；如果当前宏块属于非边界区域，则再判断当前宏块的双目恰可觉察失真值是否大于或等于设定的判定阈值，如果是，则编码器采用H.264的模式选择过程搜索SKIP、Inter16×16、Inter16×8、Inter8×16、Inter8×8、Inter8×
8Frext、Intra16×16、Intra8×8和Intra4×4宏块编码模式，从这些宏块编码模式中选出率失真代价最小的宏块编码模式作为当前宏块的最优宏块编码模式进行编码；否则，编码器采用H.264的模式选择过程只搜索SKIP和Inter16×16宏块编码模式，从这两种宏块编码模式中选出率失真代价最小的宏块编码模式作为当前宏块的最优宏块编码模式进行编码；

[0013] ③-3、将下一个待编码的宏块作为当前宏块，然后返回步骤③-2继续执行，直至{CL(k)}中的每帧左视点图像中的每个宏块和{CR(k)}中的每帧右视点图像中的每个宏块均完成编码。

[0014] 所述的步骤②中{CR(k)}中的第k帧右视点图像CR(k)中坐标位置为(i,j)的宏块的双目恰可觉察失真值其中，d表示{CR(k)}中的第k帧右视点图像CR(k)中坐标位置为(i,j)的宏块的视差值，bgL(i+d,j)表示{CL(k)}中的第k帧左视点图像CL(k)中坐标位置为(i+d,j)的宏块中的所有像素点的亮度值的平均值，bgL(i+d,j)∈[0,255]，
bgL(i×16+d×16+m，j×16+n)表示{CL(k)}中的第k帧左视点图像CL(k)中坐标位置为(i×
16+d×16+m,j×16+n)的像素点的亮度值，0≤m≤15,0≤n≤15，ehL(i+d,j)表示{CL(k)}中的第k帧左视点图像CL(k)中坐标位置为(i+d,j)的宏块中的所有像素点的边缘强度值的平均值，
bgL
(i×16+d×16+m-3+h,j×16+n-3+v)表示{CL(k)}中的第k帧左视点图像CL(k)中坐标位置为(i×16+d×16+m-3+h,j×16+n-3+v)的像素点的亮度值，GH(h,v)表示5×5的水平Sobel算
子GH中坐标位置为(h,v)处的元素， GV(h,v)表示5×5的垂直Sobel算子GV中
坐标位置为(h,v)处的元素， 1≤h≤5,1≤v≤5，Alimt(bgL(i+d,j),ehL
(i+d ,j))＝Alimit(bgL(i+d ,j))+K(bgL(i+d ,j))×ehL(i+d,j)，
K(bgL
(i+d,j))＝-10-6×(0.7×(bgL(i+d,j))2+32×bgL(i+d,j))+0.07，λ表示控制右视点噪声影响的参数，nL(i+d,j)表示{CL(k)}中的第k帧左视点图像CL(k)中坐标位置为(i+d,j)的宏块的噪声幅值。

[0015] 所述的控制右视点噪声影响的参数λ取值为1.25。

[0016] 所述的{CL(k)}中的第k帧左视点图像CL(k)中坐标位置为(i+d,j)的宏块的噪声幅值nL(i+d,j)取值为0.3。

[0017] 所述的步骤③-2中设定的判定阈值取值为5。

[0018] 与现有技术相比，本发明的优点在于：首先利用左视点视频和右视点视频的视差信息确定右视点视频中的每帧右视点图像中的非边界区域内的每个宏块的双目恰可觉察失真值，其次根据双目恰可觉察失真值的大小提前终止宏块模式选择，该快速编码方法在不造成率失真性能下降的基础上，能够有效地提高多视点彩色视频的编码效率，节约的编码时间可达66.48％到71.90％，平均节约编码时间68.46％。

实施方案

[0037] 以下结合附图实施例对本发明作进一步详细描述。

[0038] 由于多视点彩色视频编码中没有完全利用人眼视觉感知特性压缩，多视点彩色视频中存在大量的冗余，因此为了得到在不影响人眼视觉感知的前提下进一步减少多视点彩色视频的编码时间，本发明提出了一种基于双目恰可觉察失真的多视点彩色视频快速编码方法，其在对多视点彩色视频编码之前对右视点视频中的宏块求取相应的双目恰可觉察失真值，以减少编码多视点彩色视频的编码时间。

[0039] 本发明提出的一种基于双目恰可觉察失真的多视点彩色视频快速编码方法，其流程框图如图1所示，其包括以下步骤：

[0040] ①将多视点彩色视频的左视点视频记为{CL(k)}，将多视点彩色视频的右视点视频记为{CR(k)}，其中，CL(k)表示{CL(k)}中的第k帧左视点图像，CR(k)表示{CR(k)}中的第k帧右视点图像，1≤k≤K，K表示左视点视频和右视点视频中包含的图像的帧数。

[0041] ②由于左视点图像和右视点图像中存在遮挡暴露区域，无法求取左视点图像与右视点图像的视差值，而且遮挡暴露区域一般位于左视点图像和右视点图像中的边界区域，因此在计算{CR(k)}中的每帧右视点图像中的宏块的双目恰可觉察失真值时需去除右视点图像的边界区域(最上面一行和最下面一行宏块及最左边和最右边一列宏块)，即具体过程为：将{CR(k)}中的每帧右视点图像划分为边界区域和非边界区域，其中，边界区域由右视点图像中的第一行宏块、最后一行宏块、第一列宏块和最后一列宏块构成，非边界区域即由右视点图像中横坐标在2≤i≤W/16-1范围内且纵坐标在2≤j≤H/16-1范围内的所有宏块构成；然后计算{CR(k)}中的每帧右视点图像中的非边界区域内的每个宏块的双目恰可觉察失真值，假设{CR(k)}中的第k帧右视点图像CR(k)中坐标位置为(i,j)的宏块属于{CR(k)}中的第k帧右视点图像CR(k)中的非边界区域，则将{CR(k)}中的第k帧右视点图像CR(k)中坐标位置为( i ,j )的宏块的双目恰可觉察失真值记为其中，
2≤i≤W/16-1,2≤j≤H/16-1，W表示{CL(k)}中的每帧左视点图像和{CR(k)}中的每帧右视点图像的宽度，H表示{CL(k)}中的每帧左视点图像和{CR(k)}中的每帧右视点图像的高度，d表示{CR(k)}中的第k帧右视点图像CR(k)中坐标位置为(i,j)的宏块的视差值，利用现有的基于平方差和(the Sum of Square Differences，SSD)的视差估计算法求取{CR(k)}中的每帧右视点图像中的非边界区域内的每个宏块与{CL(k)}中同一时刻的左视点图像中的对应宏块的视差值，bgL(i+d,j)表示{CL(k)}中的第k帧左视点图像CL(k)中坐标位置为(i+d,j)的宏块中的所有像素点的亮度值的平均值，bgL(i+d,j)∈[0 ,255]，
bgL(i×16+d×16+m,j×16+n)表示
{CL(k)}中的第k帧左视点图像CL(k)中坐标位置为(i×16+d×16+m,j×16+n)的像素点的亮度值，图6给出了宏块的坐标位置与宏块内的像素点的坐标位置之间的关系示意图，0≤m≤15,0≤n≤15，ehL(i+d,j)表示{CL(k)}中的第k帧左视点图像CL(k)中坐标位置为(i+d,j)的宏块中的所有像素点的边缘强度值的平均值，
bgL
(i×16+d×16+m-3+h,j×16+n-3+v)表示{CL(k)}中的第k帧左视点图像CL(k)中坐标位置为(i×16+d×16+m-3+h,j×16+n-3+v)的像素点的亮度值，GH(h,v)表示5×5的水平Sobel算
子GH中坐标位置为(h,v)处的元素， GV(h,v)表示5×5的垂直Sobel算子GV
中坐标位置为(h,v)处的元素， 1≤h≤5,1≤v≤5，Alimt(bgL(i+d,j),
ehL(i+d,j))＝Alimit(bgL(i+d,j))+K(bgL(i+d,j))×ehL(i+d,j)，
K(bgL
(i+d,j))＝-10-6×(0.7×(bgL(i+d,j))2+32×bgL(i+d,j))+0.07，λ表示控制右视点噪声影响的参数，在本实施例中λ取值为1.25，nL(i+d,j)表示{CL(k)}中的第k帧左视点图像CL(k)中坐标位置为(i+d,j)的宏块的噪声幅值，在本实施例中，nL(i+d,j)取值为0.3。

[0042] 图2a给出了“Book Arrival”测试视频序列中的第4视点对应彩色视频序列的第1帧彩色图像(左视点图像)；图2b给出了“Book Arrival”测试视频序列中的第5视点对应彩色视频序列的第1帧彩色图像(右视点图像)；由于H.264编码过程是基于宏块大小进行的，因此本发明对图2b所示的彩色图像中的非边界区域内的每一个宏块求取双目恰可觉察失真值，并且由于图2b所示的彩色图像中的非边界区域内的每一个宏块的恰可觉察失真值较小，人眼不能直接观看，因此为方便观看将图2b所示的彩色图像中的非边界区域内的每一个宏块的恰可觉察失真值放大20倍，图2c给出了图2b所示的彩色图像中的非边界区域内的每一个宏块的双目恰可觉察失真值放大20倍后形成的图像。

[0043] ③在多视点视频编码校验模型JMVC上，采用HBP预测编码结构对{CL(k)}中的每帧左视点图像中的每个宏块和{CR(k)}中的每帧右视点图像中的每个宏块进行编码，在编码过程中为每个宏块选择最优宏块编码模式的过程为：

[0044] ③-1、将当前待编码的宏块定义为当前宏块；

[0045] ③-2、当当前宏块为{CL(k)}中的宏块时，编码器采用现有的H.264的模式选择过程搜索SKIP、Inter16×16、Inter16×8、Inter8×16、Inter8×8、Inter8×8Frext、Intra16×16、Intra8×8和Intra4×4宏块编码模式，从这些宏块编码模式中选出率失真代价最小的宏块编码模式作为当前宏块的最优宏块编码模式进行编码；

[0046] 当当前宏块为{CR(k)}中的宏块时，判断当前宏块属于边界区域还是属于非边界区域，如果当前宏块属于边界区域，则编码器采用现有的H.264的模式选择过程搜索SKIP、Inter16×16、Inter16×8、Inter8×16、Inter8×8、Inter8×8Frext、Intra16×16、Intra8×8和Intra4×4宏块编码模式，从这些宏块编码模式中选出率失真代价最小的宏块编码模式作为当前宏块的最优宏块编码模式进行编码；如果当前宏块属于非边界区域，则再判断当前宏块的双目恰可觉察失真值是否大于或等于设定的判定阈值，如果是，则编码器采用现有的H.264的模式选择过程搜索SKIP、Inter16×16、Inter16×8、Inter8×16、Inter8×8、Inter8×8Frext、Intra16×16、Intra8×8和Intra4×4宏块编码模式，从这些宏块编码模式中选出率失真代价最小的宏块编码模式作为当前宏块的最优宏块编码模式进行编码；
否则，编码器采用现有的H.264的模式选择过程只搜索SKIP和Inter16×16宏块编码模式，从这两种宏块编码模式中选出率失真代价最小的宏块编码模式作为当前宏块的最优宏块编码模式进行编码；

[0047] ③-3、将下一个待编码的宏块作为当前宏块，然后返回步骤③-2继续执行，直至{CL(k)}中的每帧左视点图像中的每个宏块和{CR(k)}中的每帧右视点图像中的每个宏块均完成编码。

[0048] 在本实施例中，步骤③-2中设定的判定阈值取值为5，该设定的判定阈值的具体取值是通过实验获取的，实验过程如下：

[0049] ③-2a、采用多视点彩色视频“Alt Moabit”、“Balloons”、“Ballroom”、“Kendo”、“Race1”、“Xmas3”、“Xmas9”序列的左视点视频中的46帧，多视点彩色视频“Alt Moabit”、“Balloons”、“Ballroom”、“Kendo”、“Race1”、“Xmas3”、“Xmas9”序列右视点视频中的46帧，依次计算“Alt Moabit”、“Balloons”、“Ballroom”、“Kendo”、“Race1”、“Xmas3”、“Xmas9”序列的右视点视频中的每一帧右视点图像中的非边界区域内的每个宏块的双目恰可觉察失真值，将每一帧右视点图像中的非边界区域内的每个宏块的双目恰可觉察失真值的最小值和最大值分别记为BJND_min和BJND_max，然后依次统计“Alt Moabit”、“Balloons”、“Ballroom”、“Kendo”、“Race1”、“Xmas3”、“Xmas9”序列的右视点视频中的46帧图像中双目恰可觉察失真值等于从BJND_min到BJND_max范围内每一个数值的宏块的个数，以集合形式记为{NBJND_min,…,NBJND_max}，其中，NBJND_min表示一个序列的右视点视频中的46帧图像中双目恰可觉察失真值等于BJND_min的宏块的个数，NBJND_max表示一个序列的右视点视频中的46帧图像中双目恰可觉察失真值等于BJND_max的宏块的个数。

[0050] ③-2b、采用多视点彩色视频“Alt Moabit”、“Balloons”、“Ballroom”、“Kendo”、“Race1”、“Xmas3”、“Xmas9”序列的左视点视频中的46帧，多视点彩色视频“Alt Moabit”、“Balloons”、“Ballroom”、“Kendo”、“Race1”、“Xmas3”、“Xmas9”序列右视点视频中的46帧，在多视点视频编码校验模型JMVC上，采用HBP预测编码结构对多视点彩色视频“Alt Moabit”、“Balloons”、“Ballroom”、“Kendo”、“Race1”、“Xmas3”、“Xmas9”序列的左视点视频和多视点彩色视频“Alt Moabit”、“Balloons”、“Ballroom”、“Kendo”、“Race1”、“Xmas3”、“Xmas9”序列的右视点视频进行编码，在编码过程中获取“Alt Moabit”、“Balloons”、“Ballroom”、“Kendo”、“Race1”、“Xmas3”、“Xmas9”序列的右视点视频中的46帧图像中的所有宏块的最优宏块编码模式。

[0051] ③-2c、对于多视点彩色视频“Alt Moabit”、“Balloons”、“Ballroom”、“Kendo”、“Race1”、“Xmas3”、“Xmas9”序列的右视点视频中的46帧图像中的非边界区域内的所有宏块，其中，当宏块的双目恰可觉察失真值等于从BJND_min到BJND_max范围内的某一个数值BJND_x时，对应集合{NBJND_min,…,NBJND_max}中的一个数值，记为NBJND_x，即，所有恰可觉察失真值等于从BJND_min到BJND_max范围内的某一个数值BJND_x的宏块个数为NBJND_x，其中，在这NBJND_x个宏块中，选择SKIP模式作为最优宏块编码模式的宏块数目记为NSKIP，选择Inter16×16模式作为最优宏块编码模式的宏块数目记为NInter16×16，选择Inter16×8模式作为最优宏块编码模式的宏块数目记为NInter16×8，选择Inter8×16模式作为最优宏块编码模式的宏块数目记为NInter8×16，选择Inter8×8模式作为最优宏块编码模式的宏块数目记为NInter8×8，选择Others(包括Inter8×8Frext、Intra16×16、Intra8×8和Intra4×4)模式作为最优宏块编码模式的宏块数目记为NOthers。

[0052] ③-2d、计算NSKIP/NBJND_x的值，记为PSKIP，即，在所有恰可觉察失真值等于从BJND_min到BJND_max范围内的某一个数值BJND_x的宏块个数为NBJND_x中，选择SKIP模式作为最优宏块编码模式的宏块数目NSKIP占这NBJND_x个宏块的百分比。

[0053] 图3a给出了多视点彩色视频序列“Alt Moabit”、“Balloons”、“Ballroom”、“Kendo”、“Race1”、“Xmas3”、“Xmas9”各自的46帧右视点图像中的非边界区域内，对于具有相同双目恰可觉察失真值的所有宏块，选择SKIP模式作为最优编码模式的宏块数目占具有相同双目恰可觉察失真值的所有宏块数目的百分比，即，图3a为多视点彩色视频序列“Alt Moabit”、“Balloons”、“Ballroom”、“Kendo”、“Race1”、“Xmas3”、“Xmas9”序列的右视点图像中PSKIP的大小变化示意图，如图3a所示，PSKIP的值一般大于50％，所占的百分比较大，即，对于多视点彩色视频右视点视频图像中的非边界区域内恰可觉察失真值在BJND_min到BJND_max范围内的所有宏块，在现有的H.264编码的模式选择过程中，选择SKIP模式的百分比较大，所以，对于多视点彩色视频右视点视频图像中的非边界区域内恰可觉察失真值在BJND_min到BJND_max范围内的的所有宏块，都要进行SKIP模式的搜索。

[0054] 计算NInter16×16/NBJND_x的值，记为PInter16×16，即，在所有恰可觉察失真值等于从BJND_min到BJND_max范围内的某一个数值BJND_x的宏块个数为NBJND_x中，选择Inter16×16模式作为最优宏块编码模式的宏块数目NInter16×16占这NBJND_x个宏块的百分比。

[0055] 图3b给出了多视点彩色视频“Alt Moabit”、“Balloons”、“Ballroom”、“Kendo”、“Race1”、“Xmas3”、“Xmas9”序列各自的46帧右视点图像中的非边界区域内，对于具有相同双目恰可觉察失真值的所有宏块，选择Inter16×16模式作为最优编码模式的宏块数目占具有相同双目恰可觉察失真值的所有宏块数目的百分比，如图3b所示，PInter16×16的值一般大于20％，所占的百分比较大，即，对于多视点彩色视频右视点视频图像中的非边界区域内恰可觉察失真值在BJND_min到BJND_max范围内的所有宏块，在现有的H.264编码的模式选择过程中，选择SKIP模式的百分比较大，所以，对于多视点彩色视频右视点视频图像中的非边界区域内恰可觉察失真值在BJND_min到BJND_max范围内的所有宏块，都要进行Inter16×16模式的搜索。

[0056] 计算NInter16×8/NBJND_x的值，记为PInter16×8，即，在所有恰可觉察失真值等于从BJND_min到BJND_max范围内的某一个数值BJND_x的宏块个数为NBJND_x中，选择Inter16×8模式作为最优宏块编码模式的宏块数目NInter16×8占这NBJND_x个宏块的百分比。

[0057] 图3c给出了多视点彩色视频“Alt Moabit”、“Balloons”、“Ballroom”、“Kendo”、“Race1”、“Xmas3”、“Xmas9”序列各自的46帧右视点图像中的非边界区域内，对于具有相同双目恰可觉察失真值的所有宏块，选择Inter16×8模式作为最优编码模式的宏块数目占具有相同双目恰可觉察失真值的所有宏块数目的百分比，如图3c所示，PInter16×8的值一般所占比例约为5％左右，随着双目恰可觉察失真值的增大，人眼所能容忍的失真越小，宏块需进一步细化，在图3c中表现为，PInter16×8也随之增大，具体表现在当0≤BJND≤5，PInter16×8保持在较小的数值，约为2％，这表明，当宏块的双目恰可觉察失真值小于某个阈值时，宏块模式选择可以不再进行Inter16×8宏块编码模式搜索过程，而当66时，PInter16×8呈增大的趋势，大约增大到5％，这表明，当宏块的双目恰可觉察失真值大于某个阈值时，宏块需要进行Inter16×8宏块编码模式搜索过程，其中，BJND表示双目恰可觉察失真值。

[0058] 计算NInter8×16/NBJND_x的值，记为PInter8×16，即，在所有恰可觉察失真值等于从BJND_min到BJND_max范围内的某一个数值BJND_x的宏块个数为NBJND_x中，选择Inter16×8模式作为最优宏块编码模式的宏块数目NInter8×16占这NBJND_x个宏块的百分比。

[0059] 图3d给出了多视点彩色视频“Alt Moabit”、“Balloons”、“Ballroom”、“Kendo”、“Race1”、“Xmas3”、“Xmas9”序列各自的46帧右视点图像中的非边界区域内，对于具有相同双目恰可觉察失真值的所有宏块，选择Inter8×16模式作为最优编码模式的宏块数目占具有相同双目恰可觉察失真值的所有宏块数目的百分比，如图3d所示，PInter8×16的值一般所占比例约为6％左右，随着双目恰可觉察失真值的增大，人眼所能容忍的失真越小，宏块需进一步细化，在图3d中表现为，PInter8×16也随之增大；具体表现在当0≤BJND≤5，PInter8×16保持在较小的数值，约为3％，这表明，当宏块的双目恰可觉察失真值小于某个阈值时，宏块模式选择可以不再进行Inter8×16宏块编码模式搜索过程，而当66时，PInter8×16呈增大的趋势，大约增大到6％，这表明，当宏块的双目恰可觉察失真值大于某个阈值时，宏块需要进行Inter8×16宏块编码模式搜索过程。

[0060] 计算NInter8×8/NBJND_x的值，记为PInter8×8，即，在所有恰可觉察失真值等于从BJND_min到BJND_max范围内的某一个数值BJND_x的宏块个数为NBJND_x中，选择Inter16×8模式作为最优宏块编码模式的宏块数目NInter8×8占这NBJND_x个宏块的百分比。

[0061] 图3e给出了多视点彩色视频“Alt Moabit”、“Balloons”、“Ballroom”、“Kendo”、“Race1”、“Xmas3”、“Xmas9”序列各自的46帧右视点图像中的非边界区域内，对于具有相同双目恰可觉察失真值的所有宏块，选择Inter8×8模式作为最优编码模式的宏块数目占具有相同双目恰可觉察失真值的所有宏块数目的百分比，如图3e所示，PInter8×8的值一般所占比例约为4％左右，随着双目恰可觉察失真值的增大，人眼所能容忍的失真越小，宏块需进一步细化，在图3e中表现为，PInter8×8也随之增大；具体表现在当0≤BJND≤5，PInter8×8保持在较小的数值，约为1.5％，这表明，当宏块的双目恰可觉察失真值小于某个阈值时，宏块模式选择可以不再进行Inter8×8宏块编码模式搜索过程，而当66时，PInter8×8呈增大的趋势，大约增大到4％，这表明，当宏块的双目恰可觉察失真值大于某个阈值时，宏块需要进行Inter8×8宏块编码模式搜索过程。

[0062] 计算NOthers/NBJND_x的值，记为POthers，即，在所有恰可觉察失真值等于从BJND_min到BJND_max范围内的某一个数值BJND_x的宏块个数为NBJND_x中，选择Inter16×8模式作为最优宏块编码模式的宏块数目NOthers占这NBJND_x个宏块的百分比。

[0063] 图3f给出了多视点彩色视频“Alt Moabit”、“Balloons”、“Ballroom”、“Kendo”、“Race1”、“Xmas3”、“Xmas9”序列各自的46帧右视点图像中的非边界区域内，对于具有相同双目恰可觉察失真值的所有宏块，选择Others(包括Inter8×8Frext、Intra16×16、Intra8×8和Intra4×4)模式作为最优编码模式的宏块数目占具有相同双目恰可觉察失真值的所有宏块数目的百分比，如图3f所示，POthers的值一般所占比例约为6％左右，随着双目恰可觉察失真值的增大，人眼所能容忍的失真越小，宏块需进一步细化，在图3f中表现为，POthers也随之增大；具体表现在当0≤BJND≤5，POthers保持在较小的数值，约为5％，这表明，当宏块的双目恰可觉察失真值小于某个阈值时，宏块模式选择可以不再进行Others(包括Inter8×8Frext、Intra16×16、Intra8×8和Intra4×4)宏块编码模式搜索过程，而当66时，POthers呈增大的趋势，大约增大到为8％，这表明，当宏块的双目恰可觉察失真值大于某个阈值时，宏块需要进行Others(包括Inter8×8Frext、Intra16×16、Intra8×8和Intra4×4)宏块编码模式搜索过程。

[0064] 综上分析可得判定阈值取值为5。

[0065] 为了验证本发明的快速编码方法的有效性和可行性，首先选取了MERL实验室的“Exit”、“Vassar”第0视点和第2视点彩色视频测试序列和日本Nogaya大学的“Champagne tower”第39视点和第41视点的彩色视频测试序列，将这些彩色视频作为原始彩色视频序列，再利用本发明提出的快速编码方法对这些序列的“Exit”、“Vassar”第2个视点以及“Champagne tower”的第41视点的彩色视频进行快速编码得到快速编码后重建的彩色视频序列。

[0066] 在此将从彩色视频序列的编码时间、编码码率和重建的彩色视频序列的峰值信噪比(Peak Signal to Noise Ratio，PSNR)来衡量本发明方法的性能。

[0067] 表1列出了上述各序列的原始彩色视频序列通过JMVC校验平台和本发明方法编码后的彩色视频序列在相同条件下(Basis QP＝22)编码的时间和编码码率以及重建质量对比。从表1所列的数据可以得出，在彩色视频序列编码时间方面，本发明方法与多视点标准校验平台相比能节约编码时间66.48％～71.90％，平均节约编码时间68.46％，原始彩色视频序列通过本发明的快速编码后重建的彩色视频序列与通过JMVC校验平台编码重建的彩色视频序列的PSNR相比平均减少0.037dB，最大减少为0.04dB，原始彩色视频序列通过本发明的快速编码后的码率与通过JMVC校验平台编码的码率相比平均增加0.46％，最大增加1.27％，最小增加-0.20％，几乎可以忽略不计。

[0068] 图4a、图4b和图4c分别给出了“Exit”、“Vassar”和“Champagne tower”测试序列分别通过JMVC校验平台和本发明方法编码后得到的彩色视频序列的编码率失真性能对比图，率失真性能对比包括通过JMVC校验平台和本发明方法编码后得到的彩色视频序列的PSNR和所用的码率对比。从图4a中可以看出，在横坐标方向上，当编码“Exit”序列的右视点图像的码率相同时，通过JMVC校验平台和本发明方法编码后重建的彩色视频序列的PSNR基本保持一致；在纵坐标方向上，当通过JMVC校验平台和本发明方法编码后重建的彩色视频序列的PSNR相同时，编码“Exit”序列的右视点图像所用的码率基本相同。从图4b可以看出，在横坐标方向上，当编码“Vassar”序列的右视点图像的码率相同时，通过JMVC校验平台和本发明方法编码后重建的彩色视频序列的PSNR基本保持一致；在纵坐标方向上，当通过JMVC校验平台和本发明方法编码后重建的彩色视频序列的PSNR相同时，编码“Vassar”序列的右视点图像所用的码率基本相同。从图4c可以看出，在横坐标方向上，当编码“Champagne tower”序列的右视点图像的码率一定时，通过JMVC校验平台和本发明方法编码后重建的彩色视频序列的PSNR基本保持一致；在纵坐标方向上，当通过JMVC校验平台和本发明方法编码后重建的彩色视频序列的PSNR相同时，编码“Champagne tower”序列的右视点图像所用的码率基本相同。综上分析可得，本发明的快速编码方法能够基本保持和JMVC校验平台一致的率失真性能。

[0069] 表1原始彩色视频序列通过JMVC校验平台和本发明方法的编码时间和编码码率以及重建彩色视频序列的质量对比

[0070]

[0071] 在主观上，对JMVC校验平台和本发明方法重建的彩色视频序列的质量进行对比，图5a给出了“Exit”测试序列采用多视点标准校验平台重建的第2视点第10帧图像，图5b给出了“Exit”测试序列采用本发明的快速编码方法重建的第2视点第10帧图像，从直观上几乎看不出图5a与图5b的差别；图5c给出了“Vassar”测试序列采用多视点标准校验平台重建的第2视点第10帧图像，图5d给出了“Vassar”测试序列采用本发明的快速编码方法重建的第2视点第10帧图像，从直观上几乎看不出图5c与图5d的差别。因此，本发明的快速编码方法和JMVC校验平台重建的多视点视频序列的右视点图像直观上基本没有差别。

[0072] 综上，对于多视点视频序列的右视点图像，本发明方法在保持率失真性能和JMVC校验平台一致的前提下，能够大大节约多视点视频序列的右视点图像的编码时间，从而节省多视点视频序列的整体编码时间。

附图说明

[0019] 图1为本发明方法的流程框图；

[0020] 图2a为“Book Arrival”测试视频序列中的第4视点对应彩色视频序列的第1帧彩色图像；

[0021] 图2b为“Book Arrival”测试视频序列中的第5视点对应彩色视频序列的第1帧彩色图像；

[0022] 图2c为图2b所示的彩色图像中的非边界区域内的每一个宏块的双目恰可觉察失真值放大20倍后形成的图像；

[0023] 图3a为多视点彩色视频序列“Alt Moabit”、“Balloons”、“Ballroom”、“Kendo”、“Race1”、“Xmas3”、“Xmas9”的右视点图像中的非边界区域内，对于具有相同双目恰可觉察失真值的所有宏块，选择SKIP模式作为最优宏块编码模式的宏块数目占具有相同双目恰可觉察失真值的所有宏块数目的百分比；

[0024] 图3b为多视点彩色视频“Alt Moabit”、“Balloons”、“Ballroom”、“Kendo”、“Race1”、“Xmas3”、“Xmas9”序列的右视点图像中的非边界区域内，对于具有相同双目恰可觉察失真值的所有宏块，选择Inter16×16模式作为最优宏块编码模式的宏块数目占具有相同双目恰可觉察失真值的所有宏块数目的百分比；

[0025] 图3c为多视点彩色视频“Alt Moabit”、“Balloons”、“Ballroom”、“Kendo”、“Race1”、“Xmas3”、“Xmas9”序列的右视点图像中的非边界区域内，对于具有相同双目恰可觉察失真值的所有宏块，选择Inter16×8模式作为最优宏块编码模式的宏块数目占具有相同双目恰可觉察失真值的所有宏块数目的百分比；

[0026] 图3d为多视点彩色视频“Alt Moabit”、“Balloons”、“Ballroom”、“Kendo”、“Race1”、“Xmas3”、“Xmas9”序列的右视点图像中的非边界区域内，对于具有相同双目恰可觉察失真值的所有宏块，选择Inter8×16模式作为最优宏块编码模式的宏块数目占具有相同双目恰可觉察失真值的所有宏块数目的百分比；

[0027] 图3e为多视点彩色视频“Alt Moabit”、“Balloons”、“Ballroom”、“Kendo”、“Race1”、“Xmas3”、“Xmas9”序列的右视点图像中的非边界区域内，对于具有相同双目恰可觉察失真值的所有宏块，选择Inter8×8模式作为最优宏块编码模式的宏块数目占具有相同双目恰可觉察失真值的所有宏块数目的百分比；

[0028] 图3f为多视点彩色视频“Alt Moabit”、“Balloons”、“Ballroom”、“Kendo”、“Race1”、“Xmas3”、“Xmas9”序列的右视点图像中的非边界区域内，对于具有相同双目恰可觉察失真值的所有宏块，选择Others(包括Inter8×8Frext、Intra16×16、Intra8×8和Intra4×4)模式作为最优宏块编码模式的宏块数目占具有相同双目恰可觉察失真值的所有宏块数目的百分比；

[0029] 图4a为“Exit”测试序列分别通过多视点标准校验平台和本发明方法编码后得到的多视点彩色视频序列的编码率失真性能对比图；

[0030] 图4b为“Vassar”测试序列分别通过多视点标准校验平台和本发明方法编码后得到的多视点彩色视频序列的编码率失真性能对比图；

[0031] 图4c为“Champagne tower”测试序列分别通过多视点标准校验平台和本发明方法编码后得到的多视点彩色视频序列的编码率失真性能对比图；

[0032] 图5a为“Exit”测试序列采用多视点标准校验平台重建的第2视点第10帧图像；

[0033] 图5b为“Exit”测试序列采用本发明的快速编码方法重建的第2视点第10帧图像；

[0034] 图5c为“Vassar”测试序列采用多视点标准校验平台重建的第2视点第10帧图像；

[0035] 图5d为“Vassar”测试序列采用本发明的快速编码方法重建的第2视点第10帧图像；

[0036] 图6为宏块的坐标位置与宏块内的像素点的坐标位置之间的关系示意图。

1一种基于双目恰可察觉失真的立体视频码率控制方法 2基于双目恰可觉察失真的多视点彩色视频快速编码方法