首页 > 专利 > 杭州电子科技大学 > 一种快速RDOQ量化零系数比例估计方法专利详情

一种快速RDOQ量化零系数比例估计方法   0    0

有效专利 查看PDF
专利申请流程有哪些步骤?
专利申请流程图
申请
申请号:指国家知识产权局受理一件专利申请时给予该专利申请的一个标示号码。唯一性原则。
申请日:提出专利申请之日。
2018-09-25
申请公布
申请公布指发明专利申请经初步审查合格后,自申请日(或优先权日)起18个月期满时的公布或根据申请人的请求提前进行的公布。
申请公布号:专利申请过程中,在尚未取得专利授权之前,国家专利局《专利公报》公开专利时的编号。
申请公布日:申请公开的日期,即在专利公报上予以公开的日期。
2019-02-26
授权
授权指对发明专利申请经实质审查没有发现驳回理由,授予发明专利权;或对实用新型或外观设计专利申请经初步审查没有发现驳回理由,授予实用新型专利权或外观设计专利权。
2020-11-10
预估到期
发明专利权的期限为二十年,实用新型专利权期限为十年,外观设计专利权期限为十五年,均自申请日起计算。专利届满后法律终止保护。
2038-09-25
基本信息
有效性 有效专利 专利类型 发明专利
申请号 CN201811120450.9 申请日 2018-09-25
公开/公告号 CN109274967B 公开/公告日 2020-11-10
授权日 2020-11-10 预估到期日 2038-09-25
申请年 2018年 公开/公告年 2020年
缴费截止日
分类号 H04N19/122H04N19/124H04N19/147H04N19/149 主分类号 H04N19/122
是否联合申请 独立申请 文献类型号 B
独权数量 1 从权数量 0
权利要求数量 1 非专利引证数量 0
引用专利数量 0 被引证专利数量 0
非专利引证
引用专利 被引证专利
专利权维持 4 专利申请国编码 CN
专利事件 事务标签 公开、实质审查、授权
申请人信息
申请人 第一申请人
专利权人 杭州电子科技大学 当前专利权人 杭州电子科技大学
发明人 殷海兵、杨浩运、黄晓峰 第一发明人 殷海兵
地址 浙江省杭州市下沙高教园区2号大街 邮编 310018
申请人数量 1 发明人数量 3
申请人所在省 浙江省 申请人所在市 浙江省杭州市
代理人信息
代理机构
专利代理机构是经省专利管理局审核,国家知识产权局批准设立,可以接受委托人的委托,在委托权限范围内以委托人的名义办理专利申请或其他专利事务的服务机构。
杭州浙科专利事务所 代理人
专利代理师是代理他人进行专利申请和办理其他专利事务,取得一定资格的人。
吴秉中
摘要
本发明公开了一种快速RDOQ量化零系数比例估计方法。为了体现不同位置系数差异性,本发明为不同位置系数定义一个不同加权系数,将加权系数构建为位置自适应死区偏移量δ的函数,基于此度量加权SATD,即WSATD。考虑到RDOQ算法复杂性,仅仅考虑q和WSATD还不足以构建精准的ρ模型。假设χ=WSATD/q,发现不同χ样本它们的ρ有不同值,本发明将χ的均值θ作为构建ρ模型的另外一个特征参量。在HEVC编码器中,存在不同类型的变换块(TU),为了区分这种差异性,本发明针对在不同类型TU块分别建模。最后利用统计分析曲线拟合方法构建三维ρ模型。通过该模型能够快速估计出RDOQ后的零系数比例ρ。
  • 摘要附图
    一种快速RDOQ量化零系数比例估计方法
法律状态
序号 法律状态公告日 法律状态 法律状态信息
1 2020-11-10 授权
2 2019-02-26 实质审查的生效 IPC(主分类): H04N 19/122 专利申请号: 201811120450.9 申请日: 2018.09.25
3 2019-01-25 公开
权利要求
权利要求书是申请文件最核心的部分,是申请人向国家申请保护他的发明创造及划定保护范围的文件。
1.一种快速RDOQ量化零系数比例估计方法,包括如下步骤:
步骤(1)获得自适应死区偏移量δ;
步骤(2)建立WSATD自适应加权系数模型;
步骤(3)建立ρ与θ以及χ之间函数关系;
步骤(4)建立ρ模型;
步骤(1)具体如下:
首先根据公式(2)获取DCT系数分布参数Λ,公式(2)如下所示:
其中n为统计个数,ci为DCT系数,然后根据公式(3)获取自适应死区偏移量δ,使得RDOQ量化行为和HDQ量化行为相似;公式(3)如下:
其中QP>17:
I帧ψ=0.50+0.001*(QP-17),μ=0.1,β=0.6,γ=0.6,
α=128,ξ1=ξ2=32,a=35,b=50;
P/B帧ψ=0.48+0.001*(QP-17),μ=0.1,β=0.6,γ=0.6,
α=128,ξ1=ξ2=32,a=35,b=50;
步骤(2)具体如下:权重模型如下:
通过控制参数a’、b’的大小来控制权重函数的质心和曲率,并且该权重模型里面的参数a’和b’根据不同的TU块内容动态变化;其中ci表示DCT系数,wi为所得到的权重系数;根据cmax*wmin=(1-δ)q可得到最小权重wmin,q为量化步长;最终使用((1-δ)q,1)和(cmax,wmin)根据公式(1)推导出a’和b’;
利用公式(7)来获得每一个TU块的χ,并且利用数学上计算均值的方法得到相同ρ下χ的均值θ:
两个函数关系θ'-ρ'和θ-θ'可以分别通过曲线拟合获得:
θ'=g(ρ')                                      (4)
θ=f(θ')                                      (5)
其中ρ'是通过HDQ预量化后的零系数比例,θ'是ρ'相同的情况下χ的均值,θ是ρ相同的情况下χ的均值;θ'-ρ'是单调递减的二阶函数;θ-θ'是单调递增的二阶函数;
利用集合的统计曲线拟合方法得到ρ=f(θ,χ)的三维函数模型,如公式(6)所示:
ρ=a0+a1θ+b1χ+a2θ2+c11θχ+a3θ3+c21θ2χ                 (6)
其中ρ模型是关于θ的3阶和关于χ的1阶多项式。
说明书

技术领域

[0001] 本发明属于视频编码器领域,具体是一种快速RDOQ量化零系数比例估计方法。

背景技术

[0002] 在视频编码器设计过程中,码率-失真(R-D)函数模型常用于算法率失真优化(RDO),如码率控制。准确地计算R和D会使视频编码器的计算复杂度增加,特别是在支持计算密集型RDOQ和CABAC熵编码技术的最新HEVC标准编码器中。发展R和D快速估计方法,在过去的二十年中引起了广泛的研究兴趣,学术界和工业界提出了几种典型的R-D模型。
[0003] 由于量化直接决定编码失真和码率消耗,所以一些学者将率失真模型描述为量化参数QP的函数,这一类方法就是QP域R-D建模;一些学者研究零系数比例ρ与码率、失真之间的关系,将率失真函数构建为ρ的函数,这一类方法就是ρ域R-D建模。由于ρ直接由量化算法确定,所以在ρ域建模可以更准确地描述CABAC的特征。研究也证实ρ和编码比特率R之间有非常直接的关系,特别是在低比特率下。如何根据量化算法特点准确估计ρ,是实现ρ域RD建模的关键。
[0004] 目前视频编码领域常采用两种典型量化算法,基于四舍五入、系数独立的硬判决量化(HDQ),如死区deadzone硬判决量化,这类方法没有考虑系数之间的相关性。由于CABAC采用上下文自适应编码,块内相邻系数之间存在着相互关联,学术和工业界提出了基于动态规划的软判决量化(SDQ)算法,其中充分考虑了系数之间数据依赖关系,将维特比算法应用在块内系数联合优化量化,将块内系数联合优化量化问题转换为维特比最优路径选择问题。目前,广泛采用的率失真优化量化(RDOQ)就是一类典型的SDQ量化算法。与死区量化相比,RDOQ具有良好的编码率失真性能。在基于HDQ的视频编码器中,ρ可以通过简单的四舍五入估计得到。然而,基于RDOQ的视频编码器中,量化采用了基于维特比算法的网格搜索,需要准确估计ρ有较大难度。
[0005] 另一方面,在最新HEVC视频编码器中,大量变换块被量化为全零,特别是在低比特率下。在最新的标准中,会将率失真优化应用于量化。在RDOQ算法中,量化器需要评估所有可能候选量化结果的失真和码率,并从率失真优化的意义上选择最佳量化结果,需要很高的计算复杂度。如果可以在使用RDOQ之前进行全零块(AZB)检测,那么可以减少HEVC编码计算负担。在过去的二十年里,一些学者提出了几种AZB检测算法。从支持量化算法角度来看,这些AZB决策算法通常更适合于基于HDQ的视频编码,例如死区量化,不太支持具有良好编码性能的RDOQ等软判决量化算法。
[0006] 因此本发明提出一种快速RDOQ量化零系数比例估计方法。一个变换块量化后的零系数比例ρ和量化步长q之间存在正比例关系;同时图像内容不同ρ也明显不同,一般可以用SATD(绝对变换差值之和)描述图像内容,一些算法将ρ构建为q和SATD的函数。RDOQ算法由于系数之间存在依赖,位于不同位置、具有相同幅度的变换系数,可能量化为不同结果,这说明RDOQ算法对系数位置是敏感的。SATD仅仅描述整个块整体上的信息,没有描述每个系数的不同。为了体现不同位置系数差异性,本发明为不同位置系数定义一个不同加权系数,将加权系数构建为位置自适应死区偏移量δ的函数,基于此度量加权SATD,即WSATD。考虑到RDOQ算法复杂性,仅仅考虑q和WSATD还不足以构建精准的ρ模型。假设χ=WSATD/q,发现不同χ样本它们的ρ有不同值,本发明将χ的均值θ作为构建ρ模型的另外一个特征参量。这样将ρ模型构建为χ和θ的函数。在HEVC编码器中,存在不同类型的变换块(TU),为了区分这种差异性,本发明针对在不同类型TU块分别建模。最后利用统计分析曲线拟合方法构建三维ρ模型。通过该模型能够快速估计出RDOQ后的零系数比例ρ。
[0007] 最接近的已有技术1:
[0008] Low-delay rate control for DCT video coding via ρ-domain source modeling
[0009] 该论文提出了基于ρ域的码率R控制方法,首先通过获取帧级别的零数比例ρ和码率R,然后通过码率特征曲线分解,获取ρ-R的函数关系,最后通过ρ-R的函数关系,为当前帧中的每一个编码宏块选取量化步长参数q,从而实现码率控制。为了能够在量化之前实现码率控制,该论文利用q越大,DCT系数就越容易量化为零,且ρ和q之间存在正比例关系。从而由DCT变换系数的分布,获得零系数比例ρ与量化步长q的函数关系。在对DCT系数量化之前,通过ρ=f(q)的函数关系,能快速得到当前帧DCT系数量化后的ρ,这样的话,就能够在量化之前实现码率控制,有效减少HEVC编码计算负担,提高编码效率该已有技术的缺陷:
[0010] 该论文所提出的码率控制和估计ρ的方法,一方面该方法是基于H.263视频编码标准,所以不支持现在正在使用的H.265等视频编码标准;另一方面该方法是帧级别的码率控制和估计ρ的方法,对于细颗粒度TU块级别不适用。同时,从量化算法的角度来看,该方法是基于硬判决量化(HDQ)算法的,不支持具有良好编码性能的软判决量化(SDQ),比如RDOQ。
[0011] 最接近的已有技术2:
[0012] An all-zero block detection scheme for low-complexity HEVC encoders[0013] 该论文提出的全零块预判决方法,首先根据各个独立宏块的特征参数,比如SAD(绝对误差和)或者是SATD(绝对变换差值之和),来推导出一个阈值,作为全零块的预判决条件,然后根据预判决条件,在量化之前实现全零块判决。上述全零块预判决方法,能够在量化之前实现,从而有效减少HEVC编码计算负担,提高编码效率。
[0014] 该已有技术的缺陷:
[0015] 该论文提出的全零块预判决方法,一方面该方法是基于硬判决量化(HDQ)算法的,所以不支持编码性能良好的软判决量化(SDQ)算法,如RDOQ;另一方面,该方法是宏块级别的全零块预判决方法,对于细颗粒度TU块级别不适用。

发明内容

[0016] 本发明需要解决的技术问题:
[0017] (1)模拟RDOQ算法行为的自适应死区偏移量δ建模方法;
[0018] (2)WSATD自适应加权系数模型;
[0019] (3)如何确定与ρ相关的特征参数;
[0020] (4)基于启发式建模和曲线拟合实现在线应用ρ模型的方法
[0021] 技术方案:
[0022] (1)在视频编码中有两种典型的量化算法,第一种是死区的硬判决量化(HDQ),第二种是软判决量化(SDQ),如率失真优化量化(RDOQ)。与死区量化相比,RDOQ具有良好的编码率失真性能。在基于HDQ的视频编码器中,ρ可以通过简单的四舍五入估计得到。然而,在基于RDOQ的视频编码器中,量化采用了基于维特比算法的网格搜索,较难准确估计出ρ。在以前的工作中已经进行了深入的研究,在DCT系数服从拉普拉斯分布的假设下,获得DCT系数分布参数Λ,然后基于统计分析方法在最大正判概率和最小误判概率的双重约束下,得到最优死区偏移量范围(δmin1,δmax1),最后在不同预测模式下,分析最佳偏移量与分布参数以及量化参数的函数关系,并且利用该函数关系获得自适应死区偏移量δ,使RDOQ量化行为与HDQ量化行为相似。这样的话就可以简化RDOQ来计算视频编码器中的ρ。
[0023] (2)在进行视频编码时,由于SATD可以体现视频内容,并且很容易获得,所以SATD被广泛应用于RD模型的研究。就ρ建模而言,SATD和ρ之间存在非线性关系,所以不能直接将SATD应用到ρ模型中。例如,如果DCT系数大于最佳零量化阈值,则它将被量化为非零系数。然而,增加系数强度并不会改变该系数对当前TU块ρ的贡献。换句话说,如果DCT系数|ci|大于最佳零量化阈值,无论|ci|多大,它对ρ的贡献都是相同的。本发明采用加权SATD(用WSATD表示)来减小SATD和ρ之间的非线性程度,并根据ci的强度提出一个权重模型来近似SATD和ρ之间的线性关系。
[0024] (3)在方案(2)中通过加权的方式减少了SATD和ρ之间的非线性程度。众所周知,ρ与量化步长q之间也存在关系。一般来说,q越大系数越容易被量化为零,所以ρ和q之间存在正比例关系。通过考虑WSATD和q的关系,最终建立了ρ和WSATD/q(由χ表示)之间的函数关系。影响RDOQ最后量化结果的因素很多,比如码率和失真,因此需要引入另一个特征参数来开发更精确的三维ρ模型,从而模拟最优RDOQ的量化行为。通过对ρ-χ模型的研究分析发现:在相同ρ的情况下,χ的平均值(由θ表示)也与ρ具有明显的函数关系,因此本发明将θ(χ的平均值)作为第三个特征参数联合考虑进ρ模型中。
[0025] (4)由于θ只能够离线获得,所以为了保证能够在线使用快速估计ρ的方法,需要建立关于θ的函数关系,从而能够在线获得θ。通过研究RDOQ的量化过程发现:在使用RDO来确定最佳量化结果时,只有极少数经过HDQ的非零系数被量化为零,因此ρ'(在HDQ情况下零系数比例)基本上与ρ相同。假设用θ'表示在相同ρ'情况下χ的均值,同理θ'通常与θ也相同。所以利用启发式建模的方法分别得到θ'-ρ'和θ-θ'的函数关系。最后利用统计分析曲线拟合方法构建三维ρ=f(θ,χ)函数关系。
[0026] 本发明的技术效果:
[0027] (1)本发明通过获得的自适应死区偏移量δ,使RDOQ量化行为与HDQ量化行为相似,因此可以利用四舍五入,快速判断DCT系数ci经过RDOQ之后的结果是否为零。
[0028] (2)本发明所采用的权重模型,可以通过控制参数a、b的大小来控制权重函数的质心和曲率,并且该权重模型里面的参数a和b是根据不同的TU块内容动态变化的,从而能获得更加准确的WSATD。权重模型如下所示:
[0029]
[0030] 其中ci表示DCT系数,wi为所得到的权重系数。
[0031] (3)该方案利用启发式建模和数据统计的方法,获得能够描述ρ的两个特征参数χ和θ,从而建立精准的ρ模型,模拟最优的RDOQ量化行为。
[0032] (4)该方案利用启发式建模的方法,得到θ-θ'的函数关系,由于θ'可以很容易地在线获得,从而可以根据θ'在线估计出θ,使快速估计ρ的方法可以在线实现。最后利用统计分析曲线拟合方法得到三维ρ=f(θ,χ)函数关系,从而可以精准的模拟最优RDOQ量化行为,准确的估计出ρ。
[0033] 本发明所提出的ρ模型可以快速准确地预测出RDOQ的ρ结果,从而可以实现为ρ域R-D模型快速估计出ρ和全零TU块的预判决。

实施方案

[0039] 下面结合附图对本发明作进一步说明。
[0040] 在视频编码中,视频编码算法的优化,比如码率控制,广泛采用ρ域率失真(RD)建模的方法,如何根据量化算法特点准确估计ρ,是实现ρ域RD建模的关键。在基于HDQ的视频编码器中,可以通过简单的四舍五入获得ρ,然而,使用RDOQ来计算视频编码器中的ρ是计算密集型的,计算出ρ很复杂。同时,在以前工作中所提出的几种典型的全零块预判决方法,都是基于硬判决量化(HDQ)或者是宏块级别,不支持率失真优化(RDOQ)或者TU块级别的全零块判决。相比较HDQ而言,RDOQ能够获得良好的编码性能,所以被广泛的应用于视频编码器中。因此本发明提出了一种快速RDOQ量化零系数比例估计方法,通过该方法可以快速准确地预测RDOQ的ρ结果,并具有适度的实施复杂度。图1给出了建立ρ模型的流程图。
[0041] (1)自适应死区偏移量δ
[0042] 首先根据公式(2)获取DCT系数分布参数Λ,公式(2)如下所示:
[0043]
[0044] 其中n为统计个数,ci为DCT系数。然后根据公式(3)获取自适应死区偏移量δ,使得RDOQ量化行为和HDQ量化行为相似。公式(3)如下:
[0045]
[0046] 其中QP>17:
[0047] I帧ψ=0.50+0.001*(QP-17),μ=0.1,β=0.6,γ=0.6,
[0048] α=128,ξ1=ξ2=32,a=35,b=50;
[0049] P/B帧ψ=0.48+0.001*(QP-17),μ=0.1,β=0.6,γ=0.6,
[0050] α=128,ξ1=ξ2=32,a=35,b=50;
[0051] (2)WSATD自适应加权系数模型
[0052] 对于ρ而言,当DCT系数|ci|大于最佳的零量化阈值时,无论|ci|多大,它对ρ的贡献都是相同的。利用这个性质,本发明采用启发式建模的方法来确定控制参数a和b以获得准确的WSATD。问题的关键是如何确定(|ci|,wi)来进行参数选择。一方面,假设具有强度(1-δ)q的系数对于WSATD估计和ρ的贡献为1。另一方面,因为TU块中|ci|的最大值是cmax与强度(1-δ)q的DCT系数对ρ的贡献相同,所以根据cmax*wmin=(1-δ)q可得到最小权重wmin。最终可以使用((1-δ)q,1)和(cmax,wmin)根据公式(1)推导出a和b,其中a和b是根据TU块内容动态变化,从而保证产生精确的权重模型。对于量化为零的ci来说,由于它们对ρ的贡献为零,所以所对应的权重系数wi为零。
[0053] 如上所分析,如果可以预先判断出ci经过RDOQ的结果是否为零,就可以达到快速确定权重系数wi是否为零的目的。一方面,根据HDQ量化原理,在区间[0,(1-f)q)内的ci会被HDQ量化为零,并且这些系数也会被RDOQ量化为零。另一方面,对于在区间[(1-f)q,q)内的ci通过HDQ量化为非零,但是在经过RDOQ之后,会被量化为零或非零系数。通常如果一个TU仅包含具有强度[(1-f)q,q)的m个DCT系数时,虽然它们会被HDQ量化为非零,但是由于率失真优化准则会被RDOQ量化为全零。在不同TU块的情况下,典型的数值m在表1中给出。
[0054] 表1数值m统计表
[0055] TU块类 m 统计总数 量化为零 百分比 量化为非 百分比4x4 2 159173 132871 83.48% 26302 16.52%
8x8 3 108598 100647 92.68% 7951 7.32%
16x16 6 140682 135398 96.24% 5284 3.76%
32x32 6 26594 26445 99.44% 149 0.056%
[0056] (3)建立ρ与θ以及χ之间函数关系
[0057] 利用公式(3)来获得每一个TU块的χ,并且利用数学上计算均值的方法得到相同ρ下χ的均值θ。
[0058]
[0059] 其中ci表示DCT系数,wi为权重系数,q为量化步长。
[0060] 由于θ只能够离线获得,所以需要在线建立关于θ的函数关系,从而能够在线使用快速估计ρ的方法。通过研究发现θ-θ'之间存在很明显的函数关系,并且就θ-θ'函数建模而言,需要清理一些收集的样本数据。第一种情况是θ在某些ρ的情况下可能不存在,需要在相应的ρ'的情况下去除相应的θ'样本(无论θ'是否存在)。第二种情况是在某些ρ'情况下θ'可能不存在,需要在相应ρ与θ'的情况下(如果θ存在)确定θ。ρ'和θ'之间也有很高的相关性,因此可以考虑建立θ'-ρ'之间的函数关系。两个函数关系θ'-ρ'和θ-θ'可以分别通过曲线拟合获得:
[0061] θ'=g(ρ')   (4)
[0062] 其中ρ'是通过HDQ预量化后的零系数比例,θ'是ρ'相同的情况下χ的均值,θ'-ρ'是单调递减的二阶函数。θ-θ'是单调递增的二阶函数,这个函数可以表示如下:
[0063] θ=f(θ')   (5)
[0064] 其中θ'是ρ'相同的情况下χ的均值,θ是ρ相同的情况下χ的均值。图3是θ'-ρ'和θ-θ'的图形。
[0065] 根据图3,可以得出以下结论:当TU块类型为4×4和8×8时,可以根据公式(4)和(5)准确地在线预测θ。对于其他类型的TU块,公式(4)和(5)有时不能准确地在线预测θ。为了忽略这些异常样本,使用估计的θ'代替ρ-θ建模的θ。最后,通过曲线拟合获得函数关系ρ-θ。图3和图4显示了拟合曲线和样本散点结果。
[0066] (4)建立ρ模型
[0067] 如上所述,可以得出ρ-χ和ρ-θ之间都具有函数关系,为了更精准的模拟最优RDOQ量化行为,所以最终利用集合的统计曲线拟合方法得到ρ=f(θ,χ)的三维函数模型,如公式(6)所示:
[0068] ρ=α+a1θ+b1χ+a2θ2+c11θχ+a3θ3+c21θ2χ   (6)
[0069] 其中ρ模型是关于θ的3阶和关于χ的1阶多项式。图5是ρ=f(θ,χ)的两个角度的三维关系图形。
[0070] 通过该模型能够快速估计出TU块经过RDOQ的零系数比例ρ,一方面可以为ρ域RD建模快速估计出ρ;另一方面可以在量化之前实现TU块级别的全零块预判决,减少编码器的负担。

附图说明

[0034] 图1是建立ρ模型流程图;
[0035] 图2是权重模型函数衰落形式图;
[0036] 图3是θ'-ρ'和θ-θ'拟合曲线图;
[0037] 图4是ρ-θ拟合曲线图;
[0038] 图5是ρ-θ-χ的三维关系图形。
版权所有:盲专网 ©2023 zlpt.xyz  蜀ICP备2023003576号