• 易迪拓培训,专注于微波、射频、天线设计工程师的培养
首页 > 无线通信 > 技术文章 > 分布式视频编码关键技术及其发展趋势

分布式视频编码关键技术及其发展趋势

录入:edatop.com     点击:

2.2.2联合解码重建

联合解码重建算法是影响系统失真性能的另一主要因素。目前的WZ视频编解码器都是基于非对称的SF编码理论,也就是说边信息Y是用传统的编码器来进行压缩的,而X利用边信息来进行压缩编码和解码的。得到图像帧中待解码块的边信息后,把这个边信息送入WZ解码器,通过重建就可以得到该块,这时用重建的块做运动估计(单向或者双向都可以),找到一个跟WZ重建块最接近的预测块,然后把这个预测块作为WZ重建块的边信息,再次送入WZ解码器,迭代重建得到该块,迭代多次后就可以取得更好的性能。

Step1:对已解码的关键帧K之间进行运动估计(结合编码端的辅助信息,如Hash码,如有的话),得到运动矢量,进行时域插值,得到边信息Sside。

Step2:SF解码器利用边信息,Sside联合解码出Sq。

Step3:结合边信息的概率统计模型,Sside和Sq利用最大后验估计(maximumaposteriori,MAP)联合重构Wyner-Ziv帧。

Step4:迭代重建,直到解码误差达到规定的要求。

解码较为复杂,通过帧内解码、SF解码、运动估计、插值和最大后验估计等进行联合解码。

2.3分布式视频编码的码率控制技术

在分布式视频编码中,X和Y之间的统计特性在编码端是未知的。用分布式信源编码技术实现的低编码复杂度的视频编码把一帧视频图像当作X来对待,把该帧图像在解码端的预测值当作边信息Y。由于视频信号是非各态历经的,所以可以达到的最佳压缩比例是变化的,而且不能由编码器预先得到。在分布式视频编码中,有3个方面的因素会影响到压缩信号的码率。首先是K帧与WZ帧的比例,相当于传统编码中I帧与P帧或B帧的比例。由于K帧采用传统的帧内编码,因此K帧比例大会导致被压缩信号码率高,虽然K帧比例大有利于在解码端产生预测精度高的边信息。第二个因素是K帧的码率,这取决于帧量化步长的选择,与传统视频编码情况完全相同。第三个因素是WZ帧的码率,这取决于WZ帧的量化步长及传输的校验位数量。WZ帧的量化步长会影响信道编码产生的校验位总数,同时也会影响解码端重建图像的质量。当量化步长确定后,校验位总数也随之确定,此时,传输的校验位数量将取决于虚拟相关信道的统计特性,即帧和边信息之间的统计相关性。但由于边信息是在解码端得到的,因此在编码端很难确定要传输多少校验位才能在解码端成功地完成信道解码(以下称校验位数问题)。在上述3个因素中,对帧与帧的比例可借鉴或使用传统视频编码中的方法,但对帧码率的控制则是一个新的课题,也是分布式视频编码中的一个研究重点。

带反馈的帧码率控制是解决校验位数问题的一个好方案。编码器传递一个较短的伴随式,解码器试着解码。如果解码器顺利解码,解码器反馈这个信息给编码器,然后编码器再对下一个图像块的数据进行压缩。如果解码器解码失败,那么就反馈通知编码器,编码器给较短的伴随式加上一定数量的比特数,构成一个较长的伴随式。这个过程一直循环,直到伴随式足以顺利解码。参考文献[21]提出一种在解码端实现帧码率控制的方案,即在帧量化步长确定的情况下,由解码端利用已收到的校验位进行解码,当无法成功解码时,则通过回传通道请求编码端传送更多的校验位。这种方法在保持编码器不变的情况下,只需改变解码器的设置就可改善整个系统的压缩性能,这与传统视频编解码系统的情况正好相反。这种方法的缺点是需要回传通道,而且解码端请求传送更多校验位的过程需在线完成,即在编码器工作的时候完成。显而易见,这种方法只有在存在反馈信道并且这个循环过程不是非常复杂的情况下才具有实际应用价值,因此不适合存储设备的应用。参考文献[5]提出了另一种帧码率控制方法,即在编码端做一些简单的时域相关性估计,以便确定编码码率。该方法需要编码端存储前一帧的数据,并将当前的帧分成大小相同的像素块。根据各块与前一帧对应块的帧差能量大小将其划分为不同的类型,对不同类型的像素块采用不同码率的编码。这种方法不需要回传通道,与解码端使用运动补偿预测技术产生边信息相比,这种估计就会很不精确,即相当于编码端粗糙的相关性估计会造成码率控制不准确。截取过的LDPC码虽也可进行一定程度的码率控制,但截取过的LDPC码在信源压缩上的性能却很差,哪怕只是采用了很轻微的码字截取操作。

3分布式视频编码需要进一步研究的关键问题

目前分布式视频编码的研究已经获得到了很多较有意义的成果,然而距离实际应用还有不小的差距。前人探索性的研究,提供了许多富有挑战性的研究课题。

3.1编码复杂度与压缩效率的权衡

分布式视频编码是由于无线视频通信的需求而被提出的,并因此逐渐引起关注。但应用于无线环境下的分布式视频编码系统对编码器的要求较为苛刻,尤其是要求低编码复杂度和高压缩效率,然而要做到二者均达到最佳效果在实际系统中是非常困难的。如何权衡编码复杂度和编码的压缩性能是设计实用视频编码系统的一个重要课题。PRISM方案的研究结果显示,将运动估计的复杂度在编码器和解码器之间任意分担,不会造成率失真性能上限的损失。但此时的运动估计的匹配标准和方法与经典视频压缩不同的。经典视频编码的运动估计目标是使编码该图像块的目标码率最低,而分布式视频编码运动估计追求的是找到最相似的目标块,即二者运动估计的模型不同。分布式视频编码对运动估计模型的准确性要求更高,因而复杂度也更高。且压缩效率与该模型的准确度密切相关。如果将帧间相关估计全部移至解码端,则编码端的码率估计与码率控制必须通过反馈信道即依赖于解码端。

3.2当前解码帧和边信息的概率统计模型

边信息可以看成是当前待解码帧的加性噪声版本,因此当前帧和边信息之间的残差可以看成是统计相关信道引入的错误,而这些错误可以用编码端发送的校验码纠正过来。即分布式视频编码把每帧图像都看成彼此相关的信源,通常认为边信息和当前解码帧的概率分布近似满足Laplacian分布,而这一概率模型并不能精确地描述所有视频运动模式的可能性。实验表明,当前解码帧和边信息的概率模型对解码重建的健壮性有非常重要的影响,有参考文献如PRISM方案对其概率模型做了初步的探索,同时指出需要研究更为精确的数学模型解决该问题。

3.3K帧选择与辅助信息的质量

类似于传统视频编码中变换I、P、B帧的比例来获取不同的编码效果一样,在WZ编码中,可以通过变化K帧之间WZ帧的数量来获得各种要求的编码效果。如果在视频序列中,抽取高质量的K帧的比例增高,则WZ帧的辅助信息就会随之丰富,因此得到的重构和解码质量也相对较高,但是由于对K帧的编码方式是帧内编码,其码率远远高于WZ帧。且随着K帧比例的增高,整个系统码率也必然会逐步上升。K帧数量和辅助信息质量之间的权衡,对于整个系统的编码效率和最终的解码质量都是至关重要的。

3.4更有效的基于运动估计的边信息估值和联合解码重构算法

WZ帧的压缩效率主要来自于解码端对边信息的估计和联合解码重建。目前的直接把基于块的运动估计的方法加入分布式视频解码器的方法所能带来的增益有限,需要更加有效的运动估计方法。在WZ视频编码中运动估计和传统的视频编码中的运动估计有两个主要的区别。

第一,运动估计在整个视频系统中的位置不同。传统视频编码中,运动估计在编码端进行,在当前帧(原始数据)和已解码重建帧之间计算运动矢量;而在WZ视频编码中的运动估计是在解码端进行的,在解码的重建帧之间计算估计运动矢量。

第二,运动估计的计算准则不同。在传统的视频编码中,基于块的运动估计的主要计算准则是寻找最小MAD(meanabsolutedifference),以至于达到最佳的压缩效果,所以计算出的运动矢量和真实的运动矢量不一定相同。在WZ视频编码中,估计的运动矢量通过时域内插得到边信息,如果所估计的运动矢量和真实的运动矢量有较大差距,内插出的图像会出现方块效应,造成当前的解码图像质量下降,所以在WZ视频编码中,估计的运动矢量需要尽可能地和真实运动矢量相一致。

基于Affine或Huber-Markov随机场或者光流的运动模型,或许可以进行更有效的边信息生成。由于考虑到编码复杂度和压缩效率,编码端不可能提供太多的比特负载,这就需要在解码端通过对已解码的重建帧做运动估计,利用先验概率模型进行边信息估值。同时在解码重建函数中,需要考虑在发生误码的情况下(如边信息估值错误或当前帧传输出错),如何实现解码的最佳重建。对于采用什么方式的运动估计算法得出更为精确的边信息,如何构建更佳的解码重建函数,目前只有一些具体改进的算法提出,然而这些算法缺乏较为详细的实验数据和理论分析。

4结束语

对于视频压缩,DVC是一种全新的框架。该框架虽包括一些传统信源信道编码中常用的环节,如变换、量化、纠错编码、运动估计、码率控制等,但这些环节需要在新的框架下重新设计和优化。另外,DVC中还有一些特有的环节,如边信息的产生、虚拟信道统计相关性的估算、联合解码算法等,需要进一步地深入研究。

来源:电信科学

上一篇:网络双向化改造技术之二--HomePNA
下一篇:理解功率MOSFET的开关损耗

手机天线设计培训教程详情>>

手机天线设计培训教程 国内最全面、系统、专业的手机天线设计培训课程,没有之一;是您学习手机天线设计的最佳选择...【More..

射频和天线工程师培训课程详情>>

  网站地图