西安营销网站建设公司,贵阳网站维护培训,做h的游戏视频网站,广告图案大全图片变换编码#xff08;Transform Coding#xff09;是现代视频压缩技术中消除空间冗余#xff08;帧内冗余#xff09;和残差冗余的核心环节。无论是在独立编码的I帧中#xff0c;还是在帧间预测后产生的残差块中#xff0c;变换编码都是将空间域#xff08;像素值#x…变换编码Transform Coding是现代视频压缩技术中消除空间冗余帧内冗余和残差冗余的核心环节。无论是在独立编码的I帧中还是在帧间预测后产生的残差块中变换编码都是将空间域像素值的数据转化为更便于压缩的频率域数据的关键步骤。变换编码在视频编码器的整体流程中变换编码位于预测帧内或帧间之后量化之前。1. 作用与目标集中能量Energy Compaction这是变换编码最核心的目标。大多数自然图像和视频帧的残差块在空间域上具有很强的相关性相邻像素相似。通过变换可以将这些相关性转化为频域中的少数几个较大的系数通常是低频系数而大部分高频系数的值则趋近于零。便于量化Facilitation of Quantization将能量集中后编码器可以在量化阶段对那些数值接近于零的高频系数进行粗量化甚至直接置零从而实现有损压缩大幅减少需要存储和传输的数据量。2. 处理对象变换编码主要处理两种数据块帧内预测残差块在I帧或P/B帧的帧内编码模式下由原始块减去帧内预测块所得的残差。帧间预测残差块在P帧或B帧的帧间编码模式下由原始块减去运动补偿预测块所得的残差。核心原理离散余弦变换DCT在视频编码的早期标准如MPEG-1/2/4、H.263和当前主流标准如H.264/AVC中**离散余弦变换Discrete Cosine Transform, DCT**是应用最广泛的变换编码方法。1. DCT 的数学定义二维对于一个 N * N 的像素块 f(x, y)其二维 DCT 变换 F(u, v) 定义为2. 变换结果的解释经过 DCT 变换后得到的 N * N 系数矩阵 F(u, v) 具有明确的频率含义直流DC系数 F(0, 0)位于矩阵的左上角代表原始块中所有像素值的平均值即图像块的基准亮度/颜色。这是最重要的系数通常数值最大承载了块中大部分的能量。交流AC系数 F(u, v), (u, v) \ne (0, 0)矩阵中其余的系数代表图像块在水平和垂直方向上的频率分量。靠近 F(0, 0) 的系数是低频系数代表块中平滑、缓慢变化的区域。远离 F(0, 0) 的系数是高频系数代表块中细节、纹理和边缘等快速变化的信息。3. 能量集中的体现由于残差块的大部分像素值接近于零经过 DCT 后能量会高度集中在 F(0, 0) 及其周围的少数低频 AC 系数上。这使得后续的量化可以高效地“砍掉”矩阵右下角高频的系数实现高压缩比。变换编码在不同标准中的演进随着视频编码标准的发展变换编码从简单的8×88 \times 88×8DCT 演进到更灵活、更高效的整数变换和多尺寸变换。1. H.264/AVC 中的整数变换Integer Transform问题标准的 DCT 涉及到浮点数运算会引入微小的反变换失配误差IDCT Mismatch。解决方案H.264 引入了整数变换用整数运算来近似 4 * 4 或 8 * 8 的 DCT消除了 IDCT 失配问题并简化了硬件实现。特点H.264 主要使用4 * 4 块的整数变换这种小尺寸的变换可以更好地适应复杂的、非平滑的残差信号。对于色度Chroma分量它使用 2 * 2 的变换。2. H.265/HEVC 中的多尺寸变换Multi-size Transform为了追求更高的压缩效率H.265/HEVC 进行了显著改进变换单元Transform Unit, TU引入了灵活的变换单元概念尺寸不再固定。TU 的尺寸可以从最小的 4 * 4 扩展到8 * 8、 16 * 16 甚至 32 * 32。动态选择编码器会根据编码树单元Coding Tree Unit, CTU的划分和残差块的特性动态选择最合适的 TU 尺寸。例如对于平坦区域使用 32 * 32 变换可以更好地集中能量对于细节丰富的区域则使用 4 * 4 变换以避免过多引入振铃效应。离散正弦变换DST除了 DCT-II标准的 DCTHEVC 还引入了**离散正弦变换Discrete Sine Transform, DST**用于 4 * 4 块的帧内编码残差因为实验证明 DST 在处理帧内残差时能提供略微更好的能量集中效果。3. H.266/VVC 中的进一步优化多模式变换Multiple Transform Set, MTSVVC 进一步扩展了可用的变换种类并允许对同一个块的不同子块使用不同的变换。非分离变换Non-Separable Transform对于 4 * 4 块VVC 引入了非分离变换进一步优化了低频分量的编码效率。低频补偿VVC 还包含了一些机制来补偿变换编码对低频DC系数造成的损失。变换编码与量化的协同作用变换编码只是压缩的准备阶段真正的有损压缩是在**量化Quantization**阶段完成的两者紧密配合。1. 量化过程量化就是对变换后的系数 F(u, v) 进行除法和取整操作其中 Q 是量化步长Quantization Step Size其大小由量化参数QP决定。2. 协同效果低频系数F(0, 0) 和相邻的低频 AC 系数数值大即使被 Q 除后取整其结果 F(u, v) 仍然是非零的这部分信息得以保留保证了图像的基本结构。高频系数高频 AC 系数数值小经过除以 Q 后大部分会被量化为零。Z字形扫描Zig-Zag Scanning量化后的系数矩阵通常采用Z字形扫描转换为一维序列。由于能量集中这个序列的开头是重要的非零系数而结尾则是一长串的零。3. 熵编码增益Z字形扫描和量化操作后产生的序列其特点是前面是非零系数后面是大量的零。这种序列结构非常适合进行熵编码Entropy Coding如霍夫曼编码或算术编码CABAC/CAVLC从而实现无损压缩最终达到视频压缩的整体目标。总结变换编码是视频压缩流水线中不可或缺的组成部分它通过以下步骤实现了空间冗余的有效消除数据转换将空间域的残差信号通过数学变换主要是 DCT 或其整数近似映射到频率域。能量集中利用自然图像信号的特性将大部分信号能量集中在少数低频系数上。配合量化为后续的有损量化阶段创造条件使得编码器能够高效地丢弃视觉上不重要的高频信息将它们量化为零。序列优化通过 Z字形扫描将量化后的稀疏矩阵转化为利于熵编码的高效序列。