第一代电视 --- 黑白电视第二代电视 --- 彩色电视第三代电视 --- 数字电视

• 第一代电视第一代电视 ------ 黑白电视黑白电视• 第二代电视第二代电视 ------ 彩色电视彩色电视• 第三代电视第三代电视 ------ 数字电视数字电视

电视技术发展的三个阶段电视技术发展的三个阶段绪论

从模拟电视走向数字电视是电视技术发展的必然趋势！

21 世纪是一个信息化、网络化、数字化的时代

• 从模拟电视走向数字电视具有深远的影响

• 第一阶段：通过大力推广数字电视机顶盒，实现“整体转换” • 第二阶段：推广标准清晰度数字电视，直接收看数字化处理后的电视节目。• 第三阶段：推广高清晰度数字电视，直接收看高质量的数字电视节目。

• 从模拟电视到数字电视需要一个较长的渐进过程

数字电视基础知识

第一篇

第一章

　数字电视信号的形成

本章主要内容• 1.1 数字信号的技术优势 • 1.2 数字电视广播系统概述• 1.3 模拟图像信号的数字化• 1.4 信源压缩编码概述• 1.5 帧内压缩编码技术• 1.6 帧间压缩编码技术• 1.7 视频基本流的形成• 1.8 音频信号的压缩编码及音频基本流的形成• 1.9 MPEG-2 的节目流和传输流• 1.10 信源编码设备及信源编码新技术

• 1.1.1 数字“电视”的概念• 1.1.2 数字信号的技术优势• 1.1.3 由模拟电视用户转换成数字电视用户的变化

1.1 数字信号的技术优势

1.1.1 数字“电视”的概念 • “电视”这个源于模拟时代的命名，从内涵到外延都将

发生很大的变化，使“电视”的用途由单一性向多元化发展，并催生多种数字新媒体传送形式的诞生。从而满足人们多样化、专业化和个性化的需求。这对于每个家庭、整个社会，乃至国家信息化进程都将产生深远的影响。

• 数字电视系统除提供数字化广播电视节目的制作、传输与显示这一基本功能外，还可提供视频点播、数据广播、远程教学、远程医疗、网上购物等多种功能，从而使这一系统最终演变成一个具有多种功能的综合信息系统，成为一个端到端的数字信号交互平台。此时的“电视机” 将逐步演变成一种家庭多媒体信息终端。

“ 电视机” 在未来数字家庭中的位置

1.1.2 数字信号的技术优势

• 1 。数字信号抗干扰能力强、电视图像清晰、伴音效果好。

• 2 ．数字信号的传输功耗低、可靠性高，可避免系统的非线性失真。

• 3 ．数字信号频谱资源利用率高。• 4 ．数字化可实现多种业务的动态组合。• 5 ．数字化从根本上解决图像信息在存储和复制中出

现的各种技术问题。• 6 ．数字化促进了电视技术与计算机技术和现代通信

技术的融合。

1.1.3 由模拟转数字后电视用户的变化

• 目前，数字电视带给用户的变化还主要体现在以下三个方面：

• （ 1 ）节目数量的变化。一般可达 100 ～ 150 套，最多可达 500 多套。

• （ 2 ）节目质量的变化。在长距离传输后可保持信噪比基本不变，接收端的图像质量与发射前端一样清晰，画面完美无损。

• （ 3 ）收视方式的变化。逐步开展多种交互业务，开始改变 “你播我看”的收视习惯。

• 1.2.1 数字电视广播系统• 1.2.2 SDTV (标准清晰度数字电视 ) 及 ITU-R

601 号建议• 1.2.3 HDTV ( 高清晰度数字电视 ) 及国标 GY/T

155-2000

1.2 数字电视广播系统概述

1.2.1 数字电视广播系统

数字电视广播系统与模拟电视广播系统的基本模式是相同的，如图所示：仍然可以分为三大部分 , 即电视信号的形成和发送部分、电视信号的传输部分、电视信号的接收及终端显示部分。但是，数字电视广播系统毕竟有其自身的特点，这三大部分分别被称为信源、信道和信宿。

数字电视广播系统示意图（局部）

信源（数字电视前端系统）

信道（传输系统）

信宿（接收端）

　　 a. 信号源信号源泛指需要通过网络传输的各种信息的输入端，这些信息可以是图像、声音、文字、数据等。其中包括本地制作的各种专题节目信号、原有的各种模拟电视节目信号、卫星节目信号、广播信号、通过网络及其他各种输入方式得到的电视节目信号、股票信息、天气预报信息等。

　　它由信号源，编码器和调制器三

大部分构成，代表了信号输入、信号

处理和信号输出三大工作步骤。

1. 信源（发送端）

　　信源编码即数字信号的压缩编码，其主要目的是压缩信源符号的数码总量，即在保证信源信息质量的前提下，尽可能地压缩每个信源符号的平均比特数，同时对信息进行加扰处理；信道编码可简称为纠错编码，其主要目的是提高信息传输的可靠性，并在保证可靠性的同时，兼顾传输效率。

　　 b. 编码器

编码器是数字电视前端系统中最

核心的部分，即信号处理部分，包括

信源编码和信道编码。


　　 c. 调制器

调制器是输出电视信号的设备，

即信号输出部分，其主要功能是将已

经处理好的数字信号变成传输网络所

需要的信号格式，从而实现与不同信

道之间的良好匹配，安全高效地将数

字信号传输出去。


　　 d. 时钟和同步信息

由于数字广播电视系统中传输的

是码流，是一串一串按节拍发送的脉冲，

为了保证这些数字信号经传输后能正确

地恢复所传信息，必须在传输过程中始

终保持这些脉冲串在时间和位置上的准

确性，也就是说整个系统必须有统一的

“时钟”来控制节拍，从而保证工作过

程中接收端与发送端节奏统一，步调一

致，信息传输准确无误。


　　采用不同的传输信道，就会有不同的传输特性，需要采用不同的信道编码和调制技术。

　　信道是指传输信息的通道 ( 包括

信息的载体 ) 。信道一般分为两大类：

一类为有线信道，如光纤、同轴电缆、

五类线、双绞线等：另一类为无线信

道，即以电磁波的形式在大气层、外

层空间及海洋中传播。

2. 信道（传输系统）

　　信宿是指所

传信息的终点或

对象，即这些数

字信号或数据的

最后归宿。可具

体到接收或存储

这些信息的机器、

设备或人，也可

以泛指接收端。

3. 信宿（接收端）

1.2.2 SDTV (标准清晰度数字电视 ) 及 ITU-R 601 号建议

• SDTV是标准清晰度数字电视的简称，标准清晰度数字电视又可称为常规清晰度数字电视或普通清晰度数字电视，此类数字电视在终端显示时所能呈现的清晰度与目前普遍使用的模拟电视机比较接近。

• 此类数字电视的许多重要参数是在 1982年 2月的CCIR( 国际无线电资询委员会 )第 15次全会上确定下来的，称为 CCIR-601建议书或演播室数字电视分量编码标准，以后又做了一些修改和补充，改称为 ITU-R 601建议书。

　　这样就可以将模拟时代大量制作的电视节目通过数字化处理，转换成统一的、标准化的数字电视节目。

　标准清晰度数字电视的扫描格式：

25帧 /秒、 625 行 /帧；

30帧 /秒、 525 行 /帧。原模拟电视系统中最主要的两大类

扫描格式在数字电视中均被保留下来。

　

SDTV ( 标准清晰度数字电视 )

　　我国在近期颁布的技术规范中对 SDTV 电视机定义了 4条标准，其中特别强调指出：能解码、显示 720×576 I(隔行 )／ 50Hz 图像格式的视频信号；主观评价的图像质量与 PAL-D 模拟电视机相当。

基本参数 NTSC PAL

扫描方法隔行扫描隔行扫描

帧频 /场频 30 Hz/60 Hz 25 Hz/50 Hz扫描行数 525 625

行频 15.734 KHz 15.625 KHz可见行数 483 575传输带宽 6 MHz 8 MHz

模拟电视信号的基本参数

ITU-R 601建议 (演播室数字电视分量编码标准 ) 的主要参数

参数 25 帧 / 秒、 625 行 / 帧 30 帧 / 秒、 525 行 / 帧

编码信号亮度信号 Y 色差信号 R-Y 、 B-Y

全行样点数

亮度信号 864 858

每种色差信号 432 429

数字有效行样点数

亮度信号统一为 720 个

每种色差信号统一为 360 个

取样结构

正交，按行、场、帧重复，每行中 R-Y 、 B-Y 的样点同位置，并与每行第奇数个亮度信号的取样点同位置

取样频率

亮度信号 13.5MHz

色差信号 6.75 MHz

编码方式亮度和色差信号都进行均匀量化，每个样值为 8bit 量化。

视频图像信号电平与量化电平级之间的对

应关系

亮度信号

共 220 个量化级（ 16 ～ 235 ），码电平 16 对应黑电平的极限；码电平 235 对应峰值白电平

色差信号

共 225 个量化级（ 16 ～ 240 ），负峰值与黑电平齐平；正峰值 240 ；零电平对应 128 量化级

同步 0 和 255 量化级保留

1.2.3 HDTV ( 高清晰度数字电视 ) 及国标 GY/T 155-2000

• HDTV是高清晰度数字电视的缩写，代表着未来电视技术的发展方向。

• 我国近期颁布的技术规范中对 HDTV 电视机定义了 6条标准，其中特别强调指出：要求此类电视机能解码、显示 1920×1080I(隔行 )／ 50 Hz或更高图像格式的视频信号；显示图像的清晰度必须在水平和垂直方向上均大于等于 720 电视线；所显图像的宽高比为 16 ： 9 。

我国 HDTV 节目制作及交换用视频参数值的主要内容参数参数值

扫描格式 25 帧 / 秒、 1125 行 / 帧

行频 28125 Hz

编码信号 R 、 G 、 B 或亮度信号 Y 和色差信号 R-Y 、 B-Y

全行总样点数

R 、 G 、 B 、 Y 2640

R-Y 、 B-Y 1320

数字有效行样点数 R 、 G 、 B 、 Y 1920

R-Y 、 B-Y 960

取样结构

正交，行和帧扫描位置重复。 R-Y 、 B-Y 的取样点重合，并与亮度信号取样点隔点重合 ( 第 1 个有效色差样点与第 1 个有效亮度样点重合 )

取样频率

R 、 G 、 B 、 Y 74.25 MHz

色差信号 37.125 MHz

标称信号带宽

Y 30 MHz

R-Y 、 B-Y 15 MHz

编码方式均匀量化，每个样值为 8bit 量化或 10bit 量化。

量化电平 8 bit 量化 10 bit 量化

视频数据 1 ～ 254 量化级 4 ～ 1019 量化级

同步基准 0 和 255 量化级 0 ～ 3 和 1020 ～ 1023 量化级

R 、 G 、 B 、 Y 黑电平 16 对应黑电平的极限 64 对应黑电平的极限

R 、 G 、 B 、 Y 标称峰值电平码电平 235 对应峰值白电平码电平 940 对应峰值白电平

R-Y 、 B-Y 消隐电平 128 量化级 512 量化级

R-Y 、 B-Y 标称峰值电平 16 和 240 64 和 960

• 1.3.1 图像信号的取样• 1.3.2 图像信号的量化• 1.3.3 数字化图像信号的编码

1.3 模拟图像信号的数字化

模拟电视节目的数字化处理

• 模拟电视节目的数字化处理，包括视频图像信号和音频伴音信号的数字化处理，如图所示。

模拟图像信号数字化的处理的主要过程

• 模拟图像信号的数字化处理过程主要包括三个重

点环节：• a.取样• b. 量化• c. 编码

2

3

4

5

6

7

1t

1.3.1 图像信号的取样

• 取样也可称为采样或抽样，是指按周期性的时间间隔 T抽取模拟信号瞬时幅度值的过程，其目的是获取该模拟信号连续变化的一系列取样值（简称为样值）。

• 经过取样的模拟信号变成为时间离散、而幅度大小仍对应模拟信号相应时刻瞬时值的一系列窄脉冲，称为脉冲幅度调制(PAM) 信号，它们仍然属于模拟信号。

• 取样的实质仅仅是将模拟信号在时间域上实现离散。

2

3

4

5

6

7

1t

取样频率和取样定理

• 相邻两次取样间的历时称为取样周期，用 T表示；每秒含有的取样周期称为取样频率。为了保证原模拟信号所表示的全部信息在取样过程中不被丢失，要求取样时的取样周期 T应小于或等于原信号中变化最快的成分变化周期的 1/2 ，即取样频率应等于或大于被处理信号的最高频率的 2倍，该规定称为取样定理。

2

3

4

5

6

7

1t

SDTV 和 HDTV 的取样频率

• 无论什么制式，制作成标准清晰度数字电视节目时，每一有效电视行的亮度信号取样点统一为 720 个；取样频率统一为 13.5MHz 。

• 在制作新的高清晰度数字电视节目时，要保证正程数字有效行的样点数达到 1920 个；按照所显图像 16 ： 9 的宽高比，垂直方向上应为 1080行。此时取样频率高达 74.25 MHz 。。

色差信号的取样频率及取样结构

• 每个色差信号的取样频率规定为亮度信号取样频率的 1/4或 1/2 ，分别为 3.375 MHz或 6.75 MHz ，选择哪一种取决于取样结构。所谓取样格式是指亮度信号与两个色差信号的取样比例与排列方式，常规清晰度的普通质量数字电视节目信号亮色比为 4 2 0(∶ ∶ 或称为4 1 1∶ ∶ 的取样结构 ) ，如示意图 (a)所示；演播室质量标准的数字电视应采用 4 2 2∶ ∶ 的取样结构，如示意图 (b)所示。

1.3.2 图像信号的量化• 量化的实质是对模拟信号实施进

一步的离散化处理，是将精确取样得到的脉冲幅度调制信号变换为取值域 (振幅 ) 上离散值的操作过程。

• 主要的操作步骤：首先确定量化精度，图中仅为纵轴方向上的0 ～ 7级，共 8 个量化电平值；然后采用四舍五入的方法，将原来连续变化的模拟信号变换成一串不等幅的脉冲，如图所示，每一个脉冲都可对应 0 ～ 7 中的某一量化数值。 1

2

6

4

3

5

7

量化级数与量化比特数

• 显然，量化级数越多，量化精度越高，图像在亮度或色度上非常微小的变化都能被精确地量化出来，此时传送的图像质量越好。

• 在数字电视系统中对于图像信号的量化要求：亮度信号的最高量化级数可以达到 256级 ( 每样值采用 8 bit 量化 ) ，最低 0级，编码为 00000000；最高是第 255级，编码为 11111111 。此量化精度是很高的，传送的图像质量也很好。

1

2

6

4

3

5

7

1.3.3 数字化图像信号的编码• 所谓编码是指将量化后的样值变换成二

进制或多进制代码的过程。• 经取样、量化后的信号还不是数字信号，

还需要将这些取样值转换成表示其量化电平的一串数码 ( 最终将用一组脉冲电码来表示 ) ，这才算是完成了由模拟信号转换成数字信号的全过程。

• 如果用右图来说明，图最下方表示每一个脉冲幅值的二进制码 001 、 010 、 011…顺序排列而组成的数字信息码流才是编码的结果。

• 在接收端，按接收到的符号串还原成具有对应高度的脉冲，重新组成原来的样值序列，再经过低通滤波器恢复成原来的模拟图像信号，这一过程称为解码。很显然解码是编码的逆过程。

解码

亮度、色度信号的量化级分配及相应的二进制编码

• 1.4.1 数码压缩的必要性• 1.4.2 信源压缩编码的目的性和可能性• 1.4.3飞速发展的压缩编码技术

1.4 信源压缩编码概述

1.4.1 数码压缩的必要性• 模拟视频图像信号经数字化处理后的数码量非常大，要将数

字图像一帧一帧地在信道中传输，需要占用很大的信道宽度。• 以一路普通质量的数字电视播出信号为例，亮度信号和两个色差信号的取样频率之和是 20.25 MHz(13.5MHz+3.375 MHz×2) ，均用 8 bit 量化，每秒钟必须传输的码率为： 20.25 MHz×8 bit = 162 M bit/s 。需占用的信道带宽，是现有模拟电视带宽的 10倍多。

• 如果传输的是高清数字电视节目，亮度信号和两个色差信号的取样频率之和是 148.5 MHz(74.255MHz+37.125 MHz×2) ，均用 10bit 量化，每秒钟必须传输的码率将达到： 1485 M bit/s 。需占用非常大的信道带宽。

• 因此，必须压缩信源符号的数码总量，简称信源压缩编码，这是数字电视走向实用的关键！

1.4.2 信源压缩编码的目的性和可能性• 从信息论的观点来看，不论是图像还是伴音均作为一个信源。而描述信源的数据包括两个部分：信息量 ( 信源熵 ) 和信息冗余量，可用下面的公式表示。

• 信源数据 = 信息量（信源熵） + 冗余量• 信源压缩编码的目的是在正确携带所有信息的前提下 ( 保证接收端信源解码后能够得到特定服务需要的图像及声音质量 ) ，通过符号重组 (或称再编码 ) ，删除原始编码信号中自然存在的冗余量，以达到用尽可能少的数码来传输信息的目的。

举例说明信源压缩编码的可能性• 此彩图表示一帧视频图像，这种一帧一帧的视频图像常常可

以看成是由许多大的图块组成，如图中的天空、草地、红墙、钟亭、汽车等，描述这些物体的每个像素绝不是独立存在的，图块内相邻像素、相邻行常常是用来表示同一物体的不同空间部位，它们具有完全相同或非常相似的亮度和色度信息，因而描述这些像素信息的数据就有可能会不断重复地在信道中传输，而浪费了信道资源。

举例说明信源压缩编码的可能性• 下面的彩图为 6 帧相对连续的图像，这是某电视剧中的一组画面，拍摄一辆小客车驶过钟亭的场景，我们每 10 帧截图一次，从第一帧到第六帧实际拍摄时共用了 50 帧，它们反映了电视中活动场景的拍摄过程及视频图像中相邻帧间的大量重复信息。因为这些镜头常常是用来表示同一事件在不同瞬间的画面，它们具有完全相同或非常相似的背景和移动物体，因而描述这些背景和移动物体的数据就有可能会按一定的周期在信道中重复地传输，这也是对信道资源的浪费。

举例说明信源压缩编码的可能性

信源压缩编码可能性小结• 当我们对各种同类型的彩色电视节目图像进行综合分析后发现，在间隔一帧的时间内：

• 只有平均 7.5%左右的像素产生了亮度信息的变化。

• 只有平均 6.5%左右的像素产生了色度信息的变化。

• 也就是说，大约 90% 以上的像素既无色度信息的变化，也无亮度信息的变化，它们可以作为时间冗余量或空间冗余量而予以压缩。

部分数字图像信号压缩编码前、后的对照

• 人们不断探索压缩数字图像信号冗余量的新方法，从而使传输数字图像信息时需要的码率越来越少。表 1-3列出了几种常用的数字图像信号压缩编码前后码率的变化，由原始码率和经压缩后码率的比较可以看到，压缩编码前、后的变化量是非常大的。

表 1‑3 数字图像信号压缩编码前、后对照表应用种类比特数 / 像素清晰度亮色比原始码率压缩后的码率质量

高清数字电视 10 1920×1080×25 4:2:0 1.11Gbit/s 20～ 25Mbit/s 优标清数字电视 8 720×576×25 4:2:0 162Mbit/s 3～ 8 Mbit/s 良VCD录像节目 8 352×288×25 4:2:0 20Mbit/s 1～ 2 Mbit/s 中

可视电话 8 176×144×15 4:2:0 3 Mbit/s 20 Kbit/s 差

1.4.3飞速发展的压缩编码技术• 信源数码压缩是使数字电视走向实用的关键技术之一，几十年的研究探索使信源压缩编码技术得到了飞速的发展：

• 1.按照接收端解码后信号的信息量是否与发送端原信号的信息量完全一致来分类(1) 无损压缩编码 (又称为可逆压缩编码 ) (2) 有损压缩编码 (又称为不可逆压缩编码 )

• 2.按照视频压缩编码器处理的像素分布范围来分类(1) 帧内压缩编码 (2) 帧间压缩编码

• 3. 视频压缩的其他分类方法图像预测编码，图像变换编码，统计编码 ( 包括霍夫曼可变长度编码、行程编码、算术编码 ) 及量化编码 ( 包括矢量量化编码、自适应量化编码 ) 等，

• 压缩编码技术所不断追求的是：压缩比大、执行速度快、图像精度高。

1.5.1相关技术标准— JPEG标准1.5.2游程编码、差分编码和统计编码1.5.3 数字图像的“块”结构及 DCT变换

1.5 帧内压缩编码技术

1.5.1 相关技术标准— JPEG标准• JPEG标准是 JPEG(联合图像专家组 ) 主要针对静止图像压

缩、存储而制定的系列标准。标准涉及到的关键技术有：游程编码、差分编码、离散余弦变换和霍夫曼可变长度编码等。

• 经过压缩编码后的图像称为“帧内编码图像”或称其为“ I帧”，其压缩效果与图像内容有较大的关系：

• 对于中等复杂程度的彩色图像，其压缩比与解码后还原图像质量的关系大致如表 1-4所示。

表 1‑4 JPEG 编码压缩比与图像质量的关系

压缩比图像质量

32～ 16 较好，满足某些应用16～ 11 好，满足多数应用11～ 5.3 很好，满足绝大多数应用5.3～ 4 接近原始图像

1.5.2游程编码、差分编码和统计编码1.游程编码

如果图中一连串的像素具有完全相同的幅值，这时原始编码的数据流中会有大量重复出现的字符串，这时可以只传输起始像素点的值和这一串取相同值的像素点的个数，串的长度就称为游程，此编码方法称为游程编码。

2.差分编码 (差值编码 ) 如果同一行中相邻像素点的幅值不完全相同，但比较相近，也可

不直接传输每一个像素的幅值，在传输了第一个像素点的值后，发送端仅传送当前样值和前一样值相减所得的差值，而接收端将收到的差值与前一个样值相加即可得到当前样值，即采用差值进行编码。

3. 统计编码统计编码基本原理是对信源中出现概率大的符号赋予短码，对出

现概率小的符号赋予长码，从而在统计上获得较短的平均码长。

1.5.3 数字图像的“块”结构及 DCT 变换• 1. 图像分割成“块”按照 JPEG 图像压缩编码标准的规定，无论是亮度信号还是色度信号均要按照 ITU-R 601 建议书中 4:2:2 的取样格式取样，取样后必须先将其划分成由 8×8 个像素信息组成的像“块”，然后进行 DCT 变换。于是由 64 个像素值所组成的像“块”就成了数字电视系统中一个非常重要的概念，它是 DCT 变换的基本单位，也就是进行压缩编码的基本单位，所以有时将其称为数字电视系统中的“基本图像”。

• 标准还规定：每个像块只能包含一种类型的像素信息，即该像块或者是亮度块，或者是色度块，我们通过后一幅彩图对数字图像的“块”结构进行分析。

彩色图像分割成块的示意图此时整幅图像由 720×576 个像素组成，按规定每个像素均取亮度信息，则每个像块由 8×8 个像素组成，应分割成 90×72=6480块。

每个色差信号的取样点数均是亮度信号取样点数的一半，因此，两个色差信号的像块数也都只有亮度像块数的一半，即两个色差信息的像块数均为 45×72=3240块。

2. 以“块”为单位的二维数据矩阵若任意取出其中的一个像块进行分析 (假设为亮度块 ) ，则每块均由 8×8 个像素的亮度信息组成，

3.DCT 变换• DCT是一种频率域分解技术，所谓“变换”，是指将被处理的数据按照某一种变换规则映射到另一个域中去处理。

• DCT 变换是以离散余弦函数作为变换的基函数，将块内数据的二维空间矩阵变换为代表不同频率分量的空间频率矩阵，有利于压缩码率。整个 DCT 变换在 DCT 编码器中进行，运算过程非常复杂，不必深究，下面仅通过如图 1-7所示的变换实例了解其主要过程和压缩结果。

图 1‑7 某像“块” DCT 变换实例

1.6.1相关技术标准—MPEG-2标准1.6.2 帧间预测编码1.6.3 MPEG-2 的帧间编码结构1.6.4 MPEG-2 中多种压缩编码技术的综合应用

1.6 帧间压缩编码技术

1.6.1 相关技术标准—MPEG-2标准 MPEG标准是MPEG(运动图像专家组 )针对运动图像及其伴音而制定的一系列通用压缩编码标准。

其中 MPEG-2 专门针对数字电视 (包括标清数字电视和高清数字电视 ) 信源编码而制定了一系列技术规范，详细规定了数字电视图像的类和级、数据流格式、码流的打包和复用等，从而成为数字电视广播信源编码的核心技术与标准，并被世界各国广泛认可。

MPEG-2标准MPEG-2 的动态图像压缩编码方案中主要采用了以下压缩编码技术：首先采用有运动补偿的帧间预测编码技术，消除视频图像

中的时间冗余量和不随时间变化的图像细节；然后采用 DCT 变换和非线性量化消除视频图像中的空间冗余和视觉冗余信息；

最后再运用统计编码的基本原理，重新按产生的概率分配比特数，实现可变长编码，其主要的方框结构如图 1-9所示，从而使比特数减少到理论上的最小值。

图 1‑9 MPEG-2 压缩编码方框结构图

1.6.2帧间预测编码

• 帧间预测编码又称运动补偿预测编码，是用于压缩视频图像序列各帧之间重复信息( 时间冗余信息 ) 的编码压缩技术，是应用很广的实用编码技术之一。

• 现以彩图 2 和简化后得到的示意图为例，简要说明其压缩原理：

帧间预测编码示意图

• 从车子驶入到经过钟亭的 50 帧画面里，大面积的背景几乎可以看成是相对静止的部分；

• 画面中变化的只是运动的汽车，即使是运动的部分，也可以看成是简单的平移而予以估计和预测。

• 动态图像以 25 帧 /s 的速度播放，在如此短的时间内，帧间画面通常不会有大的变化。

运动补偿预测过程示意图（ 1 ）

• 在进行信源编码时，不必将每一帧都作为独立的实体进行编码，而仅仅是将帧间的差异之处进行编码（即与汽车有关的像块）。

运动补偿预测过程示意图（ 2 ）• 编码时，先将图像分解成规定大小的块，通过搜索和“提取

技术”找出画面中是哪些部分在运动，并计算出运动矢量（即运动方向和运动速度），就可从前一帧图像估计出连续的几帧画面。发送端在发送完最初一帧完整的图像后，紧接着的几帧图像就只发送运动物体 (如飞机 ) 的运动矢量，而接收端在解码时即可根据最初的一帧图像和运动物体的帧间运动矢量再生出后面的几帧画面，即通过帧间运动估计和运动补偿完成随后各帧。

1.6.3 MPEG-2 的帧间编码结构• 为了在高效压缩编码的条件下、获得可随机存取的高质量图像， MPEG定义了图像组中的 3 种图像帧，简称 I帧、 P 帧和 B 帧，规定了它们的时间间隔和帧序列。

I IB B P B B P B B P B B P B B

前向预测前向预测双向预测双向预测前向预测前向预测

时间时间

例例 GOP:GOP:N=15N=15M=3M=3

MPEG-2 的帧间编码结构1 。 I 帧 ( 帧内编码图像 )

I帧是靠尽可能去除图像空间冗余信息来压缩传输数据量的帧内编码图像，是不需要基准图像的编码帧，它的作用之一就是为随机进入编码图像序列提供切入点，由图可知每个图像组均以一个 I帧开始。

2 。 P 帧 ( 前向预测编码图像 ) P帧又称预测编码图，它是从 I帧或最近的一个过去帧进行运动预测补偿产生的图像。

它的作用是通过充分压缩前面已编码帧的时间冗余信息达到压缩该帧数据量的目的。显然， P帧比 I帧的压缩效率高，而且可作为参考帧。

3 。 B 帧 (双向预测编码图像 ) 它是既以前面的 I帧或 P帧为基准，同时又以后面的 P帧或 I帧为参考而进行运动预测补偿所产生的图像，所以称其为平均值预测编码图。尽管 B帧的压缩效率最高，但由于其不能作为参考帧，所以不能在图像组中出现过多的连续 B帧。

I-Picture P-PictureB-Picture B-Picture

1.6.4 MPEG-2 中多种压缩编码技术的综合应用• MPEG-2是多种压缩编码技术的综合应用，现仅简单介绍了其中最重要的部分，由

于它在目前国产的各种数字电视机顶盒中被广泛采用，所以将其作为重点介绍。• MPEG-2 压缩编码技术的要点，它不是对图像本身编码，而是对图像相关信息编码，特别要注意以下关键步骤：

• 图像中的变化• 图像中物体的运动• 用数学方式描述这些变化和变动

• 没有计算机技术的高速发展就没有数字电视的今天， MPEG-2 压缩编码算法如下图所示：采用运动估计和运动补偿编码去除时间冗余度，每秒钟要进行 160亿次的算术运算；采用 DCT 变换和游程长度编码去除空间冗余度，每秒钟要进行 20亿次的算术运算；采用可变长度编码去除静态 ( 比特结构 )冗余度，需要进行概率的统计，并重新根据概率逆序分配编码的比特数，同样需要进行大量运算。

• 1.7.1 图像的分割及视频基本码流的分层• 1.7.2 MPEG-2 视频基本码流中各层的定义及功能

• 1.7.3 MPEG-2 视频压缩编码中的类和级

MPEG-2是一组用于视、音频压缩编码及数据流格式的国际标准，该标准不仅规范了图像和伴音数据的压缩编码技术，还定义了各种编码数据流的传输协议，从而为传输和交换这些编码数据流 (比特流、码流、流 )创造了统一的条件，本节将重点讨论其中视频基本流形成的有关问题。

1.7 视频基本流的形成

1.7.1 图像的分割及视频基本码流的分层• 所谓基本流：是指只包含一个信源经过编码器后的数据流，常用 ES表示。如视频图像数字化后的数据，经过视频编码器压缩编码后的数据流

就称为视频基本流，可以用 ESV 表示；音频伴音数字化后的数据，经过音频编码器压缩编码后的数据流就

称为音频基本流，可以用 ESA 表示。 • 一幅一幅的电视画面经过数字化处理后转换成了一串一串

的数据码流，这些数据码流与电视图像的特定栅格之间具有一定的对应关系，只有严格的遵循这种对应关系，当其传输到接收端时才能重新组成图像。 MPEG-2 在组织编排视频数据码流时采用了分层的结构形式，每一层数据码流都与分割后的图像特定部位有严格的对应关系，如示意图 1-14所示。

图 1‑14 视频基本码流的层次结构及与图像之间对应关系示意图

1.7.1 图像的分割及视频基本码流的分层• 视频基本码流：

在由像素逐层向上构建图像的同时，表征这些像素信息的视频数据也按照规定的格式逐层向上构建起视频数据码流，将其称为视频基本码流，用 ES 表示。

• “数据头”和净载数据：在构建视频基本码流的这 6层数据中，除了最基础的像块数据层外，

其他 5层均以“数据头”或“附加数据”作为本层的起始，随后才是表征图像信息的数据，是需要传输的主要内容，称为净载数据。

• “数据头”的重要性：这些“数据头”或“附加数据”对于整个视频基本码流的形成是非常重要的，凡是下层数据码流进入上一层数据码流时，都必须按照标准格式加上“数据头”或“附加数据”，明确标识由此开头的一串数据码流是从什么地方开始 ( 始码标志 ) 、原位于那一层、什么位置、采用什么编码类型、量化参数等，为整个系统中比特流的传输和数据码流的再建创造统一的条件，以利于接收端的图像重显。

视频基本码流的层次结构 1.“块”层2.“宏块”层3.“宏块条”层4.“ 图像”层5.“ 图像组”层6.“ 图像序列”层

基本码流的各层与图像之间的一对应关系

1.“块”层 • 任何一幅完整的彩色图像必须要先划分成若干亮度块和色度块，然后以“块”为单位进行数据处理。

• 无论是亮度块还是色度块，均由 8×8 个像素信息组成。 • 从数据的角度看，亮度块和色度块的数据结构是相同的，它们既可以是一个 8×8 的二维样值数据阵列或 DCT 系数阵列，也可以是一段压缩编码之后的一维数据流，从而构成了视频图像数据码流中最基本的单元，处于视频图像数据码流的最底层。

• 在一般情况下，块层的基本功能是传送经过 DCT 变换后的直流分量系数和交流分量系数，因此图中标注的数据信息内容为“本块编码所需全部 DCT 系数”。

2.“宏块”层 • 宏块是由 4 个亮度块

和一定数量的色度块组合而成的一组编码图像，作为运动估计和运动补偿的基本单位。

• 每个宏块都有准确的空间位置，同一宏块中的亮度块和色度块在“亮度分量的 16×16 样点区域内”占据同一空间，三种“宏块”在空间上的叠加关系如右图所示。

宏块层中数据码流的基本结构 • 宏块层中的数据码流由两大部分构成。位于包头部分的是附加

数据，包含表明宏块在宏块条层中位置的宏块编号、说明宏块编码方法及内容的宏块编码类型、量化参数及运动矢量等数据。

• 第二部分为净载数据，是宏块内所有像块的压缩编码数据，包含 16×16 样点区域内的全部亮度信息和色度信息，编码按图中①②③④⑤⑥⑦⑧…的顺序排列；这些像块在空间上的对应关系可参考图 1-15 。

3.“宏块条”层

• “宏块条” 是由同一水平行内连续的一串宏块构成，它的最小长度为一个宏块；最大长度为整幅图像的宽度（即一完整的水平像条）。 “宏块条层” 的数据码流仍然是由两大部分构成。

• 第一部分，位于前面起始部位，为附加数据，包含的信息有：该宏块条在整幅图像中的位置，默认的全局量化参数，变量优先切换点。提供以上信息的目的是保证解码器可在两个数据流的恰当点处切换，从而保证其完整无误地读取该像条解码信息，一旦某宏块条发生无法纠正的误差而导致图像出现块效应 (或称马赛克现象 ) 时，可立即跳至下一宏块条，并在下一宏块条实现正确解码和重新同步。第二部分才是净载数据，它是条内所有宏块经过下层“包装”后的压缩编码；

4.“ 图像”层

• 由一系列宏块条组成一幅完整的“图像”，图像可以按帧或场划分，它是一个独立的显示单位。在 MPEG-2 中，当图像序列是逐行扫描时，图像是逐帧压缩编码；但是当图像序列为隔行扫描时，图像可以逐帧压缩编码，也可以逐场压缩编码。帧压缩又可按照编码方式的不同分为 I 帧、 P 帧和 B 帧。

• 帧图像 ( 帧结构图像 )是一种编码图像，由数据头和一帧图像的全部编码信息组成。数据头中的基本部分有图像起始码，图像编码的时间基准，图像帧的类型 (I 、 B 、 P) ，视频缓存检验器延迟时间等；数据头扩展部分提供的信息有：图像编码扩展、图像显示扩展、图像空间分级扩展和图像时间分级扩展等重要信息。

5.“ 图像组”层

• 由相互间相关的一组 I 、 B 、 P 帧图像可组成一个“图像组”，在“图像组”中 I 帧总为第一帧。图像分组的目的是为了便于编辑和随机存取，不是MPEG-2结构组成的必要条件，可在分与不分之间灵活选择。

• 图像组层的码流仍然是分为两个部分，由数据头和组内各帧图像的全部编码信息组成。数据头标识了图像组起始码、编码类型、码表选择、视频磁带记录时间及控制码等，从而为视频数据流的编辑和随机存取提供了准确的信息。

6.“ 图像序列”层

• “图像序列”是指整个被处理的一系列连续图像，是由该层数据头及若干图像组全部数据组成的一个完整的视频基本码流，一个大型的数据包。

• 首先需要定义整个序列的结构是采用逐行扫描还是隔行扫描，然后在数据头中提供以下信息：该序列图像的宽高比、水平大小、垂直大小、量化矩阵、帧速率、码率、层号、分级法、视频缓存校验器的大小等，为该数据包的解码提供重要依据。

• 第二部分是该序列图像的全部编码信息。

1.7.3 MPEG-2 视频压缩编码中的类和级• 由于不同的应用场合对图像质量的要求不尽相同，如可视电话、会议电视、普通数字电视和高清晰度电视等不同质量的图像，对视频基本码流的码流结构，压缩比、传输速率及其他相关技术参数的要求也都各不相同。为此， MPEG-2 将压缩编码过程中的处理方法分成六大类型，针对各个类型中图像参数的不同要求又细分为四个等级，通过类型与等级的组合可以得到多种编码方案，采用多种编码工具，输出不同档次的视频基本码流，实现多种规格及多种清晰度的图像显示，从而适应不同的应用。

MPEG- 2 中的“类”和“级”及已经采用的组合

类型等级

简单类(SP)4:2:0无 B帧不分级

主类(MP)

4:2:0 有B帧

不分级

4:2:2类(MPEG-2 422

)4:2:2 有 B

帧不分级

信噪比可分级类(SNRP)

4:2:0 有 B帧

SNR 可分级

空间可分级类(SSP)

4:2:0 有 B帧

SNR 可分级空间可分级

高级类(HP)

4:2:0或 4:2: 2

有 B帧SNR 可分级空间可分级

高级（ HL ）1920×1080

MP @ HL80 Mbps

HP @ HL100 Mbps

高级（ H1440L ）

1440×1080

MP@H1440L

60 Mbps

SSP @ H1440L

60 Mbps

HP @ H 1440L80 Mbps

主级（ ML ）720×576

SP @ ML

15 Mbps

MP @ ML15 Mbps

4:2:2 @ ML50 Mbps

SNRP @ ML15 Mbps

HP @ ML20 Mbps

低级（ LL ）352×288

MP @ LL4 Mbps

SNRP @ LL4 Mbps

关于类型和等级的简要说明• 类型所规范的是亮色比 (色度信息取样格式 ) 、有无双向预测帧 B 和是否可分级等。横向从左向右数分别为简单类(SP) 、主类 (MP) 、信噪比可分级类 (SNRP) 、空间可分级类 (SSP) 和高级类 (HP) ，越向右类别越高，彩色空间分解力越高，数据流的可分级性越强，码流的编码越精细，进行数据处理的方法越复杂。

• 所谓“等级”是从图像清晰度 (分辨力 ) 的角度规范了参加运算的图像参数的取值范围和最大码率，如每帧图像的行数、每行的像素数、帧频等。纵向由下向上数分别为低级(LL) 、主级 (ML) 、高 1440级 (H1440L) 、高级 (HL)四个等级。越向上图像的清晰度越高，画面质量越好。

• 在表的纵、横交叉点上标出的是类和级的组合及此种组合状态下的最大码率，类和级的组合，常采用类和级的缩写来表示，表中的空格是尚未出现或不能出现的组合。

• 1.8.1 音频伴音信号压缩编码的必要性• 1.8.2 音频数字压缩编码的国际标准—MPEG-1 音频

• 1.8.3 AC-3 编码及 MPEG-2 音频

•视频图像信号经过数字化处理和压缩编码后形成了视频信号的基本码流可用 ESV 表示，但此时还不是完整的电视节目信号，因为此时还缺少伴音。伴音信号也需要先进行数字化处理，然后采用数字压缩的方法降低其中的冗余量，并丢掉声音信号中不能被人耳感觉到的部分，使伴音信息的传输码率降到最低，然后按照规定的格式形成音频基本流 ESA 。这正是本节要重点讨论的内容：

1.8 音频信号的压缩编码及音频基本流的形成

1.8.1 音频伴音信号压缩编码的必要性

游程编码

• 用数字方式记录和传输伴音有许多突出的优点：如抗噪声性能好、可增强音频的动态范围、可多次翻录而不会出现信号的衰减等。但是，数字伴音信号要占用一个很宽的传输带宽，以双声道立体声效果为例：若取样频率为 44.1 kHz ，量化精度为 16 bit ，其传输的数据率为：取样频率 × 量化比特数 ×声道数 = 44 。 100 kHz×16 bit×2 = 1411.2k bit/s 。此传输数据率已接近 1.5 M bit/s ，几乎是模拟伴音信号所需带宽的 60倍，所以对数字化的音频数据进行压缩是非常必须的。目前我国现有卫星和有线电视系统中采用的数字音频压缩编

码技术是遵循MPEG-1 音频标准，下面对其进行简要说明。

1.8.2 音频数字压缩编码的国际标准—MPEG-1 音频

• MPEG-1 音频是一个通用性很强的音频压缩编码标准，能够压缩任何人耳可听到的音频信号，在进行压缩编码时不对声音源的自然属性作任何限制。音频取样频率可以是 32 kHz 、 44.1 kHz或48 kHz ，经音频压缩编码器编码后的比特流称为音频基本码流，可支持单声道模式、双声道模式或立体声模式。

• 为针对不同的应用，在 MPEG-1 音频数字压缩编码标准中规定了三个不同层次的编码方案，如下表所示，目前数字电视系统中采用得最多的是层 II ，即最佳编码方案。

MPEG-1 音频压缩编码中的三个层次层号层 I 层 II 层 III

特征基本 ( 简单 )算法最佳编码滤波器组和熵编码联合应用

压缩比 1:3.6 1:5.6 1:11

较好质量下每声道数码率

192kbit/s 128kbit/s 64kbit/s

滤波器子频带编码子频带编码子频带编码 + 变换编码

频谱分辨率 32 个子频带 32 个子频带 32 个子频带、 18 个子频带

应用VCD

数字音频磁带音频广播、数字电视多媒体通信

低比特率信道上的 CD 质量音频通信、高质量的立

体声编码

1.8.3 AC-3 编码及 MPEG-2 音频1.AC-3 编码由美国杜比 (Dolby)公司开发的杜比 AC-3环绕立体声技术是一种高品质、多声道的数字音频压缩编码技术，它不仅能提供 CD 质量的音频，而且具有很高的压缩比，符合 ISO 对编码算法提出的要求，现已在高清晰度数字电视、数字音频广播、 DVD 及电影等领域中广泛应用。

杜比 AC-3环绕立体声技术的突出特点是将多声道作为一个整体进行编码，比单声道编码效率高，同时对各个声道内不同频带的信号采用不同的取样率进行量化，对噪声进行衰减或掩蔽，其结果是降低了数码率而音质损害很小。

AC-3 的 5.1 声道格式

• AC-3 的 5.1声道格式已作为高清晰度数字电视国际标准的重要组成部分，其电视伴音的输出可达到高保真家庭影院的效果。

• AC-3 5.1格式有 5 个基本声道 (3 向前 /2环绕 ) ，其理想的收视环境布置如右图所示。

•

理想的收视环境布置

1.8.3 AC-3 编码及 MPEG-2 音频2.MPEG-2 音频

MPEG-2 音频压缩编码标准于 1994年 11月获准通过成为新版的音频压缩编码国际标准，除能兼容 MPEG-1 音频压缩编码标准外，在以下几个方面进一步扩展：

（ 1 ）支持 5.1 声道格式。（ 2 ）支持多语种音频。 MPEG-2 的音频标准支持最多 7路附加解说声道。

（ 3 ）取样频率向下扩展。除原有的 32kHz 、 44.1kHz 和48kHz 外，其解说声道的取样频率可降为高保真声道取样频率的一半 (16KHz 、 22.O5KHz 及 24KHz) ，以降低数据率。

（ 4 ）更低的压缩音频码率。该标准支持低至 8 kbit/s 的音频压缩码率。

• 1.9.1 数字信号的打包与复用• 1.9.2打包基本流（ PES ）• 1.9.3 节目流（ PS ）• 1.9.4 传输流（ TS ）

视频图像信号和音频伴音信号经过压缩编码后应生成各自的基本流 ESV和 ESA ，但是仅有视、音频基本流 ESV 和 ESA还不能形成一套完整的数字电视节目信号，这两类码流需要合并成一个码流，并加入时间基准和许多重要的辅助数据才能真正构成可供传输的数字电视节目信号。

1.9 MPEG-2 的节目流和传输流

1.9.1 数字信号的打包与复用• 数字电视系统中多路信号混合均采用时分复用方式，视、

音频基本流及辅助数据均按所需频带被分配到复用的高速比特流的各传输时隙中，构成一路传送流进行传输。从时间上看，传送流中的原各路信号码流是按时间分隔的方式被轮流传送的。因此，称为时分复用或数字复用，其逆过程为数字解复用。

• 为了使接收端的解复用器能够正确地从复用信息流中分离出原来的各路信息，以便进行相应的解码处理，要求发送端在复用前先要按照特定格式对进入复用器的信息流进行打包 ( 此为通俗说法，实为数据分组 ) ，即通过打包器对原来已经编排好了的基本码流重新分割并重新“包装”，使其生成一个一个的“数据包”。

关于“数据包”的简要说明 • 数据包应由包头和净载数据两大部分构成：净载数据是包内编码数据流的主体，承载着需要传输的主要信息；包头 (又称数据头 ) 对于数据包的传输是至关重要的，因为包头的格式

和内容是发送端和接收端特别约定的，包头数据中不仅要有起始码标志，时间标志，还必须附加许多重要的标识信息，标明该数据包内承载信息的属性 ( 原所属数据流的性质及序号 ) 、采用的编码类型、量化参数、包长等，为各数据流的同步和重组奠定基础。

• 多路复用的数据流还可以再次复用，再次打包。即几个小数据包可以打包成一个大一点的数据包，几个大一点的数据包又可再次打包组成一个更大一点的数据包，但是每打包一次都需要重新加上包头，重新进行附加信息的标识，为整个系统中比特流的传输，交换和数据码流的多次再建创造统一的条件。

• MPEG-2 系统编码器在进行打包、复用时，不仅采用了 PES 、PS 和 TS 三种数据包，而且定义了节目流 (PS) 和传输流 (TS) ，其打包、复用的主要过程如下图所示。

MPEG-2 基本码流的打包与复用系统框图

1.9.2打包基本流（ PES ）• 视频数据经过视频编码器后输出视频基本流 ESV；音频数

据经过音频编码器后输出音频基本流 ESA。它们经过各自的打包器生成按先后顺序组成的视频或音频的包序列称为打包基本流 PESV或 PESA。

1.9.3 节目流（ PS ）• 节目流 (PS) 由 MPEG-2 节目流复用器产生。节目流复用器

的功能是将一个或多个具有共同时间基准的打包基本流 (PES) 复用成单一数据流，其目的是便于用来传输和保存单个节目的编码数据及其他数据。

1.9.4 传输流（ TS ） • 传输流 (TS) 由 MPEG-2 传输流复用器产生。传输流复用器的功能是将各基本流 PES包再切割成定长的传输包片段 (TS包 ) ，由一系列固定长度的 TS包组成 TS 传输流，其目的是为了在有可能发生严重误码的环境下进行一个或多个节目的编码数据的传输和存储。

• 这些 TS 数据包完善的包结构设计使其成为运载编码数据的最佳工具，有利于对数字信号进行长距离的传输，因此， TS包被形象地称为“数据集装箱”，如下面的示意图所示。一系列“装载”着视频、音频和业务辅助信息的 TS包按一定规则交替复用在一起构成了符合 MPEG-2标准的 TS 传输流，每个 TS包都是规定的长度 188 B ，前 4 B 为包头，剩余的 184 B （ TS包中最大的空间 } 可用来传输有效荷载或称包数据。

MPEG-2 TS 流的基本结构

TS 包的基本结构 • 包头首字节 (8bit)用于建立包的同步；随后的 3 B 为一组标识，说明承载的有效荷载应如何处理，如有无传输误码、起始码位置、传输优先级、有无加扰 ( 加密 ) 等。其中信息包标识符 (PID) 是识别包内有效荷载中信息种类和码段位置的“标签”， PID 总共 13 bit ，可以提供 0～ 8191 个标识符号 (213=8192) ，通过这些标识符号，可以对各 TS 包中的信息归属及码段来源进行非常清晰、准确的标识。

• 有效荷载，有效荷载中比例最高的是经过压缩编码后的视频数据流和音频数据流，其次是各种辅助信息的数据流，同时还在 PID 特别标识的一些 TS 包中传输描述节目特定信息的表格。

对传输流及 TS 包的基本需要： • (1) 应支持前面介绍的多级编码方案，并允许多种码流在同

一个传输流中传输。即不同类型 ( 视频、音频或数据 ) 、不同制式和不同图像清晰度的码流可在同一个传输流中传输，其中最典型的应用是：标准清晰度数字电视 (SDTV) 节目信号与高清晰度数字电视 (HDTV) 节目信号可以在同一个传输流中传输，从同一个传输流中 SDTV 解码器解码可显示 SDTV 图像；而 HDTV 解码器解码可显示 HDTV 图像。

• (2) 从多节目传输流中可抽取某一个节目，并生成含有此单个节目的节目流。

• (3) 从多节目传输流中可提取某一个节目的 TS 数据包，并生成仅含此节目的新的传输流。

• (4) 从多个传输流中可提取一个或多个节目的 TS 数据包，并生成新的传输流。

• (5) 可把一个节目流转换为一个传输流，使其能够通过容易出现误码的传输通道，然后再重新恢复成原来的节目流。

• 1.10.1 MPEG-2 视 / 音频编码器• 1.10.2 MPEG-2 视 / 音频编码器参数的设置

• 1.10.3 新一代的视频压缩编码技术简介

所谓信源编码设备，是数字电视系统中将模拟视、音频信号或数字视、音频基带信号按照指定的压缩编码标准转换成数字传输流的一种设备。

1.10 信源编码设备及信源编码新技术

1.10.1 MPEG-2 视 / 音频编码器• 作为一种实际使用

的编码设备—视 /音频编码器，内部必须具备的硬件功能模块如右图所示。

• 编码器的内部功能模块大体上可以划分为四大部分：视频处理及压缩编码部分；音频处理及压缩编码部分；节目复用部分接口协议转换部分。

1.10.2 MPEG-2 视 / 音频编码器参数的设置1 。输入设置

视频源的选择：视频信号的输入可以是模拟 Y/C 分量视频或复合视频图像信号，也可以是数字串行信号；音频源的选择：可以是模拟音频，也可以是数字音频(AES/EBU或 S/PDIF) ，既可以是单声道也可以是立体声或混合立体声。

2 。视频编码设置视频格式可以设置为 PAL 制或 NTSC 制；输出图像宽高比可以是 4 ： 3或 16 ：

9 ；垂直分辨率： PAL 制可设置为 576 ， NTSC 制可设置为 480 ；水平分辨率可设置为 720 ， 704 , 640 ， 544 等。

编码格式中的亮色比一般选择 4:2:0 (若有特殊需要，也可设置为达到演播室质量的 4:2:2) ；压缩编码后的输出码率，按照MPEG-2 主类和主级 (MP@ML) 的标准可设置在 4～ 8 Mbit/s 之间 ( 一般选择为 6 Mbit/s) 。

3 。音频编码设置取样频率可设置为 32KHz 、 44.1KHz或 48KHz ，一般设置在 48KHz ；音频压

缩编码后的输出码率可设置为 32～ 384kbit/s ，一般设置在 200kbit/s 以上。4 。输出码流的包格式

一般采用 ASI 输出， TS 传送包的包长可以设为 188 字节或 204 字节， ( 一般选择 188 RS OFF) 。

1.10.3 新一代的视频压缩编码技术简介• 国际国内对压缩编码技术的研究和产品开发一直没有停滞，

目前更加先进的视频压缩编码标准已经很多，如MPEG-4 、MPEG-7 、 MPEG-21 和 H.263 、 H.264 等，我国也制定出了具有自主知识产权的压缩编码标准 AVS 。

• 在视频领域，国际上有两大制定视频编码标准的组织，它们分别是 ISO/IEC ( 国际标准化组织 / 国际电工委员会 ) 与 ITU-T ( 国际电信联盟电信标准化部门 ) 。在视频压缩编码技术方面，这两大国际组织都在不断前进，不断创新并相互融合，两大标准系列之间的大体对应关系见下表。

ISO/IEC 与 ITU-T 两大标准系列之间的大体对应关系

ISO/IEC 系列

MPEG-1 MPEG-2 MPEG-4( 第二部分 ) MPEG-4 AVC( 第十部分 )

ITU-T 系列 H.261 H.262 H.263 、 H.263 ＋、 H.263 ＋＋

H.264

1.MPEG-4标准• MPEG继成功制定

了 MPEG-1 、 MPEG-2标准之后，于 1994年开始制定MPEG-4标准，历时 5年多完成。 MPEG-4打破了以往基于像素的编码概念，而采取了完全崭新的“基于音频和可视对象的编码技术”，这里所说的“对象”是指视频序列中的“物体、景物、对象单元等。其系统整体框架见右图。

2.H.264标准• H.264 视频编码标准是在视频领域内国际上两大标准化组织合

作的最新成果， 2001年 12月在泰国由 ISO/IEC 和 ITU-T共同组建了一个视频联合工作组 (JVT) ，联合制定了一个性能超过MPEG-4 和 H.263 的视频编码标准。它提供了比当时已有视频图像标准更高的压缩比、更高的图像质量，以及更加良好的网络适应性。

• H.264不仅比 MPEG-4 和 H.263 节约了 50% 的码率，而且对网络传输具有更好的支持功能。它引入了面向 IP包的编码机制，有利于网络中的分组传输，支持网络中视频的流媒体传输。

• H 264 具有较强的抗误码特性，可适应丢包率高、干扰严重的无线信道中的视频传输；它支持不同网络资源下的分级编码传输，从而获得平稳的图像质量；它还能适应于不同网络中的视频传输，网络亲和性好。

3.AVS标准• AVS标准是我国具有自主知识产权的数字音 / 视频编、解码技

术标准。由数字音视频编解码技术标准工作组 (AVS工作组 )制定，该工作组于 2002年 6月成立，成员包括国内外从事数字音视频编码技术和产品研究开发的机构和企业。 AVS标准的视频部分，已由国家标准化管理委员会正式地批准为国家标准，并于 2006年 3月 1日起实施。

• AVS标准以当前国际上最先进的 MPEG-4 AVC 和 H.264框架为基础，强调自主知识产权，同时充分考虑了实现的复杂度。于 2003年底完成的 AVS标准第 2部分 ( 视频 ) 主要面向高清晰度和高质量数字电视广播、数字存储媒体和其他相关应用。它具有以下 4 大特点： (1) 性能高，其编码效率与 H.264 相当。 (2)算法复杂度比 H.264低。(3)软、硬件实现成本都低于 H.264 。(4) 专利授权模式简单，费用明显低于同类标准。

第 2章

数字电视信号的信道编码与调制

Documents

第一代电视 --- 黑白电视 第二代电视 --- 彩色电视 第三代电视 --- 数字电视

第一代电视 --- 黑白电视第二代电视 --- 彩色电视第三代电视 --- 数字电视