Download ppt - Standard MPEG2 La structure fondamentale et les algorithmes de codage MPEG2 sont les mêmes que pour MPEG1 (*) - architecture I,B,P (**)- codage du mouvement

Standard MPEG2

La structure fondamentale et les algorithmes de codage MPEG2 sont les mêmes que pour MPEG1(*) - architecture I,B,P(**) - codage du mouvement par macro-bloc(***) - TCD intra-frame et inter-frame

Pourquoi MPEG2 ? – pour répondre aux besoins - de résolution et de qualité supérieures;- de compatibilité avec le parc d’équipement ( TV) et les canaux de transmission hétérogènes- de protection contre les erreurs de transmission dans des canaux bruités …

Applications MPEG2

• Télévision numérique SD et HD;

• DVB ( satellite), DTTB(TNT),

• Production et archivage de la vidéo HD

• VOD

• Digital Cinéma via satellite, Internet large bande

• Qualité de télédiffusion SD est associé à un débit à 6Mbit/s pour un seul programme vidéo

• Qualité HD >15 (19 et plus) Mbit/sec.

Décodeur vidéo MPEG simplifié

Vecteurs de déplacement V

Train binaire codé

Compens. MvT

Mémoire-

image

TCD Inverse

Balayage inverse et déquantif

Décodage LV

pels

+

D’après ISO/IEC, MPEG2 Test Model 5, Avril, 1993

Spécificités technologiques du MPEG2

• (1) MPEG2 traite les images vidéo progressives et entrelacées Moyens du standard :

- field/frame prediction modes - field/frame DCT• (2) MPEG2 permet d’assurer une meilleure qualité

visuelle à la résolution spatiale et temporelle égaleMoyens du standard :

- matrice de quantification propriétaire, un mode de balayage supplémentaire (alternative scan order vs. Zig-zag).

• (3) Compatibilité et adaptation aux moyens matériels de visionnage et de la transmissionMoyens du standard - scalabilité- chroma supporté 4:2:0, 4:2:2, 4:4:4

• (4) Orientation vers la transmission plutôt que vers le stockageMoyens du standard- mécanismes de récupération de l’erreur « error concealment », ex. « concealment motion vectors ».

Modes de prédiction image/trame

Image - frameTrame supérieure

« Top field »

Trame inférieure

« Bottom field »

Modes de prédiction image/trame (II)

Image PréditeImage de référence

Mode Field : Chaque trame peut être prédite

- soit par la trame de la même parité

- soit par la trame de la parité opposée

- Ainsi dans les images P pour le mode « field » deux vecteurs du mouvement sont possibles.

Field/frame prediction (III)

Image de référence Image Prédite

Mode Frame : un seul vecteur de déplacement par macro-bloc, les deux trames sont considérées comme une image

Sélection des modes de prédiction par le mouvement

Critère de sélection : minimisation du critère de la mise en correspondance ( MAD ou EQM).

Quelques indications :

- Si le mouvement est fort, le mode de prédiction « field » sera la meilleure ;

- Si le mouvement est faible alors le codage progressif ( frame ) conviendrait.

Un mode supplémentaire : « dual prime prédiction » - permet de coder les vecteurs de déplacement de façon différentiel en économisant le débit pour le codage de vecteurs de déplacement des trames;

Support du mode entrelacéfield/frame DCT (I)

Macroblock Frame DCT

Mode image (frame) pour le codage des blocs (DCT) :

Chaque bloc 8x8 contient les pixels de deux trames (supérieure et inférieure) et la transformée DCT est appliquée à un tel bloc;

Support du mode entrelacéfield/frame DCT (II)

Macroblock Frame DCT

Mode field DCT : chaque bloc 8x8 contient les pixels d’une seule trame et la transformée DCT est appliquée à un tel bloc;

L’intérêt : quand le mouvement est fort, le décalage spatial entre les trames est important ; cela peut amener à une variation importante de la luminance, donc à l’augmentation de la haute fréquence.

Balayage alternatif

Zig-zag: plus convenable

pour la vidéo aux formats progressifs

Balayage alternatif : a été proposé pour le mode frame DCT:

Statistiquement, l’énergie s’avère plus forte dans les hautes fréquences. RLC est donc plus efficace

Support du mode entrelacéField DCT(I)

Macroblock

Exemple du mouvement fort nécessitant le mode « field DCT »

N

vy

N

uxyxfvCuC

NvuF

N

y

N

x 2

)12(cos

2

)12(cos),()()(

2),(

1

0

1

0

Scalabilité • Scalabilité : capacité d’avoir dans le même train

binaire plusieurs versions de la source. • Dans le train binaire scalable on peut omettre des

parties spécifiées et décoder une image complète avec la qualité correspondante au débit utilisé

• Scalabilité en MPEG2

• Spatiale : le décodeur peut décoder les images de plusieurs résolutions

• Temporelle : une vidéo peut être décodée à la cadence temporelle différente

• SNR : la qualité différente d’une même source vidéo déterminée par le pas de quantification.

• Les trains binaires scalables contiennent toujours le « niveau de base » - la version « minimale » de la source.

Scalabilité spatiale

Source HD

Filtrage spatial

et sous-échantillonnage

SD

Codage MPEG2

Décodage et sur-échantillonnage

Encodeur

MPEG2

Base layer

Enhancement

layerPrédiction

Prédiction

Le niveau de base est encodé indépendamment des niveaux d’amélioration

Scalabilité temporelle

Source

Décodage

Encodeur

MPEG2

Base layer

Enhancement

layer

Encodage

Profils et niveaux (I)

La diversité des résolutions et des qualités d’encodage est formalisée en MPEG2 à l’aide des profils et niveaux.

Profil : est défini comme un sous-ensemble de la syntaxe complète du train binaire

Niveau : des niveaux sont définis à l’intérieur de chaque profil. Le niveau (level) est défini comme l’ensemble des contraintes imposées sur les paramètres du train binaire (par exemple, la résolution spatiale des images)

Notation : profile@level,

Ex. MP@LL signifie main profile@low level

Profils et niveaux (II)

Profile Level Commentaire

Simple main

Main low,main,

High-1440,

High

SNR Low, main scalable

Spatial High-1440 ( base layer + SNR), High-1440(Base layer + spatial)…

scalable

High Profile Main (Base layer + SNR), Main (Base Layer + spatial)…

Scalable

Profils et niveaux. Exemples (III)

Profile Level Résolution max,

Nbr niveaux

Simple main 720/576/30

Main low,

main,

High-1440,

High

352/288/30

720/576/30

1440/1152/60

1920/1152/60

SNR low,

main

352/288/30, 2 niveaux

720/576/30,

2 niveaux

Spatial High-1440 ( base layer + SNR),

High-1440(Base layer + spatial)…

2 niveaux : base 720/576/30 ou 352/288/30 ou 768/576/30

Etc..

Enh. 1440/1152/30

Etc..

MPEG 2 System • Flux de programme (program stream)

• Flux de transport (transport stream).

• Le flux de transport est conçu pour communiquer ou enregistrer un ou plusieurs programmes audio, vidéo ou autre.

• Avant qu’un flux vidéo puisse être décodé, il doit être extrait du transport stream.

Décodeur

du canal

Démulti-

plexeur du TS

Horloge

Décodeur vidéo

Décodeur audio

Canal

TS contenant 1 ou plusieurs

programmes