Standard MPEG2
La structure fondamentale et les algorithmes de codage MPEG2 sont les mêmes que pour MPEG1(*) - architecture I,B,P(**) - codage du mouvement par macro-bloc(***) - TCD intra-frame et inter-frame
Pourquoi MPEG2 ? – pour répondre aux besoins - de résolution et de qualité supérieures;- de compatibilité avec le parc d’équipement ( TV) et les canaux de transmission hétérogènes- de protection contre les erreurs de transmission dans des canaux bruités …
Applications MPEG2
• Télévision numérique SD et HD;
• DVB ( satellite), DTTB(TNT),
• Production et archivage de la vidéo HD
• VOD
• Digital Cinéma via satellite, Internet large bande
• Qualité de télédiffusion SD est associé à un débit à 6Mbit/s pour un seul programme vidéo
• Qualité HD >15 (19 et plus) Mbit/sec.
Décodeur vidéo MPEG simplifié
Vecteurs de déplacement V
Train binaire codé
Compens. MvT
Mémoire-
image
TCD Inverse
Balayage inverse et déquantif
Décodage LV
pels
+
D’après ISO/IEC, MPEG2 Test Model 5, Avril, 1993
Spécificités technologiques du MPEG2
• (1) MPEG2 traite les images vidéo progressives et entrelacées Moyens du standard :
- field/frame prediction modes - field/frame DCT• (2) MPEG2 permet d’assurer une meilleure qualité
visuelle à la résolution spatiale et temporelle égaleMoyens du standard :
- matrice de quantification propriétaire, un mode de balayage supplémentaire (alternative scan order vs. Zig-zag).
• (3) Compatibilité et adaptation aux moyens matériels de visionnage et de la transmissionMoyens du standard - scalabilité- chroma supporté 4:2:0, 4:2:2, 4:4:4
• (4) Orientation vers la transmission plutôt que vers le stockageMoyens du standard- mécanismes de récupération de l’erreur « error concealment », ex. « concealment motion vectors ».
Modes de prédiction image/trame
Image - frameTrame supérieure
« Top field »
Trame inférieure
« Bottom field »
Modes de prédiction image/trame (II)
Image PréditeImage de référence
Mode Field : Chaque trame peut être prédite
- soit par la trame de la même parité
- soit par la trame de la parité opposée
- Ainsi dans les images P pour le mode « field » deux vecteurs du mouvement sont possibles.
Field/frame prediction (III)
Image de référence Image Prédite
Mode Frame : un seul vecteur de déplacement par macro-bloc, les deux trames sont considérées comme une image
Sélection des modes de prédiction par le mouvement
Critère de sélection : minimisation du critère de la mise en correspondance ( MAD ou EQM).
Quelques indications :
- Si le mouvement est fort, le mode de prédiction « field » sera la meilleure ;
- Si le mouvement est faible alors le codage progressif ( frame ) conviendrait.
Un mode supplémentaire : « dual prime prédiction » - permet de coder les vecteurs de déplacement de façon différentiel en économisant le débit pour le codage de vecteurs de déplacement des trames;
Support du mode entrelacéfield/frame DCT (I)
Macroblock Frame DCT
Mode image (frame) pour le codage des blocs (DCT) :
Chaque bloc 8x8 contient les pixels de deux trames (supérieure et inférieure) et la transformée DCT est appliquée à un tel bloc;
Support du mode entrelacéfield/frame DCT (II)
Macroblock Frame DCT
Mode field DCT : chaque bloc 8x8 contient les pixels d’une seule trame et la transformée DCT est appliquée à un tel bloc;
L’intérêt : quand le mouvement est fort, le décalage spatial entre les trames est important ; cela peut amener à une variation importante de la luminance, donc à l’augmentation de la haute fréquence.
Balayage alternatif
Zig-zag: plus convenable
pour la vidéo aux formats progressifs
Balayage alternatif : a été proposé pour le mode frame DCT:
Statistiquement, l’énergie s’avère plus forte dans les hautes fréquences. RLC est donc plus efficace
Support du mode entrelacéField DCT(I)
Macroblock
Exemple du mouvement fort nécessitant le mode « field DCT »
N
vy
N
uxyxfvCuC
NvuF
N
y
N
x 2
)12(cos
2
)12(cos),()()(
2),(
1
0
1
0
Scalabilité • Scalabilité : capacité d’avoir dans le même train
binaire plusieurs versions de la source. • Dans le train binaire scalable on peut omettre des
parties spécifiées et décoder une image complète avec la qualité correspondante au débit utilisé
• Scalabilité en MPEG2
• Spatiale : le décodeur peut décoder les images de plusieurs résolutions
• Temporelle : une vidéo peut être décodée à la cadence temporelle différente
• SNR : la qualité différente d’une même source vidéo déterminée par le pas de quantification.
• Les trains binaires scalables contiennent toujours le « niveau de base » - la version « minimale » de la source.
Scalabilité spatiale
Source HD
Filtrage spatial
et sous-échantillonnage
SD
Codage MPEG2
Décodage et sur-échantillonnage
Encodeur
MPEG2
Base layer
Enhancement
layerPrédiction
Prédiction
Le niveau de base est encodé indépendamment des niveaux d’amélioration
Scalabilité temporelle
Source
Décodage
Encodeur
MPEG2
Base layer
Enhancement
layer
Encodage
Profils et niveaux (I)
La diversité des résolutions et des qualités d’encodage est formalisée en MPEG2 à l’aide des profils et niveaux.
Profil : est défini comme un sous-ensemble de la syntaxe complète du train binaire
Niveau : des niveaux sont définis à l’intérieur de chaque profil. Le niveau (level) est défini comme l’ensemble des contraintes imposées sur les paramètres du train binaire (par exemple, la résolution spatiale des images)
Notation : profile@level,
Ex. MP@LL signifie main profile@low level
Profils et niveaux (II)
Profile Level Commentaire
Simple main
Main low,main,
High-1440,
High
SNR Low, main scalable
Spatial High-1440 ( base layer + SNR), High-1440(Base layer + spatial)…
scalable
High Profile Main (Base layer + SNR), Main (Base Layer + spatial)…
Scalable
Profils et niveaux. Exemples (III)
Profile Level Résolution max,
Nbr niveaux
Simple main 720/576/30
Main low,
main,
High-1440,
High
352/288/30
720/576/30
1440/1152/60
1920/1152/60
SNR low,
main
352/288/30, 2 niveaux
720/576/30,
2 niveaux
Spatial High-1440 ( base layer + SNR),
High-1440(Base layer + spatial)…
2 niveaux : base 720/576/30 ou 352/288/30 ou 768/576/30
Etc..
Enh. 1440/1152/30
Etc..
MPEG 2 System • Flux de programme (program stream)
• Flux de transport (transport stream).
• Le flux de transport est conçu pour communiquer ou enregistrer un ou plusieurs programmes audio, vidéo ou autre.
• Avant qu’un flux vidéo puisse être décodé, il doit être extrait du transport stream.
Décodeur
du canal
Démulti-
plexeur du TS
Horloge
Décodeur vidéo
Décodeur audio
Canal
TS contenant 1 ou plusieurs
programmes