27
Medien- Technik Audio-Kompression: MPEG Karlheinz Brandenburg Bernhard Grill Harald Popp

Medien- Technik Audio-Kompression: MPEG Karlheinz Brandenburg Bernhard Grill Harald Popp

Embed Size (px)

Citation preview

Page 1: Medien- Technik Audio-Kompression: MPEG Karlheinz Brandenburg Bernhard Grill Harald Popp

Medien-Technik

Audio-Kompression: MPEGKarlheinzBrandenburg

BernhardGrill

HaraldPopp

Page 2: Medien- Technik Audio-Kompression: MPEG Karlheinz Brandenburg Bernhard Grill Harald Popp

Medien-Technik

Audio-Kompression: MPEG

MPEG 1:ISO/IEC IS 11172 (1988-1992)

Ziel: Digitales Video auf CD 1,5 Mbit/s

MPEG 1 Audio:ISO/IEC IS 11172-33 Schichten wachsender Komplexität

MPEG 1 Layer 3 = MP3

Moving

Pictures

Experts

Group

Offizieller NameISO/IEC JTC1/SC29/ WG11

Page 3: Medien- Technik Audio-Kompression: MPEG Karlheinz Brandenburg Bernhard Grill Harald Popp

Medien-Technik

Audio-Kompression: MPEG

MPEG 2:(1994)

Ziel: Digitales Fernsehen, viele Bitratenz.B. DVD, Videokonferenzen

MPEG 2 Audio:ISO/IEC 13818-3Zusätzlich: 5-Kanal (Dolby Suround)Kleinere Bitraten / Abtastfrequenzen

AAC = MPEG 2 Advanced Audio CodingVerbesserte Codecs

Moving

Pictures

Experts

Group

Offizieller NameISO/IEC JTC1/SC29/ WG11

Page 4: Medien- Technik Audio-Kompression: MPEG Karlheinz Brandenburg Bernhard Grill Harald Popp

Medien-Technik

Komprimierung: MP3

Komressions-Rate für CD-Qualität

1:4 Layer 1 (384 kbps for a stereo signal)

1:6...1:8 Layer 2 (256..192 kbps for a stereo signal)

1:10...1:12 Layer 3 (128..112 kbps for a stereo signal)

MPEG Layer-3sound quality bandwidth mode bitrate reduction ratio

telephone sound 2.5 kHz mono 8 kbps * 96:1

better than shortwave 4.5 kHz mono 16 kbps 48:1

better than AM radio 7.5 kHz mono 32 kbps 24:1

similar to FM radio 11 kHz stereo 56...64 kbps 26...24:1

near-CD 15 kHz stereo 96 kbps 16:1

CD >15 kHz stereo 112..128kbps 14..12:1

Page 5: Medien- Technik Audio-Kompression: MPEG Karlheinz Brandenburg Bernhard Grill Harald Popp

Medien-Technik

Original-Spektrogramm aus der „Pastorale“

http://www.kfs.oeaw.ac.at/fsf/psa/index.html

Komprimierung: Psycho-Akustik

Audio-Software

ST-X

Page 6: Medien- Technik Audio-Kompression: MPEG Karlheinz Brandenburg Bernhard Grill Harald Popp

Medien-Technik

Akustisch relevante Anteile

HörbarerAnteil

Komprimierung: Psycho-Akustik

Page 7: Medien- Technik Audio-Kompression: MPEG Karlheinz Brandenburg Bernhard Grill Harald Popp

Medien-Technik

Differenz-Signal ohne „relevante“ Komponenten: „unhörbar“

VerdeckteKomponenten

Komprimierung: Psycho-Akustik

Page 8: Medien- Technik Audio-Kompression: MPEG Karlheinz Brandenburg Bernhard Grill Harald Popp

Medien-Technik

Psychoakustik:Critical Band =FrequenzbereichegleicherLaut(stärke)empfindung

Komprimierung: Psycho-Akustik

24 Kritische Bänderim Bereich 0-15 kHz

Page 9: Medien- Technik Audio-Kompression: MPEG Karlheinz Brandenburg Bernhard Grill Harald Popp

Medien-Technik

Komprimierung: Psycho-AkustikSimultane Maskierung

Hörbarkeitsschwelle

unhörbar

Unhörbar bei 1000Hz-Ton mit 100dB

http://www.tecchannel.de/multimedia/58/index.html

Page 10: Medien- Technik Audio-Kompression: MPEG Karlheinz Brandenburg Bernhard Grill Harald Popp

Medien-Technik

Komprimierung: Psycho-AkustikVerdeckung durch kurzes lautes Signal

http://www.tecchannel.de/multimedia/57/index.html

(tonal)

(Rauschsignal)

Rauschsignale werden durch lauteretonale Signale verdeckt.Konsequenz:Quantisierungsrauschen wird verdeckt.

Page 11: Medien- Technik Audio-Kompression: MPEG Karlheinz Brandenburg Bernhard Grill Harald Popp

Medien-Technik

Komprimierung: Psycho-AkustikVor- und Nachmaskierung

http://www.tecchannel.de/multimedia/57/index.html

Rückwärtsmaskierung:Lauter Impuls „überholt“leises Rauschhen

20 ms 200 ms

Vorwärtsmaskierung:Lauter Impuls hebt dieHörschwelle an

Page 12: Medien- Technik Audio-Kompression: MPEG Karlheinz Brandenburg Bernhard Grill Harald Popp

Medien-Technik

Jeweils um 10 dB ansteigendes Testsignal im Rauschsignal

Hörbeispiel 1: Rauschen verdeckt einzelne Töne

Testsignal 600 Hz

Rauschsignal 900-1100 Hz

Testsignal 1000 Hz

Testsignal 1600 Hz

Demo1.wav

Page 13: Medien- Technik Audio-Kompression: MPEG Karlheinz Brandenburg Bernhard Grill Harald Popp

Medien-Technik

Jeweils um 10 dB ansteigendes Testsignal im Rauschsignal

Hörbeispiel 2: Vorwärtsmaskierung

Impuls

Demo2.wav

Rauschsignal

Page 14: Medien- Technik Audio-Kompression: MPEG Karlheinz Brandenburg Bernhard Grill Harald Popp

Medien-Technik

Hörbeispiel 3: Rückwärtsmaskierung

Impuls

Demo3.wav

Rauschsignal

Page 15: Medien- Technik Audio-Kompression: MPEG Karlheinz Brandenburg Bernhard Grill Harald Popp

Medien-Technik

MPEG 1 AudioSub-Band Coding SBC

QMFQuadrature Mirror FilterVLCvariable-length coding

Page 16: Medien- Technik Audio-Kompression: MPEG Karlheinz Brandenburg Bernhard Grill Harald Popp

Medien-Technik

MPEG 1/2 Audio Layer 3

Zerlegung in 32 Frequenzbänder

Jedes Band18 mal zerlegen

Page 17: Medien- Technik Audio-Kompression: MPEG Karlheinz Brandenburg Bernhard Grill Harald Popp

Medien-Technik

MPEG 1/2 Audio Layer 3

Zerlegung in 32 Frequenzbänder

Jedes Band18 mal zerlegen

Verdeckte Komponenten ermitteln

Innere Schleife: Optimale Codierung

finden (Bitrate)Mehrere Hufman-Tabellen, VerstärkungsfaktorenStarkes Signal = grobe Kodierung, schwaches Signal = feine Codierung

Störsignalminimieren

Page 18: Medien- Technik Audio-Kompression: MPEG Karlheinz Brandenburg Bernhard Grill Harald Popp

Medien-Technik

MPEG 1/2 Audio Layer 3

Zerlegung in 32 Frequenzbänder

Jedes Band18 mal zerlegen

Verdeckte Komponenten ermitteln

Entropie-Kodierung

Aufbau

Frames

Page 19: Medien- Technik Audio-Kompression: MPEG Karlheinz Brandenburg Bernhard Grill Harald Popp

Medien-Technik

MPEG 1/2 Audio Layer 3

http://www.iis.fhg.de/amm/techinf/layer3/layer3_block.gif

Page 20: Medien- Technik Audio-Kompression: MPEG Karlheinz Brandenburg Bernhard Grill Harald Popp

Medien-Technik

Mp3 Bitstream

Header:Copyright 2bitsSyncword: 12bitsLayercode: 2bits (I,II,II)Bitrate: 4bits (s. Tabelle)Sampling-F.: 2bits (48,44.1,32 kHz)Mode: 2bit (stereo, mono, 2-sprachig, joint stereo)Padding 1bit

Jeder Framekann für sichdekodiert werden

Jeder Framekann andereSamplingrateund Modusbesitzen (III)

Joint Stereo:o MS-Stereo:

Mittensignal,Seitensignal

o Intensity Stereonur hörbare Differenzen

Page 21: Medien- Technik Audio-Kompression: MPEG Karlheinz Brandenburg Bernhard Grill Harald Popp

Medien-Technik

MPEG 1 Layers / BitratenBitrate (kHz)

Index Layer I Layer II Layer III

0000 frei frei frei

0001 32 32 32

0010 64 48 40

0011 96 56 48

0100 128 64 56

0101 160 80 64

0110 192 96 80

0111 224 112 96

1000 256 128 112

1001 288 160 128

1010 320 192 160

1011 352 224 192

1100 384 256 224

1101 416 320 256

1110 448 384 320

44,1 kHztypewriter1.wav3,8 MB

Typewriter1-1.mp3834 kB, joint stereo

Typewriter1-2.mp3342 kB, joint stereo

Typewriter1-3.mp3171 kB, joint stereo

Typewriter1-4.mp343 kB, joint stereo

Page 22: Medien- Technik Audio-Kompression: MPEG Karlheinz Brandenburg Bernhard Grill Harald Popp

Medien-Technik

Psychoakustik in MPEG

Modell I:FFT (512/1024) Werte und Bandfilter berechnenSchalldruck in jedem BandStille Regionen berechnenTonale und nichttonale verdeckende Komponenten aus FFTVerdeckte Komponenten entfernen

Modell II:FFT in wie in Modell I,jedoch für kurze (192) undlange Blöcke (576)Spreading function auf benach-barte Critical Bands anwenden

Page 23: Medien- Technik Audio-Kompression: MPEG Karlheinz Brandenburg Bernhard Grill Harald Popp

Medien-Technik

MPEG Audio Übersicht

MPEG-1Iso/IEC 11172-3 (1993)mono/stereo/2-channel/jointAbstastraten 48, 44.1, 32 KHz

MPEG-2Iso/IEC 13818-3 (1995)Iso/IEC 13818-7 (1997)mono/stereo/multichannelviele Abstastraten, Daten-ströme < 64 kBit/sec, AAC

Layer I

Layer II

Layer III

Ziel: Video & Audio-CD Kommunikation

Http://sound.media.mit.edu/mpeg4/audio/faq

Page 24: Medien- Technik Audio-Kompression: MPEG Karlheinz Brandenburg Bernhard Grill Harald Popp

Medien-Technik

MPEG 4 Audio

MPEG-7Multimedia ContentDescription Interface

Http://sound.media.mit.edu/mpeg4/audio/faq

Page 25: Medien- Technik Audio-Kompression: MPEG Karlheinz Brandenburg Bernhard Grill Harald Popp

Medien-Technik

MPEG 4 Natural Audio

Code ExcitedLinear Predictive

MPEG-2 AAC

HarmonicVectoreXcitationCoding

Page 26: Medien- Technik Audio-Kompression: MPEG Karlheinz Brandenburg Bernhard Grill Harald Popp

Medien-Technik

MPEG 4 Synthesized Audio

TTSI Text to Speech Interface Text mit Ausspracheinformationen

Score driven Synthesis

SAOL Structured Audio Orchestra Language Instrumente definieren

als Sammlung einfacher Signalprozessoren Noten für diese Instrument (abstraktes MIDI) Wavetables mit Effektfiltern

Page 27: Medien- Technik Audio-Kompression: MPEG Karlheinz Brandenburg Bernhard Grill Harald Popp

Medien-Technik

Vorlesung „Medientechnik WS 1999/2000“

Dr. Manfred JackelStudiengang ComputervisualistikInstitut für InformatikUniversität Koblenz-LandauRheinau 156075 Koblenz

© Manfred JackelE-Mail: [email protected]

WWW: www.uni-koblenz.de/~jkl

mtech.uni-koblenz.de

Literatur zu diesem Kapitel

Brandenburg, Karlheinz:MP3 and AAC explained

Hyperlinks zu diesem Kapitel Grafik-Quellen