Mp3 Geschichte Geschichte Verfahren Verfahren Codecs (Vor- und Nachteile) Codecs (Vor- und Nachteile) Kodierverfahren (2 Arten) Kodierverfahren (2 Arten)

  • View
    104

  • Download
    0

Embed Size (px)

Text of Mp3 Geschichte Geschichte Verfahren Verfahren Codecs (Vor- und Nachteile) Codecs (Vor- und...

  • Folie 1
  • Folie 2
  • Mp3 Geschichte Geschichte Verfahren Verfahren Codecs (Vor- und Nachteile) Codecs (Vor- und Nachteile) Kodierverfahren (2 Arten) Kodierverfahren (2 Arten) Kodieren (Maskierungen) Kodieren (Maskierungen) Qualitt/Verluste Qualitt/Verluste MP3: Legal oder Illegal MP3: Legal oder Illegal
  • Folie 3
  • Geschichte entwickelt 1985 von Gruppe von Studenten um Prof. Dr. Karlheinz Brandenburg am Fraunhofer-Institut (groteils) sowie an der Friedrich-Alexander-Universitt Erlangen-Nrnberg in Zusammenarbeit mit AT&T Bell Labs und Thomson. entwickelt 1985 von Gruppe von Studenten um Prof. Dr. Karlheinz Brandenburg am Fraunhofer-Institut (groteils) sowie an der Friedrich-Alexander-Universitt Erlangen-Nrnberg in Zusammenarbeit mit AT&T Bell Labs und Thomson. 1992 wurde es als Teil des MPEG-1-Standards festgeschrieben 1992 wurde es als Teil des MPEG-1-Standards festgeschrieben Die Dateiendung.mp3 (als Abkrzung fr ISO MPEG 1 Layer 3) wurde 1995 festgelegt. Die Dateiendung.mp3 (als Abkrzung fr ISO MPEG 1 Layer 3) wurde 1995 festgelegt. Prof. Dr. Brandenburg wurde fr die Entwicklung dieses Datenformates mehrfach ausgezeichnet. Prof. Dr. Brandenburg wurde fr die Entwicklung dieses Datenformates mehrfach ausgezeichnet.
  • Folie 4
  • Verfahren Wie alle anderen Kompressionsformate fr Musik nutzt MP3 sogenannte psychoakustisch Effekte der Wahrnehmung aus (z.B. zwei Tne erst ab einem gewissen Mindestunterschied der Tonhhe (Frequenz) voneinander unterscheidbar oder dass man vor und nach sehr lauten Geruschen fr kurze Zeit leisere Gerusche schlechter oder gar nicht wahrnimmt. Wie alle anderen Kompressionsformate fr Musik nutzt MP3 sogenannte psychoakustisch Effekte der Wahrnehmung aus (z.B. zwei Tne erst ab einem gewissen Mindestunterschied der Tonhhe (Frequenz) voneinander unterscheidbar oder dass man vor und nach sehr lauten Geruschen fr kurze Zeit leisere Gerusche schlechter oder gar nicht wahrnimmt. Ursprungssignal nicht exakt abspeichern, sondern Signalanteile, die das menschliche Gehr wahrnehmen kann. Die Aufgabe des Kodierers ist es, das Signal so aufzuarbeiten, dass es weniger Speicherplatz bentigt, aber fr das menschliche Gehr noch genauso klingt wie das Original. Ursprungssignal nicht exakt abspeichern, sondern Signalanteile, die das menschliche Gehr wahrnehmen kann. Die Aufgabe des Kodierers ist es, das Signal so aufzuarbeiten, dass es weniger Speicherplatz bentigt, aber fr das menschliche Gehr noch genauso klingt wie das Original. Der Decoder erzeugt dann aus MP3 ein original klingendes Signal, das aber nicht mit dem Ursprungssignal identisch ist, da bei der Umwandlung in MP3 Informationen entfernt wurden. Der Decoder erzeugt dann aus MP3 ein original klingendes Signal, das aber nicht mit dem Ursprungssignal identisch ist, da bei der Umwandlung in MP3 Informationen entfernt wurden.
  • Folie 5
  • Codecs fr Audiokomprimierung Lossy Codecs Lossy Codecs Lossless Codecs Lossless Codecs
  • Folie 6
  • Lossy Codecs (verlustbehaftet = Datenreduktion) Ausnutzung, dass menschl. Gehrs: Ausnutzung, dass menschl. Gehrs: hohe und tiefe Frequenzen ab einer Grenze nicht mehr wahrnimmt hohe und tiefe Frequenzen ab einer Grenze nicht mehr wahrnimmt Frequenzen werden durch hhrere bertnt und nicht wahrgenommen Frequenzen werden durch hhrere bertnt und nicht wahrgenommen Bei hohen Lautstrken werden leise nicht erkannt Bei hohen Lautstrken werden leise nicht erkannt Ziel: Erreichen von Transparenz, d.h. kein hrbarer Unterschied zwischen kompr. und originaler Datei Ziel: Erreichen von Transparenz, d.h. kein hrbarer Unterschied zwischen kompr. und originaler Datei Bekannte Formate: MP3, MPC, Ogg Vorbis und AAC Bekannte Formate: MP3, MPC, Ogg Vorbis und AAC
  • Folie 7
  • Vor- und Nachteile Lossy Codecs Vorteile Vorteile breite Hard- und Software-Untersttzung breite Hard- und Software-Untersttzung gute Qualitt mit dem LAME-Encoder bei mittleren und hohen Bitraten gute Qualitt mit dem LAME-Encoder bei mittleren und hohen Bitraten Nachteile Nachteile mige Qualitt bei niedrigen Bitraten mige Qualitt bei niedrigen Bitraten das Encodieren mit LAME (derzeit effektivste) dauert sehr lange das Encodieren mit LAME (derzeit effektivste) dauert sehr lange viele immer noch verwendete schlechte Encoder (auch FhG-Encodern) viele immer noch verwendete schlechte Encoder (auch FhG-Encodern)
  • Folie 8
  • Lossless Codecs (verlustfrei = Datenkomprimierung) Hier wird nur die Datei (hnlich wie WinZip) mit bekannten Algorithmen ( z.B. Huffman-Kodierung ) komprimiert und es kommt so zu keinem Qualittsverlust Hier wird nur die Datei (hnlich wie WinZip) mit bekannten Algorithmen ( z.B. Huffman-Kodierung ) komprimiert und es kommt so zu keinem Qualittsverlust Es kann die vollkommen idente Datei wie die Originaldatei wieder hergestellt werden Es kann die vollkommen idente Datei wie die Originaldatei wieder hergestellt werden Bekanntestes Format: FLAC Bekanntestes Format: FLAC
  • Folie 9
  • Vor- und Nachteile Lossless Codecs Vorteile Vorteile keine Qualittsverluste, weder hrbar noch messbar keine Qualittsverluste, weder hrbar noch messbar sehr hohe Encodier- und Decodiergeschwindigkeit sehr hohe Encodier- und Decodiergeschwindigkeit freies und offenes Audioformat freies und offenes Audioformat plattformbergreifende Software-Untersttzung (Windows, Linux, Mac OS X) plattformbergreifende Software-Untersttzung (Windows, Linux, Mac OS X) Nachteile Nachteile Geringere Komprimierung ( auf ~60 %) Geringere Komprimierung ( auf ~60 %)
  • Folie 10
  • Kodierverfahren Kodierung mit konstanter Datenrate (CDR) (und damit schwankender Qualitt) Kodierung mit konstanter Datenrate (CDR) (und damit schwankender Qualitt) Kodierung mit schwankender Datenrate (VDR) (und damit konstanter Qualitt) (MPEG Video) Kodierung mit schwankender Datenrate (VDR) (und damit konstanter Qualitt) (MPEG Video) Vorteile: Vorteile: Qualittseinbrche werden vermieden, d.h. bei komplexerer Signalstruktur gute Qualitt aber bei stillen Passagen hhere Datenrate als normalerweise notwendig Qualittseinbrche werden vermieden, d.h. bei komplexerer Signalstruktur gute Qualitt aber bei stillen Passagen hhere Datenrate als normalerweise notwendig Die Qualittsstufe ist vorgegeben! Die Qualittsstufe ist vorgegeben!
  • Folie 11
  • Kodieren mit der Fast Fourier Transformation (FFT) oder der Diskreten Kosinus Transformation (DCT) wird das Frequenzspektrum der Audiodaten bestimmt mit der Fast Fourier Transformation (FFT) oder der Diskreten Kosinus Transformation (DCT) wird das Frequenzspektrum der Audiodaten bestimmt Dabei wird einer Funktion f(t) ihre Fouriertransformierte zugeordnet,d.h. fr das Zeit-Amplitudensignal das Frequenzspektrum berechnet = Fourieranalyse Dabei wird einer Funktion f(t) ihre Fouriertransformierte zugeordnet,d.h. fr das Zeit-Amplitudensignal das Frequenzspektrum berechnet = Fourieranalyse Man zerlegt die Funktion in wellenartige Bestandteile (Kosinus, Sinus). Das Ergebnis der Transformation sind die Koeffizienten der Basisfunktionen, d. h. deren Anteil (Faktor) an der ursprnglichen Funktion Man zerlegt die Funktion in wellenartige Bestandteile (Kosinus, Sinus). Das Ergebnis der Transformation sind die Koeffizienten der Basisfunktionen, d. h. deren Anteil (Faktor) an der ursprnglichen Funktion
  • Folie 12
  • Fouriertransformation Beispiel: f(t) = cos(2. t) Beispiel: f(t) = cos(2. t)
  • Folie 13
  • Fouriertransformation die Rcktransformation (Fouriersynthese) lautet die Rcktransformation (Fouriersynthese) lautet in der Praxis wird das Signal abgetastet und man erhlt ein zeitdiskretes Signal (nicht kont. wie im vorherigen Beispiel) und berechnet hier mit Hilfe der diskreten Fourieranalyse das Spektrum fr die einzelnen Zeitintervalle (nicht mehr analytisch sondern numerisch FFT)
  • Folie 14
  • Maskierungen Hrschwellenmaskierung Hrschwellenmaskierung Frequenzmaskierung Frequenzmaskierung temporale Maskierung temporale Maskierung
  • Folie 15
  • Abb 1.1 : Hrschwelle des Menschen Jedes Paket wird einer Hrschwellenmaskierung unterzogen, d.h. gewisse Frequenzen eines Gerusches knnen nur schlecht oder gar nicht wahrgenommen und deshalb gelscht werden z.B. Ton mit f=16 kHz und L= 40 dB dieser Ton bzw. die Daten knnen gelscht werden Hrschwellenmaskierung
  • Folie 16
  • Nun wird das Audiosignal einer Frequenzmaskierung unterzogen, wobei hier Tne beseitigt werden, die durch andere bertnt werden. Nun wird das Audiosignal einer Frequenzmaskierung unterzogen, wobei hier Tne beseitigt werden, die durch andere bertnt werden. Frequenzmaskierung Ein lautes Basssignal bertnt z.B. leise Tne aus den mittleren Frequenzbereichen; man sagt :der Bass maskiert die Mitten! Ein lautes Basssignal bertnt z.B. leise Tne aus den mittleren Frequenzbereichen; man sagt :der Bass maskiert die Mitten!
  • Folie 17
  • Ein Ton der eine Frequenz von 1 kHz und eine Lautstrke von 80 dB hat, bertnt z.B. einen Ton von 2 kHz/40 dB. Abb 1.2 : Frequenzmaskierung
  • Folie 18
  • Frequenzmaskierung
  • Folie 19
  • Grund fr Frequenzmaskierung Schwingungen durch Schalldruck bringen Basilarmembran im Innenohr zur Schwingung und fhren je nach Frequenz an versch. Stellen der Membran zu Resonanz. Schwingungen durch Schalldruck bringen Basilarmembran im Innenohr zur Schwingung und fhren je nach Frequenz an versch. Stellen der Membran zu Resonanz. Nerven sind ber ganze Lnge der Membran verteilt und so werden bei bestimmten Frequenzen bestimmte Nerven angeregt Nerven sind ber ganze Lnge der Membran verteilt und so wer