30
…s az MP3 Készítette: Vasvári Zoltán AZ ADATVESZTÉSSEL JÁRÓ AUDIÓ TÖMÖRÍTÉS

…s az MP3

  • Upload
    louvain

  • View
    35

  • Download
    0

Embed Size (px)

DESCRIPTION

Készítette: Vasvári Zoltán. Az adatvesztéssel járó AUDIÓ TÖMÖRÍTÉS. …s az MP3. Veszteséges tömörítés. - PowerPoint PPT Presentation

Citation preview

Page 1: …s  az  MP3

…s az MP3

Készítette: Vasvári Zoltán

AZ ADATVESZTÉSSEL JÁRÓ AUDIÓ TÖMÖRÍTÉS

Page 2: …s  az  MP3

Veszteséges tömörítés

A hangtömörítési eljárások nagy része veszteséges tömörítés, vagyis a tömörítés folyamán információ vész el: a cél az, hogy ez az információvesztés ne okozzon hallható minőségromlást, illetve a minőségromlás minél kisebb legyen. Az, hogy ezt a célt mennyire sikerül elérni (vagyis hogy egy adott mértékű tömörítés esetén mekkora a minőségromlás) határozza meg az eljárás sikerességét, jóságát.

A módszer lényege az úgynevezett pszichoakusztika, vagyis hogy az emberi fül nem minden létező hangot hall meg, illetve nem minden hangmagasságra egyformán érzékeny. Az eljárások megpróbálják a kevéssé hallott, vagy nem hallható részeket elhagyni, vagy beolvasztani a jobban hallható részekbe úgy, hogy ezzel adatcsökkenést tudjanak elérni. A módszerek jóságát a pszichoakusztikai modelljük jósága, hatékonysága nagyban meghatározza. Ha a modell hibás, akkor a hanganyagból hallható részek hiányoznak, ami minőségromlást jelent.

Mivel a kódolások adatvesztéssel járnak, és az eltérő eljárások eltérő módon okoznak adatvesztést, minden ezen eljárásokkal kódolt hanganyag (veszteséges tömörítéssel való) újrakódolása vagy átalakítása jelentős minőségromlást eredményez.

A veszteséges tömörítési módszerekre általában codec néven hivatkoznak.

Page 3: …s  az  MP3

A múlt

Több mint tíz évvel ezelőtt kapott nevet az mp3, amely azóta is a világ legnépszerűbb hangtömörítési algoritmusa. A Fraunhofer Intézet munkatársainak találmánya megváltoztatta a zenehallgatási szokásokat, és egy egész internetes üzletágat virágoztatott fel.

A németországi Fraunhofer Intézet munkatársai 1995. július 14-én adtak végleges nevet legújabb fejlesztésüknek, az IS 11172-3 ISO sorszámú, MPEG Audio Layer 3 nevű hangtömörítési szabványnak. Ezzel megszületett az mp3, az első olyan formátum, amelynek segítségével jó minőségű zenét lehet tárolni viszonylag kis méretű (néhány megabájtos) fájlokban.

Page 4: …s  az  MP3

A történelmi pillanat

A jeles eseményről fennmaradt dokumentum - egy e-mail - tanúsága szerint a Fraunhofer fejlesztője, Jürgen Zeller pontosan 1995. július 14-én, 12 óra 29 perc 49 másodperckor jelentette be kollégáinak a szavazás végeredményét: "Hi mindenki, szavazásunk elsöprő eredménnyel végződött: mindenki úgy szavazott, hogy .mp3 legyen az ISO MPEG Audio Layer 3 új kiterjesztése!"

Page 5: …s  az  MP3

Azóta is verhetetlen. De milyért?

A névadás egy negyvenfős fejlesztőcsapat hét éven át tartó munkájának végére tett pontot. A hangtömörítési algoritmus licencét már 1992-ben bejegyeztették, forráskódja pedig nyilvános volt - ennek is köszönhető, hogy gyorsan elterjedt.

Page 6: …s  az  MP3

Fájlcserélők, majd netes zeneboltok aranykora

Az mp3-formátum nagy karriert futott be az interneten: az első fájlcserélő, a Napster 1999-ben indult el, ezen a felhasználók először oszthattak meg egymással (többnyire másolt) zenefájlokat. A Napstert a hanglemezkiadók nyomására bezárták, majd 2001-ben új tulajdonos kezében, legális formában indult újra, mivel időközben kiderült: az internetes zeneáruház jó üzlet lehet.

Page 7: …s  az  MP3

Apple

Ami az online zenértékesítést illeti, az üzlet 2003-ban vett nagy lendületet, amikor az Apple megjelentette az iPod nevű, sok ezer zeneszám raktározására is képes, mini merevlemezzel szerelt zenelejátszóját, és beindította az iTunes zeneáruházat - bár ezen nem mp3, hanem a másolásvédelmet is tartalmazó AAC formátumban árusítják a zenéket. A cég emberei értettek hozzá, hogyan kell igazi sikerterméket alkotni: 2004 végén tíz hordozható zenelejátszóból kilenc már iPod volt az Egyesült Államokban.

Egy másik cikk ezzel kapcsolatosan: http://hu.wikipedia.org/wiki/Mp3_lejátszók_története

Page 8: …s  az  MP3

Az eljárás

Az MP3 egy veszteséges tömörítésen alapuló zenei fájlformátum. Valójában két különböző, de nagyon hasonló formátum, az MPEG–1 Audio Layer 3 és az MPEG–2 Audio Layer 3 közös neve; illetve létezik egy nemhivatalos MPEG–2.5 Audio Layer 3 is. A három elsősorban a bitráta és a mintavételezési frekvencia megengedett értékeiben tér el.

Page 9: …s  az  MP3

Az algoritmus

Az MP3 szabványok nem definiálják a tömörítő algoritmust, csak a kitömörítőt és a fájl formátumát, így az MP3-nak a használt tömörítő (kodek) szerint számos különböző változata lehet.

A veszteséges tömörítés hatékonysága alapvetően a bitsűrűségtől függ, azaz a bit mélységtől és a mintavételezési sűrűségtől. Gyakran használják a CD-k paramétereinek megfelelő bitsűrűséget (44,1 kHz és 2×16 bit),

Page 10: …s  az  MP3

Az MP3 formátum algoritmusa hibrid-transzformációt alkalmaz, hogy az idő-beosztásos jelet frekvencia-beosztásos jellé alakítsa: 32 sávos többfázisú szűrő; 36 vagy 12 beosztású MDCT, méretének

megválasztása független az alsávtól; és redukciós végfeldolgozás

Még mindig az algoritmus

Page 11: …s  az  MP3

A Fraunhofer Intézet hivatalos honlapja által közzétett tömörítési arányok és adatsűrűségek az MPEG-1 Layer 1, 2 és 3-hoz:Layer 1: 384 kbps, 4:1 arány,Layer 2: 192–256 kbps, 6:18:1 arány,Layer 3: 112–128 kbps, 10:112:1 arány.

Ezek az adatok nem igazán alkalmazhatóak, mivelhogy: a minőség nem csak a formátumtól, de a tömörítő által használt

pszichoakusztikai modelltől is függ. A Layer 1-es tömörítők egy nagyon egyszerű modellt használnak, ezért a hű hangzás visszaadásához nagyobb bitsűrűség szükséges;

a Layer 1 384 kbps-on jobb, mint a Layer 2 192–256 kbps-on; a Layer 3 112–128 kbps-on rosszabb, mint a Layer 2 192–256 kbps-

on.

Arányok

Page 12: …s  az  MP3

Reálisabb arányok:

Layer 1: 384 kbps – kitűnő, Layer 2: 256–320 kbps – kitűnő; 224–

256 kbps – igen jó; 192–224 kbps – jó; nem ajánlott 160 kbps alatt használni,

Layer 3: 224–256 kbps – kitűnő; 192–224 kbps – igen jó; 160–192 – jó; nem ajánlott 128 kbps alatt használni.

Page 13: …s  az  MP3

Az MP3 fájl minősége függ a tömörítő programtól és a kódolandó jel bonyolultságától. A jobb tömörítők elfogadható minőséget nyújtanak már 128–160 kbps-nál, mások 320 kbps-nál sem adnak igazán hű hangzást. Ezért nincs értelme 128-as vagy 192-es minőségről beszélni. Egy fontos tulajdonság, amiről az MP3-nál beszélni kell, hogy veszteséges – információt hagy el, hogy tárhelyet nyerjen. Mint a legtöbb mai veszteséges eljárás, az MP3 algoritmus is keményen dolgozik, hogy biztosan olyan hangokat hagyjon el, amik az emberi hallgatók által nem hallhatók, modellezve az emberi fül karakterisztikáját.

Mindenesetre a tapasztalt hallgatók még így is meg tudnak különböztetni egy 192 kbps-os és egy 256 kbps-os fájlt. Ha valakinek az a célja, hogy minőségveszteség nélkül archiváljon hangfájlokat, inkább az olyan veszteségmentes hangtömörítésben érdekelt, mint a FLAC, SHN vagy a LPAC – ezek 50–75%-ára tudnak tömöríteni egy hangfájlt veszteség nélkül.

Az MP3 minősége

Page 14: …s  az  MP3

Bitsűrűség

A bitsűrűség, azaz annak a száma, hogy másodpercenként hány bináris számjegy tárolódik a hangból, változó az MP3 fájlok esetében. Alapvető szabály, hogy minél magasabb ez az érték, annál több információ áll rendelkezésre, s így jobb a minősége a visszajátszott fájlnak. Eleinte az egész fájlra egy fix érték volt jellemző, manapság elterjedt a dinamikusan változó bitsűrűség használata is. Az MPEG–1 által használt értékek: 32, 40, 48, 56, 64, 80, 96, 112, 128, 160, 192, 224, 256 és 320 kbit/s, valamint mintavételezési frekvenciára: 32, 44,1 és 48 kHz, újabban pedig a 96 kHz is a DVD audiók számára. A leggyakrabban alkalmazott érték a 128 kbit/s és a 44,1 kHz. Az újabb MPEG–2 és MPEG–2.5 ennél több értéket is kínál. Amikor digitálisan tárolnak hangot, az eredeti jelet pásztázzak és abból időről időre mintát vesznek. A mintavételezés sűrűségét adja meg a mintavételezési frekvencia értéke, és értelemszerűen minél magasabb, annál jobb a minőség, hisz annál folyamatosabb a digitális jel. A másik érték a bitsűrűség, ez adja meg azt, hogy a vett minták hányféle értéket (amplitúdó) vehetnek fel, és itt is a magasabb érték a jobb, hasonló okokból. Hogy érthetőbb legyen, gondoljuk el, hogy mindkét értéket 2-re választjuk meg. Azaz másodpercenként 2-szer veszünk mintát, aminek értéke csak 2 féle lehet. Bármilyen zenét digitalizálva így, ehhez hasonló jelformát kapnánk: ___---_-_--___-- Ezt a jelet hallgatva leginkább csak kattogást hallanánk. Ám növelve a bitsűrűséget és a frekvenciát, lassan reprezentálódna az eredeti felvétel. Azonban nem minden felvétel egyforma, így megeshet, hogy egyes felvételek kevésbé dinamikusak, és itt az alacsony értékekkel is visszaadható lehet a hangzás, míg más, dinamikusabb részeknél nagyobb bitsűrűség szükséges ehhez. Ezért tovább növelhető a tömörítési arány, ha ezek függvényében a bitsűrűség nem konstans, hanem változik, és csak ott magas, ahol ez szükséges.

Page 15: …s  az  MP3

Hibák az MP3-ban

Nem lehet tömöríteni a pontos lejátszási idejét a zenének

Az időbeni felbontás túl alacsony az igen változékony jelekhez

A bitsűrűség behatárolt 320 kbps-ig

Page 16: …s  az  MP3

Jogi helyzet

Az MP3 eljárás szabadalmi oltalom valamint licenc alá esik, melynek tulajdonosa a Thomson Consumer Electronics. A licencelési forma az, hogy mindenki, aki MP3 fájlokat kezelő programot, hardvert, eljárást készít, vagy MP3 kódolású fájlokat terjeszt (azokból bármilyen formájú bevételt szerezve), azután jogdíjat köteles fizetni. Ez programonként 1–5 USD, de évente minimum körülbelül 15 000 USD. 2002-ben a licencfeltételekből kikerült az a kitétel, hogy az ingyenesen terjesztett programok után nem kell jogdíjat fizetni. Ezen változtatás is elősegítette az Ogg Vorbis szabadon és ingyenesen elérhető szabványának elterjedését, mely kiváló minőségű alternatívája a jogdíjas MP3 eljárásnak.

Page 17: …s  az  MP3

Saját tapasztalatok:

A következő ábrák azt mutatják, hogy mi marad egy olyan jelből különböző bitsebességű kódolás majd dekódolás után, ami áll egy 100Hz-es nagy szintű négyszög jelből ill. az erre ültetett kis szintű 14 kHz-es szinusz jelből. (Ez a mérőjel már kezd hasonlítani egy valós mősorjelhez, pl. ilyen lehet egy torzított basszusgitár mellett halkan megszólaló cintányér):

Page 18: …s  az  MP3

Az eredeti mérőjel időfüggvénye

Page 19: …s  az  MP3

A 112kbps-mal kódolt mp3 esetén adódó időfüggvény.

Page 20: …s  az  MP3

A 128kbps-mal kódolt mp3 esetén adódó időfüggvény.

Page 21: …s  az  MP3

A 160kbps-mal kódolt mp3 esetén adódó időfüggvény

Page 22: …s  az  MP3

A 192kbps-mal kódolt mp3 esetén adódó időfüggvény.

Page 23: …s  az  MP3

A 256kbps-mal kódolt mp3 esetén adódó időfüggvény

Page 24: …s  az  MP3

A 320kbps-mal kódolt mp3 esetén adódó időfüggvény.

Page 25: …s  az  MP3

Megjegyzés

A kódoláshoz a bladeenc.exe program volt használva, a visszakódoláshoz Winamp 2.24 'disk write' plugin-nal. Az analízist - mint az fent látható - CoolEdit Pro-val.

A 320kbps-mal kódolt mp3 esetén adódó időfüggvény, már egész jó volt, csak egy picit nagy a file mérete.

Page 26: …s  az  MP3

Ogg Vorbis

A Vorbis egy szabad és nyílt hangtömörítési eljárás (kodek), amit a Xiph.org Alapítvány fejleszt. Általában az Ogg konténerrel használják, ezért gyakran nevezik – nem teljesen pontosan – Ogg Vorbisnak vagy – még kevésbé pontosan – Oggnak is.

A Vorbis – a Xiph.org többi projektjével együtt – annak hatására jött létre, hogy az MP3 formátumhoz fűződő szabadalmi jogokat birtokló Fraunhofer Intézet 1998 szeptemberében bejelentette, hogy jogdíjat fog szedni az MP3 használatáért.

Page 27: …s  az  MP3

Növekvő népszerűség

Az Ogg Vorbis formátum bizonyította népszerűségét a nyílt forráskódú közösségekben; határozottan állítják, hogy annak nagyobb pontossága és teljesen szabad volta alkalmassá teszi a körülbástyázott MP3 formátum leváltására. Bár az MP3-at az 1990-es évek közepe óta széles körben alkalmazták, egészen 2005-ig megtartotta uralkodó pozícióját a veszteséges hangtömörítési eljárások között.

A kereskedelmi szektorban számos újabb számítógépes játékban alkalmazzák a Vorbis-t (legjobb példák az Epic Games Unreal Tournament 2003 és az Unreal Tournament 2004, a Microsoft Halo és a Uru PC-s átirata).

Számos előnyök: Egyre több hardver eszköz támogatja: hordozható lejátszók, asztali DVD

lejátszók, stb. Jobb minőségű mint az mp3 és kevesebb helyet foglal a tömörített file. Több csatornát támogat mint 2

Mp3 Pro a vetélytárs!

Page 28: …s  az  MP3

Mp3 Pro

Mit is tud ez az új technológia? Lényegében az mp3 tömörítésére épül, csak a végeredmény megdöbbentő. A file-ok mérete felére csökken, és minősége nem romlik semmit. Így kevesebb helyen tárolhatjuk kedvenc zenéinket anélkül, hogy vesztettek volna minőségükből. - Olvashatjuk a ComputerPanorama www.cp.hu hírei közt. A www.mp3pro.hu oldalra ellátogatva csak egy mp3 lejátszó képét láthatjuk, és egy linket, melyről ezt letölthetjük.

Egy angol nyelvű oldalra, a www.mp3prozone.com/-ra érkezve, rögtön a legfontosabb információkat találjuk meg, az mp3pro-ról. Az mp3pro basics menüpont alatt egy összehasonlítást találunk, az mp3 és mp3pro formátumok között. Így könnyen megérthetjük, hogy a magasabb hangokat kaphatjuk meg kisebb bitráta mellet, az mp3pro segítségével, így az új fileunk 64 kilobit per secundum minöségűnek tűnik ugyan, de az SBR (spectral band replication) technológia segítségével visszakapjuk a magasabb hangokat is.

Page 29: …s  az  MP3

Van kérdés?

Page 30: …s  az  MP3

Vége

Köszi, hogy megnéztétek az előadást!

Sziasztok