12
SVEUČILIŠTE U ZAGREBU FAKULTET ELEKTROTEHNIKE I RAČUNARSTVA Seminarski rad u okviru predmeta „Računalna forenzika“ 2017/2018 MP3 format datoteke Ante Buterin Zagreb, siječanj 2018.

MP3 format datoteke - nevena.lss.hrnevena.lss.hr/recordings/fer/predmeti/racfor/2018/seminari/abuterin/seminar.pdf · prijenos preko interneta, uzrokova je nažalost i porast piratstva

  • Upload
    others

  • View
    5

  • Download
    0

Embed Size (px)

Citation preview

SVEUČILIŠTE U ZAGREBU

FAKULTET ELEKTROTEHNIKE I RAČUNARSTVA

Seminarski rad u okviru predmeta „Računalna forenzika“ 2017/2018

MP3 format datoteke

Ante Buterin

Zagreb, siječanj 2018.

Sadržaj

1. Uvod ..................................................................................................................... 3

2. MP3 format .......................................................................................................... 4

2.1 Struktura MP3 datoteke ................................................................................. 4

2.2 Kodiranje i dekodiranje .................................................................................. 5

3. Metapodatci ......................................................................................................... 7

3.1 ID3 ................................................................................................................. 7

3.2 APEv2 ........................................................................................................... 8

3.3 Alati za čitanje i uređivanje metapodataka .................................................... 8

4. Zaključak ............................................................................................................ 11

5. Literatura ............................................................................................................ 12

1. Uvod

MP3 je format za pohranjivanje audio kodiranog sadržaja. Dizajniran je od Moving

Picture Experts Group (MPEG) kao dio MPEG-1, a kasnije i MPEG-2 standarda. MP3

upravo predstavlja skraćenicu od MPEG-1 Audio Layer 3 (ili rjeđe MPEG-2 Audio

Layer 3).

Njegov razvoj nastavljen je od strane poznate tvrtke Philips, francuskog instituta za

istraživanje CCETT i njemačkog instituta Broadcast Technology. Oni su oblikovali

MP3 format sve dok više nije mogao biti jednostavniji; izbacili su uočene greške te ga

napravili učinkovitim za izvođenje na računalu. Odluka da će se MP3 staviti na tržište

za javnu upotrebu donesena je 1991.

Ono što je znatno pridonijelo popularnosti i raširenosti MP3 formata jest to što se on

koristi kompresijom za pohranjivanje audio podataka. Koristi nepovratnu kompresiju

služeći se nepreciznim aproksimacijama i djelomičnim odbacivanjem podataka. Iako

ovo ne izgleda privlačno, zapravo je prilično efikasno te dopušta znatno smanjenje u

veličini podataka, bez da se smanji kvaliteta zvuka. MP3 format izgrađen je uzimajući

u obzir znanje o ljudskom sluhu:

• Postoje zvukovi koji su izvan granica ljudskog sluha (ispod 20 Hz i iznad

20kHz)

• Postoje zvukovi na koje su ljudske uši puno osjetljivije u odnosu na druge

• Ako se dva ili više zvukova pojavljuje istovremeno, ljudsko uho bolje čuje

glasniji zvuk, dok tiši zvuk čuje slabije ili uopće ne čuje

Uzimajući u obzir ove i slične činjenice, određeni dijelovi pjesme mogu se eliminirati

bez da se značajno promjeni kvaliteta pjesme za slušatelja. Uspoređujući sa CD-

kvalitetnim digitalnim audio zapisom, MP3 kompresija može postići od 75 do 95%

redukcije u veličini, čuvajući pritom kvalitetu samog zapisa gotovo jednaku.

Sljedeći primjer zorno prikazuje poboljšanje dobiveno MP3 kompresijom:

Uzorkovanje glazbe odvija se frekvencijom od 44.1 kHz, a uzorci su veliki 2 bajta (16

bita). Odvojeno se uzimaju uzorci za lijevi i desni zvučnik stereo sustava. To znači da

uz 1.4 milijuna bita po sekundi, što je jednako 176000 bajtova po sekundi, za

prosječnu pjesmu trajanja 3 minute dobijemo 32 MB podataka. Spremajući tu pjesmu

u MP3 format dobiva se datoteka veličine otprilike 3 MB.

Jasno je da MP3 format znatno olakšava prijenos i pohranjivanje audio podataka.

Upravo je ta kombinacija male veličine audio zapisa uz prihvatljivu kvalitetu dovela do

globalne popularnosti MP3 formata 1990.-ih godina, koja traje sve do danas. No,

rasprostranjenost MP3 formata dovela je i do nekih neželjenih posljedica, kao što su

olakšavanje i širenje piratstva u području glazbene industrije.

2. MP3 format

2.1 Struktura MP3 datoteke

MP3 datoteka sastavljena je od MP3 okvira, koji se sastoje od zaglavlja i bloka

podataka. Ti okviri nisu nezavisni, a zajedno čine cjelinu. Slijed okvira naziva se

elementarni tok. MP3 datoteka započinje „magičnim brojem“ koji može biti 0xFFFB

ako se radi o datoteci bez metapodataka ili kod koje se metapodatci nalaze na kraju

datoteke, ili može biti 0x494433 („ID3“), ako se za spremanje metapodataka koristi

ID3v2 spremnik. Više informacija o metapodatcima nalazi se u narednom poglavlju.

MP3 podatkovni blokovi sadrže komprimirane audio zapise, tj. njihove frekvencije

i amplitude. Format jedne MP3 datoteke prikazan je na sljedećoj slici:

Slika 1: Format MP3 datoteke, preuzeto sa Wikipedie [2]

Što se tiče zaglavlja u okviru, u njemu su sadržani podaci o kojem standardu se radi

(uvijek MPEG) i o njegovom sloju (uvijek sloj/Layer 3), informacije o frekvenciji

uzorkovanja i o brzini kodiranja (eng. Bit Rate) podatkovnog bloka koji slijedi,

informacije postoji li zaštite autorskih prava, radi li se o originalu ili kopiji, te ostale

bitne informacije. Na početku svakog zaglavlja nalazi se sinkrona riječ (0xFFF) koja

služi za identificiranje početka valjanog okvira. Zajedno sa sljedećim podacima koji

označava MPEG standard sloja 3, vidljivo je da svako MP3 zaglavlje započinje

oznakom 0xFFFB (što je ujedno i „magičan broj“ MP3 formata). Struktura zaglavlja

prikazana je na sljedećoj slici:

Slika 2: Zaglavlje MP3 okvira, preuzeto sa Wikipedije [2]

2.2 Kodiranje i dekodiranje

Efikasnost kompresije uvelike ovisi o željenoj brzini kodiranja (eng. Bit rate) audio

sadržaja. Većina MP3 enkodera dopušta korisniku da odabere brzinu kodiranja koju

želi da njegova MP3 datoteka ima. Što je brzina kodiranja manja, to će enkoder više

informacija odbaciti u postupku kodiranja. Brzina kodiranja od 128 Kbps rezultira

kvalitetom zvuka jednako kao što se može čuti na radiju, dok se preporuča korištenje

brzine kodiranja od 160 Kbps i više ako je cilj postići kvalitetu zvuka slična zvuku

snimke na CD-u (audio snimka uobičajeno ima vrijednost od 1411 Kbps).

U počecima MP3 formata većina enkodera koristili su konstantu brzinu kodiranja

(eng. Constant Bit Rate = CBR) za kodiranje cijele datoteke. To znači da se svi

dijelovi audio zapisa reproduciraju jednakom brzinom kodiranja te je veličina izlazne

datoteke predvidiva. No, kako su enkoderi postajali sve sofisticiraniji tako su se počeli

primjenjivati varijabilne brzine kodiranja (eng. Variable Bit Rate) tijekom kodiranja. Na

taj način audio zapis postaje još kvalitetniji, jer svaki MP3 okvir može imati različitu

brzinu kodiranja. Lošiji dijelovi zapisa (kao što su razdoblja tišine) mogu se kodirati sa

manjim brzinama kodiranja, dok se važniji dijelovi kodiraju sa većim brzinama

kodiranja. Kako bi veličina izlazne datoteke bila koliko-toliko predvidiva, pazi se da

ukupna prosječna brzina kodiranja bude jednaka onoj koju je korisnik izabrao.

MPEG-1 standard nije definirao preciznu specifikaciju za MP3 kodiranje, te se od

implementatora standarda očekuje da izgrade svoje vlastite algoritme za

komprimiranje i brisanje određenih (nevažnih) podataka iz originalnog audio zapisa.

Kao rezultat toga, na tržištu su se pojavili brojni MP3 enkoderi od kojih svaki

izgrađuje datoteke različite kvalitete. Neki enkoderi (kao što je LAME) koji su bili

izvrsni u kodiranju sadržaja velikih brzina kodiranja (eng. Bit rate), nisu bili previše

učinkoviti pri kodiranju sadržaja nižih brzina kodiranja (eng. Bit rate). Tijekom

vremena, LAME je evoluirao i postao de facto službeni MP3 enkoder.

Što se tiče dekodiranja, za razliku od kodiranja, ono je detaljno opisano u standardu.

Većina dekodera kao dekomprimirani izlaz daje isti izlaz koji je specificiran

matematički u ISO/IEC dokumentu visokog standarda (ISO/IEC 11172-3). Uz to, neki

dekoderi, kao što je LAME, mogu priložiti dodatne meta podatke koji sviračima (eng.

Player) omogućavaju još bolje izvođenje. Na sljedećoj slici prikazane su brzine

kodiranja koje određeni MPEG standardi dopuštaju:

Slika 3: Dostupne brzine prijenosa (kbit/s), preuzeto sa Wikipedije [2]

3. Metapodatci

Metapodatci su od posebnog interesa za računalnu forenziku budući da daju

razne informacije o samom dokumentu. U ovom slučaju, bitni podaci bili bi naslov

audio zapisa, informacije o autoru, je li djelo zaštićeno autorskim pravima i slično.

Unatoč tome, MP3 standardi ne definiraju nikakve oznake koje bi sadržavale

dodatne (meta) podatke o samom audio zapisu, niti postoji bilo kakav standardni

spremnik (eng. cotainer) koji bi sadržavao metapodatke. Ipak, nekoliko de facto

standarda za formate metapodataka ipak postoji. Najrašireniji među njima su ID3v1 i

ID3v2, te noviji APEv2.

3.1 ID3

ID3 je spremnik metapodataka korišten najčešće u kombinaciji sa MP3 formatom.

On omogućava pohranu bitnih informacija, kao što su naslov, ime izvođača, redni

broj zapisa i drugih, unutar audio datoteke koja sadrži zapis. Postoje dvije

nepovezane verzije; ID3v1 i ID3v2.

ID3v1 zauzima 128 bajta, sve oznake su fiksne duljine te se metapodatci dodaju na

kraj MP3 datoteke. Početak metapodataka označen je tekstualnom oznakom „TAG“.

Budući da se metapodatci nalaze na kraju, to omogućuje kompatibilnost unatrag.

Većina modernih svirača (eng. Player) će ispravno protumačiti metapodatke, dok će

ih stariji ignorirati.

Iako ID3v2 dijeli ime s prethodnom verzijom, ona je ustvari potpuno drugačija od nje.

Oznake u ovoj verziji su varijabilne duljine, te se metapodatci nalaze na počeku MP3

datoteke. Sastoje se od određenog broja okvira, od kojih svaki sadrži jedan dio

metapodataka, te se prepoznaju po oznakama (ID) od 4 bajta koje prethode svakom

okviru. Okviri mogu biti duljine do 16 MB, dok je ukupna veličina metapodataka

ograničena na 256 MB. Posljednja ID3v2.4 specifikacija sadrži 83 različite tipa okvira,

a aplikacije mogu definirati i svoje vlastite tipove. Na sljedećoj slici prikazan je izgled

ID3v2 formata:

Slika 4: ID3v2 format, preuzeto sa http://ample.sourceforge.net/developers.shtml

3.2 APEv2

APE također služi za spremanje bitnih metapodataka o audio zapisu. Za razliku

od najraširenijih ID3v2 oznaka, APE oznake spremaju se na kraj MP3 datoteke. Za

razliku od ID3, ove oznake su nestrukturirane u obliku para ključ-vrijednost. Dodatno,

verzija APEv2 ima zaglavlje, što pruže mogućnost da se APE metapodatci spreme

na početku MP3 datoteke (iako to nije praksa), i dozvoljava Unicode, a ne više samo

običan ASCII kao APEv1.

3.3 Alati za čitanje i uređivanje metapodataka

Gotovo svi alati koji se bavi audio zapisima mogu čitati MP3 metapodatke, a većina

ih može i djelomično ili potpuno uređivati. Ovdje će biti pobrojani samo neki,

najpoznatiji.

• Mp3tag

Ovo je jedan od najkorištenijih alata za uređivanje MP3 metapodataka, a ujedno je i

besplatan. Uključuje podršku za uređivanje ID3v1, ID3v2, ID3v2.4, WMA, iTunes

MP4 i još mnogo drugih oznaka. Ima mogućnost uređivanja svih oznaka, od imena

albuma do uređivanja naslovne slike za audio zapis, te čitanje informacija kao što su

brzina prijenosa (eng. Bit Rate) i sličnih. Osim toga, alat može i automatski uvoziti

oznake sa nekoliko različitih baza podataka, kao što su Amazon, discogs,

MusicBrainz i drugi, te tako olakšati mukotrpan posao. Na slici 5 prikazan je izgled

alata. U središnjem dijelu prikazani su svi audio zapisi iz odabranog direktorija, a sa

lijeve strane prikazane su oznake za odabrani audio zapis, koje se mogu uređivati.

Slika 5: Mp3Tag program, slika zaslona

• Windows Media Player

Svakako najpoznatiji alat, prvenstveno služi za reprodukciju audio i video sadržaja,

ali također ima mogućnosti čitanja i (djelomičnog) uređivanja MP3 metapodataka:

Slika 6: Windows Media Player, slika zaslona

• ExifTool

Nipošto se ne smije zaboraviti na ExifTool, koji iako ne pruža mogućnost uređenja

metapodataka, ima druge prednosti. Tako naime s pomoću njega možemo vidjeti i

druge podatke koji su za većinu ostalih alata skriveni, kao što su brzina prijenosa

(eng. Bit Rate), frekvencija uzorkovanja (eng. Sample Rate), koja vrsta enkodera je

korištena, tko je izvršio kodiranje te još mnogo drugih zanimljivih informacija.

Slika 7: ExifTool, snimka zaslona

4. Zaključak

MP3 format jedan je od najraširenijih formata za pohranu i prijenos glazbe.

Specificiran je MPEG standardima, a svoju popularnost prvenstveno duguje

jednostavnošću kojom barata sa audio zapisima. Uz visoku razinu kompresije i puno

uštede memorijskog prostora, istodobno uspijeva sačuvati kvalitetu audio zapisa tako

da bude na zadovoljavajućoj razini za ljudsko slušanje. Osim toga, omogućuje

korisniku da komprimira podatke više ili manje, ovisno o razini kvalitete koju želi

postići.

Struktura mu je jako jednostavna te se sastoji od slijednog niza okvira. Svaki okvir

sadrži zaglavlje i podatkovni dio, a u zaglavlju su opisana svojstva podatkovnog

dijela (frekvencija uzorkovanja, …). Usprkos svojoj rasprostranjenosti, nema

definiranu strukturu metapodataka, te se mora osloniti na druge standarde za

pohranu svojih metapodataka. Najpoznatiji je zasigurno ID3v2, a od ostalih se još

koriste ID3v1 i APEv2.

MP3 format je zbog svojih svojstava promijenio način na koji se sprema i

prenosi glazba, ali i mnogo više od toga. Utjecao je na samu glazbu, odvajajući je od

njene do tada primarne platforme – CD-a. Omogućavajući do tada nezamislivo lagani

prijenos preko interneta, uzrokova je nažalost i porast piratstva u glazbenoj industriji

te je time utjecao čak i na sam Internet i njegovu legislativu vezanu uz piratstvo.

5. Literatura

1. „MP3 i MP4 razlike i sve što bi trebali znati o tome”,

http://pcchip.hr/helpdesk/mp3-i-mp4-razlike-i-sve-sto-bi-trebali-znati-o-tome/,

25.01.2018.

2. „MP3”, https://en.wikipedia.org/wiki/MP3, 25.01.2018.

3. „How MP3 Files Work”, https://computer.howstuffworks.com/mp3.htm,

25.01.2018.

4. „ID3“, https://en.wikipedia.org/wiki/ID3, 25.01.2018.

5. „10 Best Tools to Tag MP3s and Edit Metadata“, https://www.online-tech-

tips.com/free-software-downloads/mp3-metadata/, 25.01.2018.

6. „APE tag“, https://en.wikipedia.org/wiki/APE_tag, 25.01.2018.