57
Análise Comparativa: MP3 e AAC Bernardo de Campos Vidal Camilo Pedro de Vasconcellos Rachel Gonçalves de Castro 20/03/2022 1 Universidade Federal do Rio de Janeiro

Análise Comparativa: MP3 e AAC

Embed Size (px)

Citation preview

Page 1: Análise Comparativa: MP3 e AAC

Análise Comparativa: MP3 e AAC

Bernardo de Campos Vidal CamiloPedro de Vasconcellos

Rachel Gonçalves de Castro

15/04/2023 1Universidade Federal do Rio de Janeiro

Page 2: Análise Comparativa: MP3 e AAC

Roteiro

• Introdução– Motivação– MPEG– Janela

• Codificador perceptivo• MP3• AAC• Conclusão

– Vantagens e desvantagens• Bibliografia• Dúvidas

15/04/2023 2Universidade Federal do Rio de Janeiro

Page 3: Análise Comparativa: MP3 e AAC

Introdução - Motivação

15/04/2023 3Universidade Federal do Rio de Janeiro

• Grande evolução na codificação de áudio• Mais “populares”– MP3 e AAC

• “Qual codec apresenta maior qualidade?”

Page 4: Análise Comparativa: MP3 e AAC

Introdução - MPEG

• Moving Pictures Expert Group– Organização Internacional de Normalização– Estabelecer normas internacioanis para codificação de áudio

• MP3– MPEG-1 Layer 3

• AAC– MPEG-2

• Compressão com perdas– Irrelevância perceptiva do sistema auditivo– Redundância estatística

15/04/2023 4Universidade Federal do Rio de Janeiro

Page 5: Análise Comparativa: MP3 e AAC

Introdução - MPEG

• Evolução:

15/04/2023 5Universidade Federal do Rio de Janeiro

Page 6: Análise Comparativa: MP3 e AAC

Introdução - MPEG

• Aplicações:– Produção de áudio– Transmissão de som televiso– Armazenamento digital

15/04/2023 6Universidade Federal do Rio de Janeiro

Page 7: Análise Comparativa: MP3 e AAC

Janela

15/04/2023 7Universidade Federal do Rio de Janeiro

10Hz Senoidal

Page 8: Análise Comparativa: MP3 e AAC

Janela

15/04/2023 8Universidade Federal do Rio de Janeiro

FFT 10Hz Senoidal

Page 9: Análise Comparativa: MP3 e AAC

Janela

15/04/2023 9Universidade Federal do Rio de Janeiro

Senoidal 9.5Hz

Page 10: Análise Comparativa: MP3 e AAC

Janela

15/04/2023 10Universidade Federal do Rio de Janeiro

FFT Senoidal 9.5Hz

Page 11: Análise Comparativa: MP3 e AAC

Janela

15/04/2023 11Universidade Federal do Rio de Janeiro

Senoidal 9.5Hz Fim-a-Fim

Page 12: Análise Comparativa: MP3 e AAC

Janela

15/04/2023 12Universidade Federal do Rio de Janeiro

Hanning window

Page 13: Análise Comparativa: MP3 e AAC

Janela

15/04/2023 13Universidade Federal do Rio de Janeiro

Senoidal multiplicada pela janela

Page 14: Análise Comparativa: MP3 e AAC

Janela

15/04/2023 14Universidade Federal do Rio de Janeiro

FFT Senoidal 9.5Hz (após janela)

Page 15: Análise Comparativa: MP3 e AAC

Janela

15/04/2023 15Universidade Federal do Rio de Janeiro

FFT Senoidal 10Hz (após janela)

Page 16: Análise Comparativa: MP3 e AAC

Janela

15/04/2023 16Universidade Federal do Rio de Janeiro

Senoidal 10Hz, evento curto de 100Hz

Page 17: Análise Comparativa: MP3 e AAC

Janela

15/04/2023 17Universidade Federal do Rio de Janeiro

50% overlapping

Page 18: Análise Comparativa: MP3 e AAC

Janela

15/04/2023 18Universidade Federal do Rio de Janeiro

Spectro com 0% e 50% overlapping

Page 19: Análise Comparativa: MP3 e AAC

Janela

15/04/2023 19Universidade Federal do Rio de Janeiro

Janela curta: boa resolução por tempo

Page 20: Análise Comparativa: MP3 e AAC

Janela

15/04/2023 20Universidade Federal do Rio de Janeiro

Janela longa: boa resolução por frequência

Page 21: Análise Comparativa: MP3 e AAC

Janela

15/04/2023 21Universidade Federal do Rio de Janeiro

Page 22: Análise Comparativa: MP3 e AAC

Janela

15/04/2023 22Universidade Federal do Rio de Janeiro

Page 23: Análise Comparativa: MP3 e AAC

Codificador Perceptivo

15/04/2023 23Universidade Federal do Rio de Janeiro

Banco de Filtros:• Domínio do tempo domínio da frequência

Modelo perceptivo:• Computar estimativa do limiar de mascaramento usando regras da psico-acústica

Quantização e Codificação:• Componentes espectrais são quantizados e codificados com o objetivo de manter o ruído, introduzido pela quantização, abaixo do limiar de mascaramento

Codificação de bitstream:• Juntar o bitstream (coeficientes espectrais + outras informações)

Page 24: Análise Comparativa: MP3 e AAC

MP3

15/04/2023 24Universidade Federal do Rio de Janeiro

Page 25: Análise Comparativa: MP3 e AAC

MP3

• Banco de Filtro polifásico– Divide o sinal em 32 sub-bandas

15/04/2023 Universidade Federal do Rio de Janeiro 25

Page 26: Análise Comparativa: MP3 e AAC

MP3

• MDCT (Modified Discrete Cosine Transform)– Converte o sinal para o domínio da frequência– Divide cada sub-banda em 18 mais finas

– Melhor eliminação de redundância

15/04/2023 Universidade Federal do Rio de Janeiro 26

32 * 18 = 576 linhas de frequência

Page 27: Análise Comparativa: MP3 e AAC

MP3

• FFT 1024 Points (Fast Fourier Transform)– Converte o sinal para o dimínio da frequência– Maior resolução da frequência– Cálculo do limiar de mascaramento

15/04/2023 Universidade Federal do Rio de Janeiro 27

Page 28: Análise Comparativa: MP3 e AAC

MP3

• Modelo Psico-Acústico– Leva em consideração a sensibilidade do ouvido

humano– Frequências entre 20Hz a 20KHz– Limiar de audição

15/04/2023 Universidade Federal do Rio de Janeiro 28

Page 29: Análise Comparativa: MP3 e AAC

MP3

• Modelo Psico-Acústico– Mascaramento em frequência

– Mascaramento temporal

15/04/2023 Universidade Federal do Rio de Janeiro 29

Page 30: Análise Comparativa: MP3 e AAC

MP3

• Modelo Psico-Acústico– Limiar de mascaramento

15/04/2023 Universidade Federal do Rio de Janeiro 30

Page 31: Análise Comparativa: MP3 e AAC

MP3

• Codificação de Huffman– Utiliza a probabilidade de ocorrência para

construir uma árvore de codificação

15/04/2023 Universidade Federal do Rio de Janeiro 31

Page 32: Análise Comparativa: MP3 e AAC

MP3

• Quantização e codificação– Codifica com menor precisão valores grandes– Dois loops: • Rate Control Loop • Distortion Control Loop

15/04/2023 Universidade Federal do Rio de Janeiro 32

Page 33: Análise Comparativa: MP3 e AAC

MP3

• Rate Control Loop – Número de bits resultante deve ser menor que

número de bits disponível– Passo de quantização aumenta valores

quantizados diminuem

15/04/2023 Universidade Federal do Rio de Janeiro 33

Page 34: Análise Comparativa: MP3 e AAC

MP3

• Distortion Control Loop – Controla ruído causado pelo processo de

quantização– Ruído abaixo do limiar de mascaramento– Fatores de escala

15/04/2023 Universidade Federal do Rio de Janeiro 34

Page 35: Análise Comparativa: MP3 e AAC

MP3

• Formatação de Bitstream – Armazena o som codificado em frames– Cada frame contem informação de 1152 amostras

de áudio

15/04/2023 Universidade Federal do Rio de Janeiro 35

Page 36: Análise Comparativa: MP3 e AAC

AAC

15/04/2023 36Universidade Federal do Rio de Janeiro

Gain Control

Filter Bank TNS

Intensity/

CouplingPrediction M/S

Scale Factors

Quant.Noiseless

Coding

Rate/Distortion Control

Bitstream Multiplexer

Perceptual Model

Input time

signal Spectral Processing

Quantization and Noiseless Coding

Bitstream Output Data

Control

Page 37: Análise Comparativa: MP3 e AAC

AAC

• Gain Control– Opcional– Normalmente não usado– PQF (filtro polifásico de quadratura)• 4 bandas de frequência igualmente espaçadas• Taxas de amostragem ajustáveis

15/04/2023 37Universidade Federal do Rio de Janeiro

Page 38: Análise Comparativa: MP3 e AAC

AAC

15/04/2023 38Universidade Federal do Rio de Janeiro

Gain Control

Filter Bank TNS

Intensity/

CouplingPrediction M/S

Scale Factors

Quant.Noiseless

Coding

Rate/Distortion Control

Bitstream Multiplexer

Perceptual Model

Input time

signal Spectral Processing

Quantization and Noiseless Coding

Bitstream Output Data

Control

Page 39: Análise Comparativa: MP3 e AAC

AAC

• Filter Bank– MDCT Puro, 50% sobreposição• Aplicado diretamente sobre os frames, antes da divisão

em 32 sub-bandas• Long window: 2048 amostras• Short window: 256 amostras (x8)

– 1024 linhas de frequência

15/04/2023 39Universidade Federal do Rio de Janeiro

Page 40: Análise Comparativa: MP3 e AAC

AAC

15/04/2023 40Universidade Federal do Rio de Janeiro

Gain Control

Filter Bank TNS

Intensity/

CouplingPrediction M/S

Scale Factors

Quant.Noiseless

Coding

Rate/Distortion Control

Bitstream Multiplexer

Perceptual Model

Input time

signal Spectral Processing

Quantization and Noiseless Coding

Bitstream Output Data

Control

Page 41: Análise Comparativa: MP3 e AAC

AAC

• TNS (Temporal Noise Shaping)– Opcional– Molda o ruído de quantização no domínio do

tempo

15/04/2023 41Universidade Federal do Rio de Janeiro

Page 42: Análise Comparativa: MP3 e AAC

AAC

• TNS (Temporal Noise Shaping)

15/04/2023 42Universidade Federal do Rio de Janeiro

Sinal Original Ruído quantizado com TNS Ruído quantizado sem TNS

Page 43: Análise Comparativa: MP3 e AAC

AAC

• TNS (Temporal Noise Shaping)

15/04/2023 43Universidade Federal do Rio de Janeiro

Sinal Original

Quantizado com TNS

Quantizado sem TNS

Page 44: Análise Comparativa: MP3 e AAC

AAC

15/04/2023 44Universidade Federal do Rio de Janeiro

Gain Control

Filter Bank TNS

Intensity/

CouplingPrediction M/S

Scale Factors

Quant.Noiseless

Coding

Rate/Distortion Control

Bitstream Multiplexer

Perceptual Model

Input time

signal Spectral Processing

Quantization and Noiseless Coding

Bitstream Output Data

Control

Page 45: Análise Comparativa: MP3 e AAC

AAC

• Intensity/Coupling– Opcional– Combina dois canais stereo (left/right) em um só

(mono)– Explora redudâncias na região de alta frequência

15/04/2023 45Universidade Federal do Rio de Janeiro

Page 46: Análise Comparativa: MP3 e AAC

AAC

15/04/2023 46Universidade Federal do Rio de Janeiro

Gain Control

Filter Bank TNS

Intensity/

CouplingPrediction M/S

Scale Factors

Quant.Noiseless

Coding

Rate/Distortion Control

Bitstream Multiplexer

Perceptual Model

Input time

signal Spectral Processing

Quantization and Noiseless Coding

Bitstream Output Data

Control

Page 47: Análise Comparativa: MP3 e AAC

AAC

• Prediction– Opcional– Usado para minimizar redundâncias– Eficiente em sinal estacionário/periódico– Aproveita semelhanças dos coeficientes

quantizados de blocos adjacentes

15/04/2023 47Universidade Federal do Rio de Janeiro

Page 48: Análise Comparativa: MP3 e AAC

AAC

• Prediction

15/04/2023 48Universidade Federal do Rio de Janeiro

2 frames seguidos com um mesmo padrão

Page 49: Análise Comparativa: MP3 e AAC

AAC

• Prediction

15/04/2023 49Universidade Federal do Rio de Janeiro

Comparação

Page 50: Análise Comparativa: MP3 e AAC

AAC

• Prediction

15/04/2023 50Universidade Federal do Rio de Janeiro

Transformada

Page 51: Análise Comparativa: MP3 e AAC

AAC

• Prediction

15/04/2023 51Universidade Federal do Rio de Janeiro

Coeficientes divididos em bandas

Resíduo enviado (acima)

Page 52: Análise Comparativa: MP3 e AAC

AAC

15/04/2023 52Universidade Federal do Rio de Janeiro

Gain Control

Filter Bank TNS

Intensity/

CouplingPrediction M/S

Scale Factors

Quant.Noiseless

Coding

Rate/Distortion Control

Bitstream Multiplexer

Perceptual Model

Input time

signal Spectral Processing

Quantization and Noiseless Coding

Bitstream Output Data

Control

Page 53: Análise Comparativa: MP3 e AAC

AAC

• M/S– Opcional– Converte um sinal stereo em dois formatos:• Middle (soma, L + R)• Side (diferença, L – R)

– Não altera o sinal de cada canal (diferentemente do intensity/coupling), que pode ser reconstruído

– Aplicado o mascaramento, verifica qual codificação (L/R, M/S) exige menos bits

15/04/2023 53Universidade Federal do Rio de Janeiro

Page 54: Análise Comparativa: MP3 e AAC

Conclusão

• O AAC é, possivelmente, o sucessor do MP3

15/04/2023 54Universidade Federal do Rio de Janeiro

A melhoria da compressão oferece resultados de alta qualidade com menores tamanhos de arquivoSuporte para multicanais de áudio (até 48 canais de frequência)

Melhoria na eficiência da decodificação, requerendo menos potência

Page 55: Análise Comparativa: MP3 e AAC

Conclusão

• Por que o MP3 continua forte?

15/04/2023 55Universidade Federal do Rio de Janeiro

Familiaridade com o formato

Grande quantidade de música disponível no formato MP3

Grande variedade de hardware e software que “tira vantagem” do formatoAusência de restrições DRM (Digital Rights Management)

A maioria dos utilizadores não conhece ou ignora as desvantagens do formato

Page 56: Análise Comparativa: MP3 e AAC

Dúvidas

?15/04/2023 56Universidade Federal do Rio de Janeiro

Page 57: Análise Comparativa: MP3 e AAC

Dúvidas

Obrigado!

15/04/2023 57Universidade Federal do Rio de Janeiro