7
ESTUDO DA VARIAÇÃO DO TIMBRE DA CLARINETA NA INTERPRETAÇÃO DE FRASES MUSICAIS ATRAVÉS DE ANÁLISE POR COMPONENTES PRINCIPAIS DA DISTRIBUIÇÃO ESPECTRAL Hugo B. de Paula ([email protected]) Hani C. Yehia ([email protected]) CPDEE, Departamento de Engenharia Elétrica Maurício A. Loureiro ([email protected]) CPMC, Escola de Música Universidade Federal de Minas Gerais Av. Pres. Antônio Carlos, 6627, Belo Horizonte, MG, Brasil - 31270-901 Resumo. Foram feitas medições da variação temporal das amplitudes e das freqüências dos componentes harmônicos do som produzido por um instrumento musical (clarineta), visando investigar o significado dos parâmetros físicos determinantes da variação do timbre do ins- trumento, na realização de um gesto “expressivo” numa interpretação musical. As curvas de amplitude obtidas apresentaram um grande grau de correlação, tanto no sentido do tempo ou quanto no sentido da freqüência. A Análise por Componentes Principais (PCA) mostrou-se adequada para identificar padrões de variação da distribuição espectral através de redução de dados, visando relacioná-los com as características perceptivas. Este método de análise se mostrou efetivo e parece revelar características importantes das variações destes parâmetros, passíveis de especulação de uma “variação de timbre”. Palavras-chave: Timbre, Análise Espectral, PCA, síntese de instrumentos musicais 1. INTRODUÇÃO O conceito de timbre se refere à cor ou à qualidade do som e está normalmente dissociado dos conceitos de intensidade e altura. Timbre é definido pela ASA (American Standard Association) como “aquele atributo do sentido auditivo em termos do qual o ouvinte pode julgar que dois sons similarmente apresentados e tendo a mesma intensidade e altura, são dissimilares” (Risset e Wessel, 1982). Esta vaga definição está relacionada com a multidimensionalidade inerente a este atributo, o qual não pode ser escalonado por quantidades unidimensionais, tal como acontece com o volume e altura, cujas variações podem ser descritas por escalas entre fraco- forte e grave-agudo, respectivamente, e que podem por isso ser especificados quantitativamente pelo sistema tradicional de notação musical. As variações de timbre são percebidas, por exemplo, como agrupamentos de sons tocados por um mesmo instrumento musical, ou falados por uma mesma pessoa, mesmo que

CLARINETE - ARTIGO - Estudo das variações do timbre da clarineta

Embed Size (px)

Citation preview

Page 1: CLARINETE - ARTIGO - Estudo das variações do timbre da clarineta

ESTUDO DA VARIAÇÃO DO TIMBRE DA CLARINETA NA INTERPRETAÇÃO DE FRASES MUSICAIS ATRAVÉS DE ANÁLISE POR COMPONENTES

PRINCIPAIS DA DISTRIBUIÇÃO ESPECTRAL Hugo B. de Paula ([email protected]) Hani C. Yehia ([email protected]) CPDEE, Departamento de Engenharia Elétrica Maurício A. Loureiro ([email protected]) CPMC, Escola de Música Universidade Federal de Minas Gerais Av. Pres. Antônio Carlos, 6627, Belo Horizonte, MG, Brasil - 31270-901 Resumo. Foram feitas medições da variação temporal das amplitudes e das freqüências dos componentes harmônicos do som produzido por um instrumento musical (clarineta), visando investigar o significado dos parâmetros físicos determinantes da variação do timbre do ins-trumento, na realização de um gesto “expressivo” numa interpretação musical. As curvas de amplitude obtidas apresentaram um grande grau de correlação, tanto no sentido do tempo ou quanto no sentido da freqüência. A Análise por Componentes Principais (PCA) mostrou-se adequada para identificar padrões de variação da distribuição espectral através de redução de dados, visando relacioná-los com as características perceptivas. Este método de análise se mostrou efetivo e parece revelar características importantes das variações destes parâmetros, passíveis de especulação de uma “variação de timbre”. Palavras-chave: Timbre, Análise Espectral, PCA, síntese de instrumentos musicais 1. INTRODUÇÃO O conceito de timbre se refere à cor ou à qualidade do som e está normalmente dissociado dos conceitos de intensidade e altura. Timbre é definido pela ASA (American Standard Association) como “aquele atributo do sentido auditivo em termos do qual o ouvinte pode julgar que dois sons similarmente apresentados e tendo a mesma intensidade e altura, são dissimilares” (Risset e Wessel, 1982). Esta vaga definição está relacionada com a multidimensionalidade inerente a este atributo, o qual não pode ser escalonado por quantidades unidimensionais, tal como acontece com o volume e altura, cujas variações podem ser descritas por escalas entre fraco-forte e grave-agudo, respectivamente, e que podem por isso ser especificados quantitativamente pelo sistema tradicional de notação musical. As variações de timbre são percebidas, por exemplo, como agrupamentos de sons tocados por um mesmo instrumento musical, ou falados por uma mesma pessoa, mesmo que

Page 2: CLARINETE - ARTIGO - Estudo das variações do timbre da clarineta

estes sons possam ser bem distintos entre si, de acordo com sua altura, intensidade e duração. De fato, a maioria das pesquisas em timbre têm se desenvolvido no âmbito da percepção de sons de instrumentos musicais e da voz.

Estes trabalhos demonstram que a distribuição da energia espectral e a variação temporal desta distribuição fornecem os determinantes acústicos de nossa percepção de qualidade so-nora. Na década de 60, inúmeros trabalho de pesquisa realizados com métodos de análise e síntese de sons de instrumentos musicais mostraram ser bastante adequada a representação destes sons através de curvas de variações temporais das amplitudes e das freqüências dos componentes harmônicos. (Risset, 1965 e 1991; Strong e Clark, 1967; Gordon e Grey, 1977, 1978; Grey, 1975, 1978).

A motivação em se tomar sons de instrumentos musicais tradicionais e procurar imitá-los com a maior fidelidade possível, certamente não está limitada somente ao propósito de dupli-car eletronicamente estes sons, mas em tentar compreender, medir e até parametrizar o timbre, procurando compreender o controle dinâmico e instantâneo que os instrumentistas detêm sobre o som de seus instrumentos e, assim, entender melhor como ouvimos a música produzida com eles. 2. OBJETIVOS DO ESTUDO O conceito de timbre torna-se ainda mais impreciso quando consideramos que num mesmo instrumento musical, o intérprete pode produzir timbres diferentes, dependendo da altura da nota e da maneira como é tocada. A grande maioria dos estudos realizados sobre o timbre de instrumentos musicais têm se restringido à análise de notas musicais isoladas, ou seja, sem variações radicais de freqüência da fundamental, em geral abordando comparações entre dife-rentes instrumentos musicais e fora de qualquer contexto musical, focalizando apenas a dis-criminação entre instrumentos. Muito pouco foi realizado em relação à variação de timbre num mesmo instrumento ou mesmo dentro do âmbito de uma mesma nota. Estas variações são significativas para a percepção da música tocada, pois são estes mecanismos perceptivos que dão ao ouvinte a noção de expressividade em uma seqüência de notas, comumente desi-gnadas por "frase musical".

Apesar dos instrumentos acústicos tradicionais oferecerem possibilidades de produzir e controlar com precisão uma vasta gama de timbres, não existe para este atributo um sistema de classificação de seus estados de evolução ao longo do tempo. O presente projeto se propõe a investigar a variação do timbre da clarineta ao longo de execuções de frases musicais seleci-onadas de tal maneira a abranger todos os registros do instrumento. Ao invés de tratar notas isoladas e quase-estáticas, este trabalho busca estudar frases musicais selecionadas em con-textos musicais representativos do instrumento analisado, visando investigar o significado de parâmetros físicos determinantes da variação do timbre de um instrumento, na realização de um gesto “musical” ou “expressivo” numa interpretação musical.

3. AQUISIÇÃO DE DADOS 3.1. Escolha das Amostras As amostras analisadas foram tomadas da melodia tocada pela clarineta na abertura do Quin-tetto op. 115 em Si menor para clarineta e quarteto de cordas de J. Brahms, procurando ca-racterizar aspectos timbrísticos do instrumento e incluir, sobretudo, frases com grande teor ex-pressivo. A escrita do Fá# do 6º compasso, por exemplo, indica ao intérprete uma evolução temporal acentuada da variação da intensidade e do timbre (Loureiro, 1996). As gravações foram feitas na Escola de Música da UFMG e executadas por Maurício A. Loureiro.

Page 3: CLARINETE - ARTIGO - Estudo das variações do timbre da clarineta

3.2. Variações temporais de Amplitude e Freqüência Neste estudo, o sinal foi representado por seu espectrograma. Para se obter um maior foco na análise do sinal, assumiu-se que o som amostrado é perfeitamente harmônico e que uma nota isolada possui uma única freqüência fundamental bem definida. Essas suposições permitiram a utilização da Transformada-Z Chirp como ferramenta alternativa à DFT na análise espectral. A Transformada-Z Chirp funciona como uma DFT em “zoom”, proporcionando uma descri-ção mais detalhada de freqüências específicas do espectro (Stearns e David, 1996). 3.3. Simplificação dos dados Após as medições, as curvas de magnitude do espectro mostraram pequenas variações que ocorriam em curtos espaços de tempo. Vários trabalhos de pesquisa procuram validar métodos de simplificação de modo a obter um espectro suavizado, que alcance maior fidelidade na sín-tese de sons de instrumentos musicais. De uma maneira geral, estes trabalhos conduziram a conclusões de que certas micro-flutuações de amplitudes e freqüências não são percebidas e podem ser simplificadas por aproximação de segmentos lineares, podendo-se atingir uma compressão de 20:1 a 50:1 sem perdas de informação (Grey, 1975).

A simplificação do sinal foi feita aplicando-se a suavização proposta por Rabiner e Schafer (1978), pp. 158-162. Este modelo de suavização de dados foi obtido pela combinação de um filtro mediano e um filtro linear. Um filtro mediano de ordem L tem a propriedade desejável de não eliminar grandes descontinuidades do sinal (com duração maior que L/2 amostras). Ele simplesmente segue o sinal como se fosse um polinômio de baixa ordem. Entretanto, falha em eliminar descontinuidades severas impostas por componentes ruidosas do sinal. A combinação do filtro mediano com um filtro linear reduz o componente de ruído inerente ao sinal sem distorcê-lo. A reconstrução do sinal a partir destes dados simplificados mostrou que estas grandes variações de amplitude em curtos espaços de tempo têm pouco significado auditivo. Testes de audição foram suficientes para validar esta simplificação. 4. ANÁLISE DOS DADOS Desde a década de 60, pesquisas em timbre musical procuraram desenvolver métodos de escalonamento multidimensional para o timbre através de métodos de Análise Estatística de Multivariáveis, entre elas, a Análise por Componentes Principais (PCA). As primeiras experiências com PCA aplicada a parâmetros físicos de som foram feitas em 1995 (Sandell e Martens, 1995; Charbonneau et al, 1997a e 1997b). Neste estudo, a PCA foi aplicada às medições de parâmetros físicos, objetivando relacioná-los com características perceptivas. 4.1. Análise por Componentes Principais Em PCA, vetores de dados são representados por combinações lineares de uma base de veto-res ortonormais. Esta base é determinada pelas direções de máxima variância no espaço defi-nido pelos vetores de dados. Tem-se assim uma mudança de sistema de coordenadas na qual os eixos definem as “componentes principais” de um conjunto de vetores. (Johnson e Wichern, 1998; Rencher, 1995).

Seja a matriz de dados [ ]nXXXXXrrrr

..., ,32,1= que representa n observações de p variáveis. A matriz Cxx de covariância de X é dada por:

Page 4: CLARINETE - ARTIGO - Estudo das variações do timbre da clarineta

[ ]tXX XX 00E

rr=C ; xXX µ−=

rr0 e [ ]Xx

rE=µ (1)

Os componentes principais são as componentes de uma matriz de rotação U determinada

pela decomposição em valor singular (SVD) de CXX:

t

XX USUC = (2) onde S é uma matriz diagonal cujos elementos não nulos são os autovalores de CXX e U é uma matriz unitária cujas colunas são os auto-vetores normalizados (norma euclidiana unitária)

associados aos autovalores de S. A representação de X em PCs é dada por XY trr

U= . O valor

de X pode ser recuperado como YXrr

U= . Para a reconstrução do sinal podemos utilizar apenas alguns PCs, que acumulam em si a

maior variância do sinal. A porcentagem da variância total do sinal “explicada” por um subconjunto de PCs é dada pela soma acumulada dos autovalores associados aos auto-vetores usados na reconstrução. 4.2. Reconstrução dos dados A reconstrução do sinal a partir do espectro medido e processado foi feita por síntese aditiva. Na síntese aditiva, cada componente harmônico é representado por uma senóide (Serra, 1997). Como não foi considerada a variação da freqüência no decorrer do tempo, a síntese pode ser feita pela seguinte equação:

[ ]∑=

+=R

rrrr ftAts

1

)0(2cos)()( θπ (5)

onde s é sinal reconstruído, Ar(t), fr e θr(0) são amplitude, freqüência e fase inicial do harmônico r, respectivamente.

O diagrama da Fig 1 ilustra o procedimento de análise dos sinais.

Figura 1 - Diagrama da análise dos sons.

5. RESULTADOS Uma análise dos resultados obtidos com dois exemplos de amostras é apresentada a seguir. Estas amostras têm a mesma duração e freqüência (Fá# da última linha da clave de sol = 749 Hz), ambos amostrados a uma taxa de 44.1 kHz, em 16 bits, PCM linear mono. O primeiro destes exemplos, (nota expressiva) corresponde ao Fá# sustentado pela clarineta ao longo do 8º e metade do 9º compassos do quinteto de Brahms (op. 115). O outro exemplo (nota plana) corresponde à mesma nota tocada com o mínimo de variação de intensidade e fora do contexto musical. Neste exemplo a matriz X contém os valores de amplitude dos 12 primeiros harmônicos em 156 intervalos de tempo, cada um com uma duração de 23 ms.

Page 5: CLARINETE - ARTIGO - Estudo das variações do timbre da clarineta

5.1. Análise do Significado dos Componentes Principais

A Figura 2 mostra o 1º PC em função do 2º para as notas expressiva e plana, respectiva-mente. Estes gráficos equivalem a projetar os dados medidos em 12 dimensões (amplitudes de cada um dos 12 primeiros harmônicos) em um plano definido por 2 dimensões que represen-tam a maior variação destes dados. Para a nota expressiva, estas 2 dimensões resgatam 90% da variância do sinal e para a nota plana, 74%. As curvas mostram a evolução da nota no tempo, tendo cada instante de medição representado por um ponto («). Estes pontos estão ligados em ordem cronológica com o início e o final do som marcados no gráfico. Como o intervalo de tempo de cada quadro é constante (23 ms), a distância entre os pontos no gráfico representa o grau de variação do timbre, ou seja, quanto mais próximos os pontos menor é a variação entre eles.

A Figura 2 (a) mostra a extensão da trajetória da variação do timbre da nota expressiva. Maiores variações de timbre podem ser observadas no final do som, precisamente nos últimos 25 pontos (do ponto D ao final), ou seja, nos últimos 575 ms. Esta grande variação está relaci-onada com o diminuendo acentuado no final da nota. Ressalta-se que o diminuendo da nota começa aproximadamente nos últimos 2 segundos, mas a análise mostra que o timbre começa a sofrer maior variação somente a partir do último 0.5 s. É possível notar isso auditivamente, porém, testes mais sistemáticos deverão ser feitos.

(a) (b)

Figura 2 - Dois primeiros componentes principais da nota expressiva e da nota plana respectivamente.

Nota-se que esta variação é mais acentuada na direção do 1º PC. Inspecionando-se as

curvas individuais, notamos que o 1º PC acompanha a variação de intensidade dos sons, indi-cando uma relação estreita com a quantidade de energia total do sinal. Uma análise dos pesos aplicados a este PC indica que estes pesos “moldam” os componentes harmônicos com suas respectivas intensidades, mantendo entretanto, essa mesma variação temporal. As variações no 2º PC parecem se relacionar com configurações localizadas do espectro que, possivelmente, representam como nuanças timbrísticas.

Do início ao ponto B na nota expressiva, ocorrem variações de timbre bem menos acen-tuadas do que as acima mencionadas, pois verifica-se que os pontos estão bem mais próximos uns dos outros. É nesta região que ocorre o crescendo e, portanto, conclui-se que a variação de timbre é mais lenta ao longo do crescendo se comparado com o diminuendo. Esta variação se dá predominantemente no sentido positivo do 1º componente (início até A).

Page 6: CLARINETE - ARTIGO - Estudo das variações do timbre da clarineta

Observando-se a nota plana na Fig 2 (b) verifica-se claramente uma pequena variação no sentido do 1º componente, confirmando a afirmação de que o 1º PC esteja relacionado com a variação de intensidade (energia) do som. A variação no sentido do 2º PC se dá praticamente em dois movimentos: negativamente até os primeiros 3/4 do sinal e depois positivamente, mostrando um comportamento mais ordenado do 2º PC para sons mais “planos”. Este fator deve ser investigado numa comparação entre notas de diferentes alturas do instrumento. Essa variação ordenada parece representar uma menor riqueza de desenvolvimento timbrístico.

Verificou-se também que os valores acumulados de semelhança da reconstrução corres-pondente à nota plana são bem inferiores os valores medidos para a nota expressiva, mas crescem bem mais rapidamente, praticamente igualando seus valores quando 6 componentes principais são usados. Este fato sugere uma relação com as flutuações de curta duração que assumem menor importância nos PCs de ordem inferior para sinais com maior variação dinâ-mica. Testes serão feitos com PCs de ordem superior. 6. CONCLUSÃO A importância e necessidade deste estudo decorre da própria natureza do timbre, que não goza de uma definição lógica precisa, mesmo que os mecanismos da percepção envolvidos em sua detecção sejam talvez os mais precisos do nosso sistema perceptivo. A compreensão do controle dinâmico e instantâneo que os instrumentistas detêm sobre o som produzidos por seus instrumentos acústicos e de como este controle é percebido pelo ouvinte não apenas busca a compreensão do fenômeno “música”, mas também nos conduz a formulações de plataformas que forneçam outros tipos de controle de outros tipos de estruturas musicais, “… o futuro da performance ao vivo depende de novos instrumentos.” (Smalley, 1986). Referências Bibliográficas Chabornneau, G.; Hourdin. C.; Moussa, T. 1997a. “A Multidimensional Scaling Analysis of Musical

Instrument's Time-Varying Spectra,” Computer Music Journal, vol. 21, no. 2, pp. 40-55. Chabornneau, G.; Hourdin. C.; Moussa, T. 1997b. “A Sound Synthesis Technique Based on Multidimensional

Scaling of Spectra,” Computer Music Journal, vol. 21, no. 2, pp. 56-68. Grey, J. M. 1975. An Exploration of Musical Timbre. Ph.D. Dissertation, Department of Psychology, Stanford

University, Department of Music Report STAN-M-2, Palo Alto, CA. Jonhnson, R. . e Wichern, D. W. 1998. Applied Multivariate Statistical Analysis . Upper Sadlle, NJ: Prentice-

Hall. Loureiro, M. A. 1996. “Ilustrando na Clarineta a Variação e o Contrôle do timbre na Realização do Pensamento

Musical,” in Ulhôa, M. T, ed. Anais do IX Encontro Anual da ANPPOM. Rio de Janeiro, pp. 276-283. Rabiner, Lawrence, R. e Schafer, Ronald W. 1978 “Digital Processing of Speech Signals”, Prentice-Hall, Inc.

Englewood Cliffs, New Jersey 07632. Rencher, A. C. 1995. Methods of Multivariate Analysis . New York: John Wiley & sons: New York. Risset, J.-C. 1965. “Computer Study of Trumpet Tones,” Journal of the Acoustics Society of America.

(Abstracts), vol. 38, pp. 912. 1966. Bell Laboratories Report, Murray Hill, NJ. Risset, J.-C., e D. Wessel. 1982. “Exploration of Timbre by Analysis and Synthesis,” in D. Deutsch, ed.

Psychology of Music . San Diego, California: Academic Press, pp. 25-58. Sandell, G. J. e Martens, W. 1995. “Perceptual Evaluation of Principal-Component-Based Synthesis of Musical

Timbres,” Journal of the Audio Engeneering Society. vol. 43, no. 12, pp. 1013-1028. Serra, Xavier. 1997. “Musical Sound Modeling with Sinusoids plus Noise”,in , A. Piccialli e C. Roads, S. Pope

eds. Musical Signal Processing. Swets & Zeitlinger Publishers. Smalley, D. 1986. “Spectro-morphology and Structuring Processes,” in S. Emmerson, ed. The Language of

Electroacoustic Music. London: The Macmillan Press. Pp. 61-93. Stearns, Samuel D. e David, Ruth A. 1996. “Signal Processing Algorithms in Matlab”, Prentice-Hall, Inc.

Englewood Cliffs, New Jersey 07632. Strong, W. e Clark, M. 1967. “Synthesis of Wind-Instrument Tones,” Journal of the Acoustics Society of

America. vol. 41, no. 1, pp. 39-52.

Page 7: CLARINETE - ARTIGO - Estudo das variações do timbre da clarineta

STUDYING THE DINAMICS OF THE CLARINET TIMBRE IN THE EXECUTION OF A MUSICAL FRASE USING PRINCIPAL COMPONENTE ANALYSIS OVER THE SPECTRAL DISTRIBUTION

OF ITS SOUND Abstract. Measurements of the magnitute and phase spectrum of clarinet sound were made, in order to investigate the meaning of physical parameters on the timbre variation of the instrument in a “expressive” musical gesture. The spectrum turned out to be self correlated both in the time and frequency dimensions. The Principal Component Analysis (PCA) proved to be an adequate tool to identify some variation patterns in the spectrum through data reduction, in order to relate the PCs to the perceptual atribute. This method of analysis proved to be effective in revealing important characteristics of the variation of these parameters, poviding a speculative “timbre variation”.