10
Registro de instrumentos musicales en alta resolución Energía sonora por fuera del rango audible Jorge Petrosino e Ianina Canalis Universidad Nacional de Lanús Según el conocimiento establecido en los libros de percepción y acústica, el límite máximo en frecuencia que el ser humano es capaz de percibir es cercano a los 20 kHz. El análisis espectral de los distintos instrumentos musicales se realiza en dicho rango de frecuencias, asumiendo de forma implícita que allí se concentra la totalidad de su energía sonora. En las últimas décadas se han publicado diversos trabajos que sugieren que en determinadas condiciones es posible percibir frecuencias superiores a los 20 kHz (Ashihara, 2007; Canalis, Petrosino, 2014). Por otra parte la existencia de formatos digitales de alta resolución de audio permite el registro de sonidos superando ampliamente dicho umbral. A pesar de estos resultados es difícil hallar trabajos con información sobre componentes de frecuencia de instrumentos musicales que exceden el rango audible tradicional. En este trabajo se presentan mediciones espectrales realizadas entre 20 Hz y 40 kHz de diferentes instrumentos musicales, enfocándonos en el análisis de aquellos que son utilizados en nuestra región. Nuestros resultados confirman la existencia de niveles significativos de energía en la zona de altas frecuencias According to the established knowledge in books about perception and acoustics, the maximum frequency that humans can perceive is close to 20 kHz. The spectral analysis of musical instruments is made in this range, implicitly assuming that their entire sound energy is concentrated in those frequencies. In recent decades, several studies have been published suggesting that under certain conditions it is possible to perceive frequencies above 20 kHz (Ashihara, 2007; Canalis, Petrosino, 2014). Moreover, the existence of high-resolution digital audio formats allow recording of sounds surpassing this threshold. Despite these results, it is difficult to find information on the frequency components of musical instruments that exceed the traditional audible range. In this paper we present spectral measurements of different musical instruments between 20 Hz and 40 kHz, focusing on the analysis of those instruments that are widely used in our region. Our results confirm the existence of significant levels of energy in the high frequencies. Actas de ECCoM. Vol. 2 Nº 1, “La Experiencia Musical: Cuerpo, Tiempo y Sonido en el Escenario de Nuestra Mente. 12º ECCoM”. Isabel C. Martínez, Alejandro Pereira Ghiena, Mónica Valles y Matías Tanco (Editores). Buenos Aires: SACCoM. pp. 208-215 | 2015 | ISSN 2346-8874 www.saccom.org.ar/actas_eccom

Registro de Instrumentos Musicales en Alta Resolución

  • Upload
    unla

  • View
    1

  • Download
    0

Embed Size (px)

Citation preview

Registro de instrumentos musicales en alta resolución Energía sonora por fuera del rango audible Jorge Petrosino e Ianina Canalis Universidad Nacional de Lanús Según el conocimiento establecido en los libros de percepción y acústica, el límite máximo en frecuencia que el ser humano es capaz de percibir es cercano a los 20 kHz. El análisis espectral de los distintos instrumentos musicales se realiza en dicho rango de frecuencias, asumiendo de forma implícita que allí se concentra la totalidad de su energía sonora. En las últimas décadas se han publicado diversos trabajos que sugieren que en determinadas condiciones es posible percibir frecuencias superiores a los 20 kHz (Ashihara, 2007; Canalis, Petrosino, 2014). Por otra parte la existencia de formatos digitales de alta resolución de audio permite el registro de sonidos superando ampliamente dicho umbral. A pesar de estos resultados es difícil hallar trabajos con información sobre componentes de frecuencia de instrumentos musicales que exceden el rango audible tradicional. En este trabajo se presentan mediciones espectrales realizadas entre 20 Hz y 40 kHz de diferentes instrumentos musicales, enfocándonos en el análisis de aquellos que son utilizados en nuestra región. Nuestros resultados confirman la existencia de niveles significativos de energía en la zona de altas frecuencias

According to the established knowledge in books about perception and acoustics, the maximum frequency that humans can perceive is close to 20 kHz. The spectral analysis of musical instruments is made in this range, implicitly assuming that their entire sound energy is concentrated in those frequencies. In recent decades, several studies have been published suggesting that under certain conditions it is possible to perceive frequencies above 20 kHz (Ashihara, 2007; Canalis, Petrosino, 2014). Moreover, the existence of high-resolution digital audio formats allow recording of sounds surpassing this threshold. Despite these results, it is difficult to find information on the frequency components of musical instruments that exceed the traditional audible range. In this paper we present spectral measurements of different musical instruments between 20 Hz and 40 kHz, focusing on the analysis of those instruments that are widely used in our region. Our results confirm the existence of significant levels of energy in the high frequencies.

Actas de ECCoM. Vol. 2 Nº 1, “La Experiencia Musical: Cuerpo, Tiempo y Sonido en el Escenario de Nuestra Mente. 12º ECCoM”. Isabel C. Martínez, Alejandro Pereira Ghiena, Mónica Valles y Matías Tanco (Editores). Buenos Aires: SACCoM. pp. 208-215 | 2015 | ISSN 2346-8874 www.saccom.org.ar/actas_eccom

Fundamentación Los estudios sobre el análisis espectral de instrumentos musicales que se encuentran disponibles en libros y artículos académicos cubren el rango de frecuencias que alcanza los 20 kHz. Prácticamente no hay datos disponibles sobre las características de los componentes de frecuencia que superen dicho umbral. La única información que hemos hallado al respecto ha sido generada por James Boyk (1997) en un artículo con un sugestivo título que afirma que existe vida por encima de los 20 kHz. Boyk sostiene que en cada familia de instrumentos musicales existe al menos un miembro que produce energía hasta los 40 kHz o más. Resulta posible comprender la falta de interés en medir componentes que superan los 20 kHz basándose en dos cuestiones principales. Una referida a los límites de percepción respecto de esas altas frecuencias y la otra a las características técnicas de la mayoría de los sistemas de registro y reproducción del sonido generado por los instrumentos musicales. En las últimas décadas han sido publicados algunos estudios que vuelven a poner en cuestión los límites máximos de frecuencias audibles. Por una parte, se han llevado a cabo experimentos utilizando tonos puros que sugieren que es posible percibir frecuencias de hasta 25 kHz con intensidades del orden de los 110 dB SPL (Ashihara, 2007; Canalis y Petrosino, 2014). En forma complementaria, los trabajos de Oohashi (2000) y Nishiguchi (2007) sugieren que las componentes ultrasónicas de determinados sonidos compuestos pueden provocar efectos perceptivos dando lugar a cierta actividad en la corteza cerebral diferente a la que se produce cuando dichos componentes se encuentran ausentes. Tanto Oohashi como Nishiguchi han afirmado en sus trabajos que ciertas personas que no son capaces de percibir tonos puros de frecuencias elevadas por encima del umbral de audición pueden sin embargo detectar las diferencias al comparar la presencia o ausencia de componentes ultrasónicos cuando estos están asociados a otros componentes que se encuentran dentro del rango audible. Oohashi utilizó en sus primeros estudios grabaciones de alta resolución de música gamelán, argumentando que los instrumentos musicales utilizados en este tipo de música contienen una importante proporción de energía de alta frecuencia. En dichos estudios se muestran diagramas espectrales de rango extendido para este tipo de instrumentos. La posibilidad de distinguir entre registros de sonido con frecuencias de muestreo elevadas (Super Audio CD o DVD-Audio) comparadas con muestreos de 44.1 kHz fue estudiada por Meyer y Moran (2007). Sus conclusiones sugieren que no es posible detectar entre la reproducción de una muestra en 24 bits y 96 kHz y una versión de la misma muestra en 16 bits y 44.1 kHz. Sin embargo, el equipamiento reportado en sus pruebas no permitía reproducir frecuencias por encima del rango audible, por lo que sus conclusiones no resultan necesariamente incompatibles con los trabajos de Oohashi. Teniendo en cuenta la ausencia de información completa y accesible sobre la energía sonora en el rango ultrasónico de diferentes instrumentos musicales, los indicios de que en ciertos casos podrían percibirse componentes que superan el rango audible tradicional, sumado a la disponibilidad actual de sistemas de registro y reproducción del sonido en alta resolución otorga sentido y fundamento a la realización de un análisis comparativo de distintos instrumentos. incorporando algunos de uso típico en nuestra región.

Objetivos - Obtener información que permita comparar los espectros de emisión sonora de distintos

instrumentos musicales en un rango que se extienda hasta los 40 kHz, incluyendo instrumentos de amplio uso en nuestra región sobre los que no se poseen registros espectrales ampliados

- Determinar para cada instrumento analizado la proporción de energía por encima de 20 kHz,

comparada con el nivel de energía sonora total.

Método Registro de los instrumentos seleccionados Se realizaron registros de sonidos de charango, bandoneón, acordeón, violín, saxo, piano, bombo legüero y platillo. Las grabaciones fueron realizadas con una placa de audio externa con capacidad de registrar sonidos de hasta 45 kHz, teniendo especial cuidado en verificar que esta capacidad incluyera todas las etapas analógicas previas a la digitalización de las muestras. La captura del sonido fue realizada con un micrófono de medición Earthworks M-30 cuya respuesta es prácticamente plana hasta los 30 kHz, llegando hasta los 40 kHz con una caída de 3 dB. En todos los casos se procedió al registro de varios minutos con el micrófono ubicado a una distancia de un metro del instrumento. Los registros digitales se realizaron con una frecuencia de muestreo de 96 kHz y una resolución de 24 bits. Cada grabación fue posteriormente analizada utilizando software de edición de audio que permitiese observar el espectro de las grabaciones para detectar aquellos fragmentos que pudieran tener mayor energía en alta frecuencia. Se seleccionaron una o dos muestras breves (menores a un segundo de duración) de cada instrumento para la comparación de espectros. Análisis espectral Con el fin de obtener resultados comparables a las mediciones realizadas por Boyk (1997) se decidió que las representaciones espectrales fueran realizadas sobre secciones de 30 milisegundos, seleccionando para cada muestra tres secciones consecutivas. En los instrumentos con un ataque impulsivo la primera de estas secciones comienza con el ataque. Los diagramas espectrales fueron obtenidos con el analizador de espectro del software de edición seleccionando la zona de interés (secciones de 30 ms), utilizando una FFT de 1024 puntos y ventana de Blackman-Harris. La Figura 1 corresponde al análisis espectral de una muestra de sonido del charango.

Figura 1. Espectro de una muestra de charango de 30 ms de duración a partir del ataque. La flecha

indica el límite de audibilidad de 20 kHz Comparación de niveles de energía de las secciones Para obtener información sobre el nivel de energía sonora total y poder compararla con el que corresponde solo a las altas frecuencias se procesaron las muestras mediante el software OCTAVE. Se utilizó una versión de cada muestra conteniendo todas las frecuencias (variable muestrasonora en el código de OCTAVE), y se generó una nueva muestra aplicando un filtro pasa altos con frecuencia de corte de 24 kHz (variable muestrafiltrada en el código). Se aplicaron las siguientes líneas de código para realizar el cálculo de la proporción entre energías.

> s30ms=0.03*fs; % número de muestras corrrespondientes a 30 ms

> rms=sqrt(sum(muestrasonora(1:s30ms).^2)/length(muestrasonora(1:s30ms)));

> rms_altafrec=sqrt(sum(muestrafiltrada(1:s30ms).^2)/length(muestrafiltrada(1:s30ms)));

> proporcion= rms_altafrec/rms;

> dB=20*log10(proporcion);

Las medidas de proporción de energía se realizaron en cuatro intervalos de tiempo: a) entre 0 y 30 ms, b) entre 30 y 60 ms, c) entre 60 y 90 ms, y d) entre 0 y 100 ms. El instante t=0 fue elegido variando los momentos de inicio de la muestra hasta obtener la máxima riqueza en altas frecuencias dentro de su desarrollo. En varios casos este insante coincidió con el ataque de la muestra.

Figura 2. Espectro de una muestra de charango completa y de la misma muestra filtrada

Comparación del desarrollo temporal de los niveles de energía Con el fin de analizar la evolución de los niveles de energía se procesaron las señales mediante el OCTAVE para obtener un perfil de niveles SPL equivalentes (asumiento una referencia arbitraria). Se utilizó una función disponible que realiza un diagrama temporal del nivel SPL equivalente y se aplicó en forma separada a la muestra de rango completo y a la que sólo contenía alta frecuencia (Figura 3 )

Figura 3. Evolución temporal de energía de una muestra de charango conteniendo todas las frecuencias y de una versión de la misma muestra conteniendo solamente altas frecuencias

Resultados Del análisis de la información espectral de amplio rango de instrumentos musicales se ha podido determinar que en gran parte de las muestras existen proporciones significativas de energía de alta frecuencias. Estos resultados son consistentes con los estudios realizados previamente por James Boyk (1997) en el CalTech. Nuestro aporte al análisis de Boyk ha sido la incorporación de ciertos instrumentos de uso local, como el charango, el acordeón, el bandoneón y el bombo legüero. Por otra parte, hemos ampliado las experiencias de Boyk realizando diagramas de la evolución temporal de la energía de altas frecuencias. Proporción de energía en altas frecuencias La Tabla 1 contiene los resultados de la relación entre energía en altas frecuencias y energía total de la muestra en los intervalos temporales seleccionados: 0 a 30 ms, 30 a 60 ms, 60 a 90 ms y 0 a 100 ms. Las muestras se han ordenado por valor decreciente de la proporción de energía en altas frecuencias respecto de la energía total

Instrumento Intervalo 0-30 ms

Intervalo 30-60ms

Intervalo 60-90 ms

Intervalo 0-100 ms

% 0- 100 ms

Platillo - 17.73 dB - 35.16 dB - 45.18 dB - 21.91 dB 8.2 Platillo y cadena - 25.34 dB - 36.65 dB - 40.75 dB - 28.98 dB 3.56 Charango a - 27.67 dB - 56.55 dB - 59.73 dB - 32.10 dB 2.48 Charango b - 31.62 dB - 59.33 dB - 64.32 dB - 35.21 dB 1.74 Acordeón a - 32.94 dB - 51.04 dB - 59.33 dB - 36.73 dB 1.46 Violin a -38.65 dB - 40.15 dB - 40.44 dB - 39.80 dB 1.02 Aro bombo legüero - 42.68 dB - 56.88 dB - 52.72 dB - 42.83 dB 0.72 Bandoneon a - 45.85 dB - 47.14 dB - 47.21 dB - 46.61 dB 0.47 Violin b - 48.62 dB - 49.25 dB - 48.36 dB - 48.99 dB 0.36 Acordeón b - 51.87 dB - 58.07 dB - 53.65 dB - 53.30 dB 0.22 Bandoneon b - 58.63 dB - 55.50 dB - 52.36 dB - 55.58 dB 0.17 Parche bombo legüero - 55.67 dB - 58.70 dB - 58.57 dB - 55.84 dB 0.16 Saxo - 63.74 dB - 64.25 dB - 65.78 dB - 64.67 dB 0.06 Bandoneon c - 65.99 dB - 66.18 dB - 66.66 dB - 65.71 dB 0.05 Piano - 70.24 dB - 76.12 dB - 73.04 dB - 72.47 dB 0.02

Tabla 1. Comparación de niveles de energía en alta frecuencia respecto de energía total

Diagramas espectrales Se incluyen los diagramas espectrales de algunas muestras con gran proporción de energía en altas frecuencias. Los espectros mostrados corresponden a una sección de 30 ms de duración en la que se detecta gran cantidad de armónicos de alta frecuencia.

Figura 4. Espectro del ataque de un platillo de 30 ms de duración

En el diagrama espectral de los primeros 30 milisegundos del platillo (Figura 4) puede observarse que el nivel promedio de energía en el rango de frecuencia que se extiende de los 10 kHz a los 18 kHz es apenas unos 6 dB superior al nivel promedio entre 22 kHz y 32 kHz.

Figura 5. Espectro del ataque de una muestra sonora de charango de 30 ms de duración

En el diagrama espectral de la muestra de charango (Figura 5), también de 30 ms, se observan claramente picos equiespaciados en frecuencia representando los armónicos. La aparición de dichos picos se extiende a lo largo de todo el rango de frecuencias analizado.

Figura 6. Espectro del ataque de una muestra sonora de acordeón de 30 ms de duración

En el espectro representado del acordeón (Figura 6) no se observa tan claramente la presencia de picos correspondientes a los armónicos cuando se compara esta figura con la del charango o la del violín. De todas maneras resulta interesante notar que la pendiente de caída de nivel entre los 10 kHz y los 38 kHz es suficientemente lenta.

Figura 7. Espectro del ataque de una muestra sonora de violín en una muestra de 30 ms.

El espectro del violín (Figura 7) muestra claramente los armónicos. La pendiente de caída de nivel entre los 16 kHz y los 34 kHz es lenta. Niveles de presión sonora comparados Los siguientes diagramas muestran la evolución temporal de los niveles de energía total y de alta frecuencia presentados como niveles de presión sonora comparados. El análisis se realizó sobre secciones de 100 ms de duración

Figura 8. Evolulción temporal de la energía del sonido de un platillo

Puede notarse en la Figura 8 que el nivel de energía de altas frecuencias (trazo rojo) del platillo en los primeros milisegundos del ataque es comparable al de la energía total (trazo azul) y que decae a un ritmo de unos 0.5 dB por milisegundo.

Figura 9. Evolución temporal de la energía de una muestra sonora de charango

La energía de alta frecuencia (trazo rojo) de la muestra de charango que se observa en la Figura 9 alcanza en su máximo valor un nivel 15 dB por debajo del nivel de energía total (trazo azul) y registra un ritmo de caída bastante abrupto cercano a 1.5 dB por milisegundo.

Figura 10. Evolución temporal de la energía de una muestra sonora de acordeón

La energía de alta frecuencia (trazo rojo) de la muestra de acordeón llega a estar a unos 20 dB por debajo del nivel de energía sonora total (trazo azul) de la muestra al momento del ataque, decayendo luego a un ritmo de unos 0.6 dB por milisegundo.

Figura 11. Evolución temporal de una muestra sonora de violín

En la muestra de violín el nivel de energía de altas frecuencias (trazo rojo) muestra una diferencia que se mantiene constante en el tiempo de alrededor de 40 dB, lo que resulta consistente con el mecanismo de generación de sonido por cuerda frotada.

Conclusiones Existen indicios de que en determinadas situaciones es posible percibir componentes de frecuencias que superan el rango audible. Los sistemas de grabación digitales actuales permiten registrar dichos componentes. El verdadero impacto que podría tener el registro de estos componentes es aún objeto de debate, pero resulta importante para ello conocer con exactitud qué magnitud tiene aquello que queda fuera de los registros. Dado que se han detectado niveles de información relevante por encima de los 20 kHz en instrumentos musicales, nuestro trabajo podría brindar un aporte a la discusión sobre el rango de frecuencias recomendable para un registro sonoro fidedigno de instrumentos musicales.

Agradecimientos El presente trabajo se realizó en el marco del proyecto 33A200 de la convocatoria Amílcar Herrera 2014 de la Universidad Nacional de Lanús. Debemos agradecer a los instrumentistas que nos permitieron realizar los registros utilizados en este trabajo: Javier Acevedo (acordeón), Leonel Gasso (bandoneón), Cristhian Faiad (percusión), César Rago (violín), Federico Jaureguiberry (saxo), Pablo Marconi (charango) y Matías Pagliocca (piano). Los autores pueden ser contactados por email a la dirección [email protected]

Referencias bibliográficas Ashihara, K. (2007). Hearing thresholds for pure tones above 16 kHz. Journal of the Acoustic Society of America, Vol. 122 N° 3, EL52-EL52 Boyk, J. (1997). There’s life above 20 kilohertz! A survey of musical instrument spectra to 102.4 kHz. En California Institute of Technology (Caltech). Consultado el 24 de mayo de 2015 en <http://www. cco. caltech. edu/~ boyk/spectra/spectra. htm> Canalis, I. y Petrosino, J. (2014). ¿Es posible percibir tonos puros por encima de los 20 kHz? En P. Arenas (ed.) IX Congreso Iberoamericano de Acústica FIA2014. Valvidia: Universidad Austral de Chile, pp. 810-818 Meyer, E. y Moran, D. (2007). Audibility of a CD-Standard A/D/A Loop Inserted into High-Resolution Audio Playback. Journal of Audio Engineering Society, Vol. 55 N° 9, 775-779. Nishiguchi, T. et al. (2009). Perceptual discrimination of very high frequency components in wide frequency range musical sound. Applied Acoustics, Vol. 70 N° 7, 921-934. Oohashi T. el al. (2000) Inaudible High-Frequency Sounds Affect Brain Activity: Hypersonic Effect. Journal of Neurophysiology. Vol. 83 N° 6, 3548-3558.