Upload
independent
View
0
Download
0
Embed Size (px)
Citation preview
1
Análisis de la secuencia de la ciencia Juan Byron
RESUMEN
Se analiza la secuencia de la ciencia utilizando cuatro programas de análisis del habla
computarizados. Primero se presenta un oscilograma de la secuencia completa para la
determinación de los segmentos, en tanto que los segmentos periódicos se observan en
un gráfico, cuya ventana superior presenta un oscilograma y la inferior un espectro-
grama. Además, con la presentación de oscilogramas y espectrogramas aumentados se
comprueba la segmentación, al tiempo que se determina la duración de los segmentos.
Posteriormente se muestra una curva de intensidad y un oscilograma de la secuencia.
Luego se proporcionan los espectros LPC y FFT de los segmentos. Finalmente se pre-
sentan dos espectrogramas de banda ancha para apreciar el comportamiento de las
transiciones.
Palabras clave: oscilograma, espectros LPC y FFT, espectrograma de banda
ancha, intensidad, transiciones.
El propósito de este trabajo es el análisis acústico de la secuencia [de la sjénsja]
de la ciencia, realizada por un profesor universitario dominicano. Para la obten-
ción de la muestra se utilizó el programa de SIL International Speech Analyzer,
mientras que para la segmentación de la secuencia se utilizaron el programa Pra-
at, de la Universidad de Amsterdam, y el programa Speech Analyzer. El análisis
de la intensidad se logró mediante el programa WaveSurfer, en tanto que el pro-
grama Speech Filing System (SFS) permitió la obtención de los espectros LPC y
FFT. Con estos espectros, sobre todo el LPC, se determinaron los valores
formánticos de los segmentos. Dos espectrogramas, logrados mediante los pro-
gramas SFS y el WaveSurfer, han permitido la observación del comportamiento
de las transiciones.
La secuencia consta de 11 segmentos, determinados mediante el programa Praat
y el Speech Analyzer. La confirmación de la segmentación se logró mediante
oscilogramas y espectrogramas aumentados. De los segmentos, cinco son con-
sonantes o contoides: una dental sonora [d], una lateral alveolar [l], dos fricati-
vas predorsoalveolares [s] y una nasal alveolar. Además, cuatro son vocales o
2
vocoides: dos son compactas agudas [e] y dos son compactas neutras [a]. Asi-
mismo, hay dos aproximantes palatales [j], las cuales forman grupos tautosilábi-
cos con la primera compacta aguda y la última compacta neutra.
En la figura 1 se presenta un oscilograma de la secuencia de la ciencia. En el
inicio del gráfico, es posible observar la onda periódica que corresponde a la
barra de sonoridad de la interrupta dental sonora. Las demás ondas periódicas,
que se destacan –al igual que la anterior– por las líneas verticales, son las voca-
les, la lateral y la nasal, en tanto que se señalan mediante flechas las ondas ape-
riódicas correspondientes a las dos fricativas predorsoalveolares, que se mues-
tran como nubes o manchas oscuras.
Fig. 1
La figura 2 presenta un oscilograma y espectrograma de la secuencia, donde se
pueden observar los pulsos glotales, representados como líneas verticales, que
corresponden a los segmentos periódicos, que constituyen la mayoría. Solo las
dos estridentes no están señaladas con los pulsos glotales.
3
Fig. 2
Las figuras del 3 al 11 presentan los oscilogramas y espectrogramas aumentados
de los segmentos de la secuencia de la ciencia. El acercamiento o zoom in de las
ondas permite una delimitación mejorada de los segmentos.
Fig. 3. Oscilograma y espectrograma aumentados de la [d]. La duración de la
consonante es 179 milisegundos, de los cuales 164 corresponden a la barra de
sonoridad.
4
Fig. 4. Oscilograma y espectrograma de la primera [e]. La duración de esta vocal
es 89 milisegundos.
Fig. 5. Oscilograma y espectrograma aumentados de la lateral alveolar [l]. La duración 54
milisegundos.
5
Fig. 6. Oscilograma y espectrograma aumentados de la compacta neutra [a]. La duración es 93
milisegundos.
Fig. 7. Oscilograma y espectrograma aumentados de la primera fricativa predorsoalveolar [s].
Esta consonante dura 144 milisegundos.
6
Fig. 8. Oscilograma y espectrograma aumentados del grupo tautosilábico [jé]. La
duración de grupo tautosilábico es 158 milisegundos.
Fig. 9. Oscilograma y espectrograma aumentados de la nasal alveolar [n]. La duración de este
segmento es 89 milisegundos.
7
Fig. 10. Oscilograma y espectrograma aumentados de la segunda fricativa predorsoalveolar
[s]. Esta consonante dura 98 milisegundos.
Fig. 11. Oscilograma y espectrograma aumentados del grupo tautosilábico [ja]. La duración
de este diptongo creciente es 244 milisegundos.
8
––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––
En la siguiente tabla se presentan las duraciones de los segmentos de la
secuencia.
––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––
Segmentos milisegundos
[d] 179
[e]1 89
[l] 54
[a]1 93
[s]1 144
[j]1 93
[e]2 65
[n] 89
[s]2 98
[j]2 84
[a]2 160
De los segmentos anteriores, el de mayor duración es la interrupta dental sonora
[d], que mide 170 milisegundos. Le sigue la segunda compacta neutra [a], que
mide 160 milisegundos, en tanto que el segmento de menor duración es la lateral
alveolar [l], que solo dura 54 milisegundos. La primera estridente [s] muestra
una duración relativamente elevada (144 milisegundos), en tanto que la segunda
estridente [s] mide 98 milisegundos, por lo que cae dentro de la duración media
de los segmentos.
Una curva de intensidad y un oscilograma de la secuencia de la ciencia se
presenta en la figura 12.
9
Fig. 12
________________________________________________________________________
En la siguiente tabla se presentan las intensidades de los segmentos de la se-
cuencia. ______________________________________________________________________
Segmentos decibeles
[d] 43.5
[e]1 54.9
[l] 47.6
[a]1 48.6
[s]1 56.1
[j] 51.0
[e]2 45.7
[n] 44.6
[s]2 56.9
[j] 53.7
[a]2 46.7 –
___________________________________________________________
10
Como se puede observar, el segmento de mayor intensidad es la segunda estri-
dente [s], que presenta un valor de 56.9 decibeles, en tanto que el segmento de
menor intensidad es oclusiva dental sonora, que mide 43.5 decibeles.
En la figura 13 se presentan los espectros LPC y FFT de la oclusiva dental sono-
ra [d]. La barra de sonoridad de esta consonante mide 275 hercios (22 dB). Esta
consonante presenta dos picos de energía a 3592 (12 dB) hercios y a 4501 (11
dB).
Fig. 13
Un espectro LPC y uno FFT de la primera compacta aguda [e] se presenta en la
figura 14. El primer formante (F1) mide 407 hercios y una intensidad de 22.5
dB; el F2 mide 2334 Hz (12 dB); y el F3 mide 3431 Hz (11 dB).
11
Fig. 14
Fi. 15
La figura 15 presenta los espectros LPC y FFT de la lateral alveolar [l]. El valor
del primer formante de esta consonante es 331 hercios, con una intensidad de 28
decibeles; el valor del segundo formante es 2282 hercios, con una intensidad de
19 decibeles, en tanto que el valor del tercer formante es 3488 hercios, con una
intensidad de 12 decibeles.
En la figura 16 se presentan los espectros de la primera compacta neutra [a], cu-
yo primer formante mide 584 hercios. La intensidad de este formante es 26 de-
cibeles. La frecuencia del segundo formante (F2) es 1281 hercios y su intensidad
12
es 19 decibeles, mientras que el tercer formante muestra una frecuencia 2382
hercios y una intensidad de 10 decibeles.
Fig. 16
Fig. 17
La figura 17 presenta los espectros LPC y FFT de la primera estridente [s]. Esta
consonante muestra una concentración de la energía a partir de los 3644 hercios,
con una intensidad de 8 decibeles; alcanza el pico de mayor intensidad (16dB) a
4442 hercios, en tanto que a los 8,000 hercios se produce un descenso de la
energía.
13
Fig. 18
En la figura 18 se presentan los espectros LPC y FFT de la primera aproximante
palatal [j]. Los valores formánticos de este segmento son los siguientes: F1 =
320 Hz (26 dB); F2 = 2093 Hz (15 dB); F3 = 4050 Hz (6 dB).
Fig. 19
La figura 19 presenta los espectros LPC y FFT de la primera compacta aguda
[e], que forma grupo tautosilábico con la aproximante palatal [j]. Los valores
formánticos de esta vocal son los siguientes: F1 = 463 Hz (24 dB); F2 = 2341
Hz (12 dB); F3 = 3391 Hz (2.5 dB).
14
Fig. 20
En la figura 20 se presentan los espectros LPC y FFT de la nasal alveolar [n].
Como se puede observar, el primer formante nasal (FN1) muestra un gran pico
de energía (27 dB). La frecuencia de este primer formante nasal es 331 hercios.
También es posible notar que el segundo formante nasal presenta una intensidad
de cero Hz, por lo que debe considerarse como un antiformante debido a la anti-
rresonancia que se produce por la intervención de una segunda cavidad (nasal)
en la producción de esta consonante.
F. 21
15
La figura 21 presenta los espectros LPC y FFT de la segunda estridente [s]. El
inicio de la concentración de la energía se produce a 3515 hercios, valor muy
cercano al de la primera estridente, cuya frecuencia es 3644. El pico de mayor
energía se alcanza a los 4357 hercios de 17 decibeles. A partir de este punto la
energía comienza a descender gradualmente.
En la figura 22 se presentan los espectros LPC y FFT de la segunda aproximante
palatal [j], que forma grupo tautosilábico con la segunda compacta neutra [a].
Los valores formánticos son los siguientes: F1 = 339 Hz (27 dB); F2 = 2021 Hz
(15 dB); F3 = 4130 Hz (8 dB).
Fig.22
Fig. 23
16
La figura 23 presenta los espectros LPC y FFT de la segunda compacta neutra.
La frecuencia del primer formante de esta vocal es 601 hercios, con una intensi-
dad de 31 decibeles. La frecuencia del segundo formante es 1287 hercios, con
una intensidad de 16 decibeles, en tanto que la frecuencia del tercer formante es
4584 hercios y intensidad de este es 6 decibles.
Las figuras 24 y 25 muestran espectrogramas de banda ancha de la secuencia de
la ciencia. El primero se logró mediante el programa WaveSurfer, mientras que
el segundo se obtuvo mediante el programa Speech Filing System.
Fig. 24
17
Fig. 25
Estos espectrogramas permiten observar el comportamiento de las transiciones.
En el caso de [d + e], la primera transición muestra un valor negativo, puesto
que la diferencia entre la frecuencia de inicio (Fi) y la frecuencia estacionaria
(Fc) es –143 hercios y la velocidad es 3.5 Hz/ms. La segunda transición también
es negativa, ya que la diferencia es –79 hercios y la velocidad es 1 Hz/ms. La
tercera transición, en cambio, es positiva: la diferencia es +16 hercios y la velo-
cidad es 0.4 Hz/ms.
En relación con la lateral alveolar [l], las transiciones son las siguientes: T1 es
negativa: la diferencia es –159 hercios y la velocidad es 5.4 Hz/ms. La T2 es ne-
gativa: la diferencia es –111 hercios y la velocidad es 3.8 Hz/ms. Asimismo, la
T3 es negativa, ya que la diferencia es –95 hercios y la velocidad es 3.2 Hz/ms.
En el caso de [j + e], las transiciones son las siguientes: T1 es negativa, ya que la
diferencia es –222 hercios y la velocidad es 6.3 hercios por milisegundo; T2 es
18
también negativa: la diferencia es –47 hercios y la velocidad es 1.3 Hz/ms; T3 es
positiva, ya que la diferencia es +80 hercios y la velocidad es 1.7 Hz7ms.
En el caso de [j + a], las transiciones son las siguientes: T1 es negativa: la dife-
rencia es –222 hercios y la velocidad es 3 Hz/ms; T2 es positiva: la diferencia es
+222 hercios y la velocidad es 3.4 Hz/ms; T3 también es positiva: la diferencia
es +111 hercios y la velocidad 1.7 Hz/ms.
Cabe señalar, con relación al grupo [j + a], que se observa una ligera interrup-
ción entre la aproximante palatal y la vocal siguiente, lo que supondría la pre-
sencia de un hiato, en lugar de un diptongo, por lo que se tendría un grupo hete-
rosilábico. Sobre esto Quilis (1981:181) señala: «En el caso del hiato, la transi-ción entre los dos elementos es brusca».
El cuadro siguiente presenta la dirección de las transiciones segunda y tercera en
relación con la vocal compacta aguda [e] y la compacta neutra [a].
e
a
T2
T3
T2
T3
[d]
–
–
[l]
–
–
[j]
–
+
+
+
19
Conclusión
La secuencia de la ciencia consta de 11 segmentos, de los cuales nueve son pe-
riódicos o cuasi-periódicos. Solo las dos estridentes [s] son aperiódicas. Como
puede observarse en los espectrogramas, los segmentos periódicos presentan
estrías verticales, que corresponden a las vibraciones glotales.
El segmento de mayor duración es la interrupta dental sonora [d], seguida por la
segunda compacta neutra [a]. Estos segmentos duran respectivamente 179 y 160
milisegundos. El segmento de menor duración es la lateral alveolar (54 ms).
El segmento que presenta mayor intensidad es la segunda estridente, que mide
56.9 decibeles, en tanto que el de menor intensidad es la oclusiva dental sonora,
que mide 43.5 decibeles. Pero, en sentido general, las vocales muestran mayor
intensidad que las consonantes, con excepción de las estridentes, como se ha
podido notar.
Las transiciones negativas prevalecen, lo mismo que las transiciones rápidas.
Las transiciones más lentas corresponden al grupo tautosilábico de aproximante
más vocal, como puede observarse en los espectrogramas.
Referencias
Byron, J. Fonética acústica. Editorial Somos Literatura, Santo Domingo.
Denes, P. y Pinson, E. 1973. The Speech Chain: The Physics and Biology of
Spoken Language. Anchor Books, New York.
González Tapia, Carlisle.2002. Fonetología general e hispánica. Editora Uni-
versitaria-UASD, Santo Domingo.
Jakobson, R. y Halle, M. Fundamentos del lenguaje. 1974. Editorial Ayuso, Ma-
drid.
Malmberg, B. 1964. La fonética. EUDEBA, Buenos Aires.
Malmberg, B. 1974. Lingüística estructural y comunicación humana. Editorial
Gredos, Madrid.
Quilis, A. 1981. Fonética acústica de la lengua española. Gredos, Madrid.