Análisis de la secuencia de la ciencia

1

Análisis de la secuencia de la ciencia Juan Byron

RESUMEN

Se analiza la secuencia de la ciencia utilizando cuatro programas de análisis del habla

computarizados. Primero se presenta un oscilograma de la secuencia completa para la

determinación de los segmentos, en tanto que los segmentos periódicos se observan en

un gráfico, cuya ventana superior presenta un oscilograma y la inferior un espectro-

grama. Además, con la presentación de oscilogramas y espectrogramas aumentados se

comprueba la segmentación, al tiempo que se determina la duración de los segmentos.

Posteriormente se muestra una curva de intensidad y un oscilograma de la secuencia.

Luego se proporcionan los espectros LPC y FFT de los segmentos. Finalmente se pre-

sentan dos espectrogramas de banda ancha para apreciar el comportamiento de las

transiciones.

Palabras clave: oscilograma, espectros LPC y FFT, espectrograma de banda

ancha, intensidad, transiciones.

El propósito de este trabajo es el análisis acústico de la secuencia [de la sjénsja]

de la ciencia, realizada por un profesor universitario dominicano. Para la obten-

ción de la muestra se utilizó el programa de SIL International Speech Analyzer,

mientras que para la segmentación de la secuencia se utilizaron el programa Pra-

at, de la Universidad de Amsterdam, y el programa Speech Analyzer. El análisis

de la intensidad se logró mediante el programa WaveSurfer, en tanto que el pro-

grama Speech Filing System (SFS) permitió la obtención de los espectros LPC y

FFT. Con estos espectros, sobre todo el LPC, se determinaron los valores

formánticos de los segmentos. Dos espectrogramas, logrados mediante los pro-

gramas SFS y el WaveSurfer, han permitido la observación del comportamiento

de las transiciones.

La secuencia consta de 11 segmentos, determinados mediante el programa Praat

y el Speech Analyzer. La confirmación de la segmentación se logró mediante

oscilogramas y espectrogramas aumentados. De los segmentos, cinco son con-

sonantes o contoides: una dental sonora [d], una lateral alveolar [l], dos fricati-

vas predorsoalveolares [s] y una nasal alveolar. Además, cuatro son vocales o

2

vocoides: dos son compactas agudas [e] y dos son compactas neutras [a]. Asi-

mismo, hay dos aproximantes palatales [j], las cuales forman grupos tautosilábi-

cos con la primera compacta aguda y la última compacta neutra.

En la figura 1 se presenta un oscilograma de la secuencia de la ciencia. En el

inicio del gráfico, es posible observar la onda periódica que corresponde a la

barra de sonoridad de la interrupta dental sonora. Las demás ondas periódicas,

que se destacan –al igual que la anterior– por las líneas verticales, son las voca-

les, la lateral y la nasal, en tanto que se señalan mediante flechas las ondas ape-

riódicas correspondientes a las dos fricativas predorsoalveolares, que se mues-

tran como nubes o manchas oscuras.

Fig. 1

La figura 2 presenta un oscilograma y espectrograma de la secuencia, donde se

pueden observar los pulsos glotales, representados como líneas verticales, que

corresponden a los segmentos periódicos, que constituyen la mayoría. Solo las

dos estridentes no están señaladas con los pulsos glotales.

3

Fig. 2

Las figuras del 3 al 11 presentan los oscilogramas y espectrogramas aumentados

de los segmentos de la secuencia de la ciencia. El acercamiento o zoom in de las

ondas permite una delimitación mejorada de los segmentos.

Fig. 3. Oscilograma y espectrograma aumentados de la [d]. La duración de la

consonante es 179 milisegundos, de los cuales 164 corresponden a la barra de

sonoridad.

4

Fig. 4. Oscilograma y espectrograma de la primera [e]. La duración de esta vocal

es 89 milisegundos.

Fig. 5. Oscilograma y espectrograma aumentados de la lateral alveolar [l]. La duración 54

milisegundos.

5

Fig. 6. Oscilograma y espectrograma aumentados de la compacta neutra [a]. La duración es 93

milisegundos.

Fig. 7. Oscilograma y espectrograma aumentados de la primera fricativa predorsoalveolar [s].

Esta consonante dura 144 milisegundos.

6

Fig. 8. Oscilograma y espectrograma aumentados del grupo tautosilábico [jé]. La

duración de grupo tautosilábico es 158 milisegundos.

Fig. 9. Oscilograma y espectrograma aumentados de la nasal alveolar [n]. La duración de este

segmento es 89 milisegundos.

7

Fig. 10. Oscilograma y espectrograma aumentados de la segunda fricativa predorsoalveolar

[s]. Esta consonante dura 98 milisegundos.

Fig. 11. Oscilograma y espectrograma aumentados del grupo tautosilábico [ja]. La duración

de este diptongo creciente es 244 milisegundos.

8

––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––

En la siguiente tabla se presentan las duraciones de los segmentos de la

secuencia.

––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––––

Segmentos milisegundos

[d] 179

[e]1 89

[l] 54

[a]1 93

[s]1 144

[j]1 93

[e]2 65

[n] 89

[s]2 98

[j]2 84

[a]2 160

De los segmentos anteriores, el de mayor duración es la interrupta dental sonora

[d], que mide 170 milisegundos. Le sigue la segunda compacta neutra [a], que

mide 160 milisegundos, en tanto que el segmento de menor duración es la lateral

alveolar [l], que solo dura 54 milisegundos. La primera estridente [s] muestra

una duración relativamente elevada (144 milisegundos), en tanto que la segunda

estridente [s] mide 98 milisegundos, por lo que cae dentro de la duración media

de los segmentos.

Una curva de intensidad y un oscilograma de la secuencia de la ciencia se

presenta en la figura 12.

9

Fig. 12

________________________________________________________________________

En la siguiente tabla se presentan las intensidades de los segmentos de la se-

cuencia. ______________________________________________________________________

Segmentos decibeles

[d] 43.5

[e]1 54.9

[l] 47.6

[a]1 48.6

[s]1 56.1

[j] 51.0

[e]2 45.7

[n] 44.6

[s]2 56.9

[j] 53.7

[a]2 46.7 –

___________________________________________________________

10

Como se puede observar, el segmento de mayor intensidad es la segunda estri-

dente [s], que presenta un valor de 56.9 decibeles, en tanto que el segmento de

menor intensidad es oclusiva dental sonora, que mide 43.5 decibeles.

En la figura 13 se presentan los espectros LPC y FFT de la oclusiva dental sono-

ra [d]. La barra de sonoridad de esta consonante mide 275 hercios (22 dB). Esta

consonante presenta dos picos de energía a 3592 (12 dB) hercios y a 4501 (11

dB).

Fig. 13

Un espectro LPC y uno FFT de la primera compacta aguda [e] se presenta en la

figura 14. El primer formante (F1) mide 407 hercios y una intensidad de 22.5

dB; el F2 mide 2334 Hz (12 dB); y el F3 mide 3431 Hz (11 dB).

11

Fig. 14

Fi. 15

La figura 15 presenta los espectros LPC y FFT de la lateral alveolar [l]. El valor

del primer formante de esta consonante es 331 hercios, con una intensidad de 28

decibeles; el valor del segundo formante es 2282 hercios, con una intensidad de

19 decibeles, en tanto que el valor del tercer formante es 3488 hercios, con una

intensidad de 12 decibeles.

En la figura 16 se presentan los espectros de la primera compacta neutra [a], cu-

yo primer formante mide 584 hercios. La intensidad de este formante es 26 de-

cibeles. La frecuencia del segundo formante (F2) es 1281 hercios y su intensidad

12

es 19 decibeles, mientras que el tercer formante muestra una frecuencia 2382

hercios y una intensidad de 10 decibeles.

Fig. 16

Fig. 17

La figura 17 presenta los espectros LPC y FFT de la primera estridente [s]. Esta

consonante muestra una concentración de la energía a partir de los 3644 hercios,

con una intensidad de 8 decibeles; alcanza el pico de mayor intensidad (16dB) a

4442 hercios, en tanto que a los 8,000 hercios se produce un descenso de la

energía.

13

Fig. 18

En la figura 18 se presentan los espectros LPC y FFT de la primera aproximante

palatal [j]. Los valores formánticos de este segmento son los siguientes: F1 =

320 Hz (26 dB); F2 = 2093 Hz (15 dB); F3 = 4050 Hz (6 dB).

Fig. 19

La figura 19 presenta los espectros LPC y FFT de la primera compacta aguda

[e], que forma grupo tautosilábico con la aproximante palatal [j]. Los valores

formánticos de esta vocal son los siguientes: F1 = 463 Hz (24 dB); F2 = 2341

Hz (12 dB); F3 = 3391 Hz (2.5 dB).

14

Fig. 20

En la figura 20 se presentan los espectros LPC y FFT de la nasal alveolar [n].

Como se puede observar, el primer formante nasal (FN1) muestra un gran pico

de energía (27 dB). La frecuencia de este primer formante nasal es 331 hercios.

También es posible notar que el segundo formante nasal presenta una intensidad

de cero Hz, por lo que debe considerarse como un antiformante debido a la anti-

rresonancia que se produce por la intervención de una segunda cavidad (nasal)

en la producción de esta consonante.

F. 21

15

La figura 21 presenta los espectros LPC y FFT de la segunda estridente [s]. El

inicio de la concentración de la energía se produce a 3515 hercios, valor muy

cercano al de la primera estridente, cuya frecuencia es 3644. El pico de mayor

energía se alcanza a los 4357 hercios de 17 decibeles. A partir de este punto la

energía comienza a descender gradualmente.

En la figura 22 se presentan los espectros LPC y FFT de la segunda aproximante

palatal [j], que forma grupo tautosilábico con la segunda compacta neutra [a].

Los valores formánticos son los siguientes: F1 = 339 Hz (27 dB); F2 = 2021 Hz

(15 dB); F3 = 4130 Hz (8 dB).

Fig.22

Fig. 23

16

La figura 23 presenta los espectros LPC y FFT de la segunda compacta neutra.

La frecuencia del primer formante de esta vocal es 601 hercios, con una intensi-

dad de 31 decibeles. La frecuencia del segundo formante es 1287 hercios, con

una intensidad de 16 decibeles, en tanto que la frecuencia del tercer formante es

4584 hercios y intensidad de este es 6 decibles.

Las figuras 24 y 25 muestran espectrogramas de banda ancha de la secuencia de

la ciencia. El primero se logró mediante el programa WaveSurfer, mientras que

el segundo se obtuvo mediante el programa Speech Filing System.

Fig. 24

17

Fig. 25

Estos espectrogramas permiten observar el comportamiento de las transiciones.

En el caso de [d + e], la primera transición muestra un valor negativo, puesto

que la diferencia entre la frecuencia de inicio (Fi) y la frecuencia estacionaria

(Fc) es –143 hercios y la velocidad es 3.5 Hz/ms. La segunda transición también

es negativa, ya que la diferencia es –79 hercios y la velocidad es 1 Hz/ms. La

tercera transición, en cambio, es positiva: la diferencia es +16 hercios y la velo-

cidad es 0.4 Hz/ms.

En relación con la lateral alveolar [l], las transiciones son las siguientes: T1 es

negativa: la diferencia es –159 hercios y la velocidad es 5.4 Hz/ms. La T2 es ne-

gativa: la diferencia es –111 hercios y la velocidad es 3.8 Hz/ms. Asimismo, la

T3 es negativa, ya que la diferencia es –95 hercios y la velocidad es 3.2 Hz/ms.

En el caso de [j + e], las transiciones son las siguientes: T1 es negativa, ya que la

diferencia es –222 hercios y la velocidad es 6.3 hercios por milisegundo; T2 es

18

también negativa: la diferencia es –47 hercios y la velocidad es 1.3 Hz/ms; T3 es

positiva, ya que la diferencia es +80 hercios y la velocidad es 1.7 Hz7ms.

En el caso de [j + a], las transiciones son las siguientes: T1 es negativa: la dife-

rencia es –222 hercios y la velocidad es 3 Hz/ms; T2 es positiva: la diferencia es

+222 hercios y la velocidad es 3.4 Hz/ms; T3 también es positiva: la diferencia

es +111 hercios y la velocidad 1.7 Hz/ms.

Cabe señalar, con relación al grupo [j + a], que se observa una ligera interrup-

ción entre la aproximante palatal y la vocal siguiente, lo que supondría la pre-

sencia de un hiato, en lugar de un diptongo, por lo que se tendría un grupo hete-

rosilábico. Sobre esto Quilis (1981:181) señala: «En el caso del hiato, la transi-ción entre los dos elementos es brusca».

El cuadro siguiente presenta la dirección de las transiciones segunda y tercera en

relación con la vocal compacta aguda [e] y la compacta neutra [a].

e

a

T2

T3

T2

T3

[d]

–

–

[l]

–

–

[j]

–

+

+

+

19

Conclusión

La secuencia de la ciencia consta de 11 segmentos, de los cuales nueve son pe-

riódicos o cuasi-periódicos. Solo las dos estridentes [s] son aperiódicas. Como

puede observarse en los espectrogramas, los segmentos periódicos presentan

estrías verticales, que corresponden a las vibraciones glotales.

El segmento de mayor duración es la interrupta dental sonora [d], seguida por la

segunda compacta neutra [a]. Estos segmentos duran respectivamente 179 y 160

milisegundos. El segmento de menor duración es la lateral alveolar (54 ms).

El segmento que presenta mayor intensidad es la segunda estridente, que mide

56.9 decibeles, en tanto que el de menor intensidad es la oclusiva dental sonora,

que mide 43.5 decibeles. Pero, en sentido general, las vocales muestran mayor

intensidad que las consonantes, con excepción de las estridentes, como se ha

podido notar.

Las transiciones negativas prevalecen, lo mismo que las transiciones rápidas.

Las transiciones más lentas corresponden al grupo tautosilábico de aproximante

más vocal, como puede observarse en los espectrogramas.

Referencias

Byron, J. Fonética acústica. Editorial Somos Literatura, Santo Domingo.

Denes, P. y Pinson, E. 1973. The Speech Chain: The Physics and Biology of

Spoken Language. Anchor Books, New York.

González Tapia, Carlisle.2002. Fonetología general e hispánica. Editora Uni-

versitaria-UASD, Santo Domingo.

Jakobson, R. y Halle, M. Fundamentos del lenguaje. 1974. Editorial Ayuso, Ma-

drid.

Malmberg, B. 1964. La fonética. EUDEBA, Buenos Aires.

Malmberg, B. 1974. Lingüística estructural y comunicación humana. Editorial

Gredos, Madrid.

Quilis, A. 1981. Fonética acústica de la lengua española. Gredos, Madrid.

Documents

Análisis de la secuencia de la ciencia