22
Die akustische Analyse von Sprachlauten. Die Interpretation von Spektrogrammen. Jonathan Harrington IPDS, Kiel.

Die akustische Analyse von Sprachlauten. Die Interpretation von Spektrogrammen

  • Upload
    darice

  • View
    89

  • Download
    2

Embed Size (px)

DESCRIPTION

Die akustische Analyse von Sprachlauten. Die Interpretation von Spektrogrammen. Jonathan Harrington IPDS, Kiel. 1. Ein Teil vom Sprachsignal aussuchen: die Zeitaufl ö sung (hier 30 ms) ist die Dauer des Signals die Fourier-analysiert wird. Spektrum. 30 ms. Amplitude. 2. Fourier Analyse. - PowerPoint PPT Presentation

Citation preview

Page 1: Die akustische Analyse von Sprachlauten. Die Interpretation von Spektrogrammen

Die akustische Analyse von Sprachlauten.

Die Interpretation von Spektrogrammen.

Jonathan Harrington

IPDS, Kiel.

Page 2: Die akustische Analyse von Sprachlauten. Die Interpretation von Spektrogrammen

s t a m

Zeit

1. Ein Teil vom Sprachsignal aussuchen: die Zeitauflösung (hier 30 ms) ist die Dauer des Signals die Fourier-analysiert wird

30 ms

Vom Zeitsignal zum SpektrumA

mplitude

Frequenz

Spektrum

2. Fourier Analyse

Page 3: Die akustische Analyse von Sprachlauten. Die Interpretation von Spektrogrammen

30 ms

Ca. 2.5 Perioden in 30 ms

Grundfrequenz 1/0.012 Hz 85 Hz

Periodendauer, Grundfrequenz, Harmonischen

21e Harmonische 85 x 21 = 1770 Hz

Spektrum

Zeitsignal

Periodendauer 30/2.5 ms 12 ms = 0.012 s

Page 4: Die akustische Analyse von Sprachlauten. Die Interpretation von Spektrogrammen

Frequenz- und ZeitauflösungDie Frequenzauflösung (Hz) ist ca. im ungekehrten Verhältnis zur Dauer des Zeitfensters (s) oder zur Zeitauflösung.

Zeitauflösung = 30 ms = 30/1000 sFrequenzauflösung = 1000/30 Hz

= 33.3 Hz

30 ms

Das bedeutet: Je breiter die Zeitauflösung, umso schmaler die Frequenzauflösung und umgekehrt

Page 5: Die akustische Analyse von Sprachlauten. Die Interpretation von Spektrogrammen

Im Spektrum werden Frequenzen nur differenziert, wenn deren Abstand größer als die Frequenzauflösung ist:

Frequenzen 100, 110, 120 HzAbstand = 10 Hz

Zeitsignal

110 120100

SpektrumUndifferenzierte Frequenzen

Frequenzen 100, 150, 200 HzAbstand = 50 Hz 100 150 200

Differenzierte Frequenzen

30 ms

Fourier-Analyse

Frequenzauflösing = 33.3 Hz

Page 6: Die akustische Analyse von Sprachlauten. Die Interpretation von Spektrogrammen

Breite Zeitauflösung: 30 msschmale Frequenzauflösung: 33.3 Hz(Schmalbandanalyse)

Die Harmonischen sind nicht mehr sichtbar, und die Formanten treten dadurch deutlicher hervor

Fourier-AnalyseF1 F2 F3

Schmale Zeitauflösung: 3 ms Breite Frequenzauflösung: 333 Hz(Breitbandanalyse)

3 ms30 ms

Hier sind die Harmonischen sichtbar, da die Grundfrequenz und daher der Abstand zwischen Harmonischen ca. 85 Hz

Fourier-AnalyseF1 F2 F3

Page 7: Die akustische Analyse von Sprachlauten. Die Interpretation von Spektrogrammen

Spektrale Änderungen in der Zeit

Wenn wir feststellen wollen, wie sich das Spektrum mit der Zeit ändert, müssen Fourier-Analysen zu sämtlichen Zeitpunkten berechnet werden

Anfang vom [a] Mitte vom [a] Ende vom [a]

Page 8: Die akustische Analyse von Sprachlauten. Die Interpretation von Spektrogrammen

‘Wasserfall Abbildung

F2

F2

F2

F2

Anfang vom [a]

Mitte vom [a]

Ende vom [a]

Page 9: Die akustische Analyse von Sprachlauten. Die Interpretation von Spektrogrammen

Wasserfall-Abbildung zum Spektrogramm

In einem Spektrogramm wird die Amplitude in Dunkelheit umgesetzt – je dunkler umso höher die Amplitude

F1F2F3

Tal

Frequenz (Hz)

Zeit

Page 10: Die akustische Analyse von Sprachlauten. Die Interpretation von Spektrogrammen

In einem Breitbandspektrogramm ist:

Die Harmonischen: nicht sichtbar(da f0 < 300 Hz)

Die Stimmlippenschließung:sichtbar(Da T > 3 ms)

Für dieses Signal:f0 ca. 85 Hz

Periodendauer, T, 1/85 s 12 ms

Die Frequenzauflösung mindestens 300 Hz

Die Zeitauflösung ist daher1/300 3 ms

Page 11: Die akustische Analyse von Sprachlauten. Die Interpretation von Spektrogrammen

BreitbandspektrogrammFrequenzauflösung = 333.3 Hz, Zeitauflösung = 3 ms

Stimmlippenschließung

Jede Schließung erzeugt eine gerade Linie im Breitband-Spektrogramm und ist mit einem Höhepunkt im Zeitsignal synchronisiert

Page 12: Die akustische Analyse von Sprachlauten. Die Interpretation von Spektrogrammen

SchmalbandspektrogrammFrequenzauflösung ist meistens 45 Hz

Harmonische sind sichtbar, da f0 85 Hz

Zeitauflösung = 1/45 22 msStimmlippenschließungen sind nicht sichtbar, da die Periodendauer 12 ms

GrundfrequenzF1

F2

F35e Harmonische

2e Harmonische

Page 13: Die akustische Analyse von Sprachlauten. Die Interpretation von Spektrogrammen

Schmalbandspektrogramm und die Tonhöhe

5e Harmonische 450 Hz, daher f0 90 Hz

Mit einem SB-Spektrogramm kann man oft an Hand der höheren Harmonischen • Die Änderungen der Tonhöhe sehen• Die Grundfrequenz einschätzen

Tonhöhe steigt fällt

Page 14: Die akustische Analyse von Sprachlauten. Die Interpretation von Spektrogrammen

Ein Spektrum wird durch die Anwendung einer Fourier-Analyse auf einen Teil oder ein Fenster vom einem Zeitsignal angewendet

Die Frequenzauflösung ist im ungekehrten Verhältnis zur Dauer oder Zeitauflösung dieses Fensters: je schmaler das Fenster, umso grober (breiter) die Frequenzauflösung

In einem Spektrogramm werden Spektra in regelmäßigen Zeitabständen berechnet: die Amplitude entspricht der Dunkelheit

Zusammenfassung

Page 15: Die akustische Analyse von Sprachlauten. Die Interpretation von Spektrogrammen

Um Harmonischen im Spektrum/Spektrogramm zu sehen, muss die Grundfrequenz größer als die Frequenzauflösung sein. Daher ist ein Schmalbandspektrogramm (Frequenzauflösung typischerweise 45 Hz) für die Analyse von Harmonischen geeignet

Um Stimmlippen-Schließungen im Spektrogramm zu sehen, muss die Periodendauer größer als die Zeitlauflösung sein. Dafür ist ein Breitbandspektrogramm (Zeitauflösung ca. 3 ms, Frequenzauflösung über 300 Hz) geeignet.

Zusammenfassung (fortgesetzt)

Page 16: Die akustische Analyse von Sprachlauten. Die Interpretation von Spektrogrammen

7. Der Sinusoid links wird mit der Resonanzkurve rechts gefiltert. Erzeugen Sie eine Abbildung des Spektrums der Ausgabe.

0 5 10 15 20 25

01

23

4

Zeit (Sekunden)

Am

plitu

de-4

-20

24

0 0.2 0.6 0.8 1.00.4

10 Perioden in einer Sekunde.

Frequenz = 10 Hz

0 5 10 15 20 25

01

23

4

Frequenz (Hz)

Am

plitu

de

Page 17: Die akustische Analyse von Sprachlauten. Die Interpretation von Spektrogrammen

Luftdruck-maximum

Atmosphärischer Luftdruck

15 cm

15 cm

Wellenlänge ()

Resonanz für eine Wellenlänge von: = (4 x 15)/3 cm = 20 cm

15 cm = ¾

Und für eine Frequenz von f = c/ = 35000/20 = 1750 Hz

8. Die typische Länge von einem Vokaltrakt einer Frau ist 15 cm. Berechnen Sie den zweiten Resonanz eines [] Vokals an Hand eines Rohres von der selben Länge.

Page 18: Die akustische Analyse von Sprachlauten. Die Interpretation von Spektrogrammen

9. Beim Tief-Tauchen besteht die Luft oft aus einer Mischung von Sauerstoff und Helium, wodurch die Schallgeschwindigkeit erheblich höher wird. Welcher Einfluss übt dies auf die Resonanzen vom Vokaltrakt des Tauchers aus?

Frequenz = Schallgeschwindigkeit / Wellenlänge

f = c /

Je grösser cumso größer c/ also umso höher die Frequenz

Page 19: Die akustische Analyse von Sprachlauten. Die Interpretation von Spektrogrammen

Normal

Einatmung von Heliox(c ist höher)

Einatmung von Schwefel-Hexafluorid (c ist niedriger)

My name is Yelda

Beispiele: John Ohala, Phonetics Laboratory San Francisco

2 kHz

2 kHz

2 kHz

Page 20: Die akustische Analyse von Sprachlauten. Die Interpretation von Spektrogrammen

10. Wenn Vokale gerundet werden, wird der Vokaltrakt länger. Welcher Einfluss übt dies auf die Resonanzen aus?

Je länger der Vokaltrakt, umso grösser wird (die Wellenlänge)

f = c /

f (die Frequenz der Resonanz) wird kleiner wenn grösser wird, da:

Daher führt die Lippenrundung zu einer Senkung der Formantfrequenzen

Page 21: Die akustische Analyse von Sprachlauten. Die Interpretation von Spektrogrammen

11. Berechnen Sie den zweiten Formant für die Frau in 8. bei einer Grundfrequenz von (i) 200 Hz (ii) 280 Hz.

Welches Vielfach von 200 Hz liegt 1750 Hz am nächsten?

Antwort = die 9e Harmonische = 1800 Hz = F2

Für F0 = 280 Hz,

Antwort = die 6e Harmonische = 1680 Hz

Page 22: Die akustische Analyse von Sprachlauten. Die Interpretation von Spektrogrammen

Bitte Fragen 12-28 (Seiten 12-16) zum nächsten Mal beantworten.