Empirische Methoden in der Sprachwissenschaft mit dem ...· Dr. Emmerich Kelih Empirische Methoden

  • View
    214

  • Download
    0

Embed Size (px)

Text of Empirische Methoden in der Sprachwissenschaft mit dem ...· Dr. Emmerich Kelih Empirische Methoden

Dr. Emmerich Kelih

Empirische Methoden in der Sprachwissenschaft mit dem Fokus auf sprachlicher Komplexitt

Peer-Mentoring-Projekte an der Fakultt fr Kulturwissenschaften

Alpe-Adria Universitt Klagenfurt/Celovec

21.06. 2012

bersicht: Kurzvorstellung: Quantitative Linguistik (QL) Grundzge der QL Kernbereich (1): Zipfsche Gesetz Kernbereich (2): Menzerathsche Gesetz Einsatzbereich statistischer Methoden in der SPW Thema: Sprachliche Komplexitt ? Fokus: Vergleich von Texten (Schultexte, wissenschaftliche Texte vs. studentische Arbeiten) Fallbeispiele: Lexikalische Struktur: TTR (Type-Token Ratio) Wortlnge als Gradmesser fr sprachliche Komplexitt Ausblick: Perspektiven und Grenzen der quantitativen Textanalyse

Kurzvorstellung: Quantitative Linguistik (QL)

Bumann (1990: 623, 734) Quantitative Linguistik Statistische Linguistik [auch QL, Sprachstatistik] experimentell orientierter Teilbereich der Mathematischen Linguistik. Die S.L. beschftigt sich unter Verwendung statistischer Methoden mit der kontrollierten Untersuchungen sprachlicher Regularitten unter quantitativen Aspekten. Ihren Verfahren dienen u.a. der Herstellung von Hufigkeitswrterbchern und zu stilistischen Textanalysen. Vgl. Lexikostatistik. Anmerkungen: sehr eingeschrnkte, veraltete Auffassung von QL heute als eigenstndige interdisziplinre Richtung der SPW anzusehen Unterschiede vor allem epistemologischer Natur zwischen Sprachstatistik/Lexikostatistik Quantitative Linguistik

Anzeichen der Etablierung: QL als Disziplin

seit 1994 seit 2001 seit 2008

Qualico 2014 (29. Mai 1. Juni 2014 in Olomouc/CZ)

Buchreihen, Bibliographien, wichtige Monographien

Quantitative Linguistics bei Brockmeyer (Bochum) 1978-1992 Fortsetzung Quantitative Linguistics bei de Gruyter (Berlin u.a.) Studies in Quantitative Linguistics (RAM-Verlag, Ldenscheid) Bibliographie: Khler, R. (1995): Bibliography of Quantitative Linguistics. Amsterdam/Philadelphia: Benjamins. Khler, R.; Altmann, G.; Piotrowski, R.G. (eds.) (2005): Quantitative Linguistik. Quantitative Linguistics. Ein internationales Handbuch. An International Handbook. Berlin, New York: de Gruyter. [= Handbcher zur Sprach- und Kommunikationswissenschaft; 27] in Vorbereitung: Khler, R.; Grzybek, P.; Naumann, S. (eds.) (2013ff): Quantitative und Formale Linguistik. Berlin u.a.: de Gruyter. [= Wrterbcher zur Sprach- und Kommunikationswissenschaft; 9] [im Aufbau, ber 2000 Lemma]

Epistemologische und methodologische Grundstze: Vielzahl von quantitativen Eigenschaften von Sprache/Texte (Forschungsobjekt) Untersuchung auf die Entwicklung und Funktionsweise von sprachlichen Systemen keine Einschrnkung auf Diachronie/Synchronie, sondern genereller Fokus auf messbaren Eigenschaften von Sprache/Texten, insbesondere die Hufigkeit & Lnge sprachlicher Phnomene stehen im Mittelpunkt des Interesses. in allen Bereichen und auf allen linguistischen Analyseebenen, Phonologie, Morphologie, Syntax, Textstruktur, Lexik, Semantik, Pragmatik, Dialektologie, Sprachwandelforschung, Textlinguistik, Psycho- und Soziolinguistik usw. Einsatz statistischer Verfahren (deskriptive Statistik, explorative Statistik, mathematische Modelle (Funktionen, Wahrscheinlichkeitsmodelle) besondere Bedeutung haben quantitative Methoden in der Korpuslinguistik, Computerlinguistik, forensische Linguistik, Stilometrie, Autorenschaftsbestimmung u..

Einbettung in unterschiedliche Felder der Sprachwissenschaft Zentrale Konzepte: Hufigkeit und Lngen Sprachkonomie Effizienz usage based approach: Frequentismus u.a. Joan Bybee, Paul Hopper mit einer Vielzahl von Publikationen natrlichkeitstheoretische Richtungen (Phonologie, Morphologie, Konzept der Markiertheit, Irregularitten) Universalienforschung (statistische U.) Psycholinguistik (kognitive Faktoren, subjektive Wahrscheinlichkeit) Sprachwandel Spracherwerb Fremdsprachendidaktik linguistische Komplexitt synergetische Linguistik (Selbstorganisation sprachlicher Strukturen)

Erkenntnisziele der QL:

Finden und Untersuchungen von statistischen Gesetzmigkeiten und Regularitten in

Sprache/Texten

(1) Verteilungsgesetze (Zipfsche Gesetz)

(2) funktionelle Gesetze (Menzerathsche Gesetz)

(3) Entwicklungsgesetze (Piotrovskij Gesetz zum Sprachwandel)

QL geht ber deskriptive/explorative Anwendung statistischer Methoden hinaus

deduktives Postulieren von adquaten mathematischen Modellen

linguistische Einbettung der Relevanz von Hufigkeiten & Lngen

Fallbeispiel 1: Zipfsche Gesetz - geht auf G.K. Zipf (1902-1950) zurck - Autor von Psychobiology of Language (1935) und Human Behavior and the Principle of Least Effort (1949) - Sammelbegriff fr unterschiedliche Arten von Potenzgesetzen (power laws) - unterschiedliche mathematische Formulierung als stetige Funktionen

oder diskrete Verteilung - Anwendung nicht nur in der Linguistik, sondern auch in vielen anderen Wissenschaften (Biologie, Soziologie, konomie usw.) - grundlegendes Verhalten nichtlinearer dynamischer Systeme - Verteilungsverlauf ist modellierbar

Was ist der linguistische Hintergrund der Zipfschen Gesetze?

Hufigkeit von Wortformen 1. Text (running text) 2. Lemmatisierung (ja/nein) 3. Bestimmung der Anzahl von Wortformen (Tokens) 4. Sortierung der Wortformen nach ihrer Hufigkeit

5. Erstellen einer Ranghufigkeitsverteilung

Russischer Text: Master i Margarita

Rang Word Freq. Rang Word Freq. 1 5006 16 602 2 3640 17 594 3 2025 18 534 4 2003 19 527 5 1905 20 515 6 1307 21 477 7 1153 22 465 8 1071 23 419 9 974 24 414

10 883 25 411 11 867 26 396 12 713 27 382 13 699 28 326 14 688 29 308 15 647 30 306

Graphische Darstellung: Ranghufigkeitsverteilung

Welche linguistische Bedeutung? modellierbares Wechselspiel von hufigen und weniger hufigen Wortformen wenige Wortformen kommen mit sehr hoher Hufigkeit vor nichtlineare Verlaufsform Entropie & Wiederholungsrate von Wortformen

Verlaufsform der Ranghufigkeitsverteilung ist abhngig von Autor Textsorte Funktionalstil Sprache + gilt auch der Ebene von Lexemen, Lemmata bzw. generell fr die Ranghufigkeitsverteilung von linguistischen Einheiten + typischer Verlauf fr komplexe, nichtlineare Systeme

Graphische Darstellung: Ranghufigkeitsverteilung

Zipfsche Gesetz: Erweiterungen

1. Hufigkeit von Wortformen Rang von Wortformen

2. Hufigkeit von Wortformen Krze/Lnge von Wortformen

3. Hufigkeit von Wortformen Querbezge zur Ausprgung von Polysemie

Hufigkeit von Wortformen

Lnge von Wortformen

Polysemie

--> Finden von gegenseitigen Abhngigkeiten und Wechselbeziehungen zwischen Merkmalen/Eigenschaften

Funktionelle Gesetze (Menzerathsche Gesetz)

Paul Menzerath (1883-1954)

Institut fr Kommunikationsforschung und Phonetik in Bonn u.a. zentrale Arbeit relevant fr die QL: Menzerath, Paul (1954): Die Architektonik des deutschen Wortschatzes. Bonn: Dmmler. [= Phonetische Studien; 3] Untersuchung der Silbenstruktur im Deutschen und anderen Sprachen

Es tritt eine "Sparsamkeitsregel" in Erscheinung, die sich psychologisch auf eine Ganzheitsregel dieser Art grndet: je grer das Ganze, um so kleiner die Teile! Diese Regel wird hier zum ersten Mal abgeleitet; sie wird aus der Tatsache verstndlich, da das Ganze jeweils "bersehbar" bleiben mu. (Menzerath 1954:

Quantitative Organisation der Lnge von sprachlichen Einheiten

Gibt es einen Zusammenhang zwischen der Wortlnge und der Silbenlnge? Spezifizierung von Wortlnge: Zentrales Problem der Definition von Wort (orthographische, phonologische, prosodische, morphologische, morphosyntaktische Kriterien) Bestimmung + Definition der Silbe bzw. der Silbengrenze

f.sg.nom. Raubtier Lnge in Graphemen: 4 Lnge in Silben: 1 durchschnittliche Silbenlnge = 4 Grapheme/Silbe 1.p.sg.pr. arbeiten Lnge in Graphemen: 5 Lnge in Silben: 2 durchschnittliche Silbenlnge = 5/2 = 2,5 Grapheme/Silbe - m.sg.gen./acc. gut Lnge in Graphemen: 7 Lnge in Silben: 3 durchschnittliche Silbenlnge = 7/3 = 2,33 Grapheme/Silbe - n.sg.nom. Text Lnge in Graphemen: 8 Lnge in Silben: 4 durchschnittliche Silbenlnge = 8/4 = 2 Grapheme/Silbe

Je lnger das Wort, desto krzer die Silben.

Menzerathsche Gesetz (1) Je lnger das Wort, desto krzer die Silben.

Wortlnge: Anzahl von Silben

Dur

chsc

hnitt

liche

Silb

enl

nge

in einer Vielzahl von Sprachen untersucht und belegt Was ist mit Sprachen ohne eurozentrierten Wortbegriff ?

Zusammenhang von Wort- und Silbenlnge in slawischen Sprachen (Paralleltextkorpus)

kann als eine Universalie betrachtet werden

2,00

2,20

2,40

2,60

2,80

3,00

3,20

1 3 5 7 2,00

2,20

2,40

2,60

2,80

3,00

3,20

1 3 5 7

Slowenisch Mazedonisch

2,00

2,20

2,40

2,60

2,80

3,00

3,20

1 3 5 7

Russisch

2,00

2,20

2,40

2,60

2,80

3,00

3,20

1 3 5 7

Tschechisch

Menzerathsche Gesetz (2)

(1) Mit zunehmender Wortlnge nimmt die Lautdauer ab.

(2) Mit zunehmender Wortlnge nimmt die Silbenlnge ab.

(3) Mit zunehmender Wortlnge nimmt die Morphlnge ab.

(4) Mit zunehmender Phrasenlnge nimmt die Wortlnge .

(5) Mit zunehmender Satzlnge nimmt die Teilsatzlnge (Clause) ab.

Je lnger der Satz, d.h