18
Transformationen: Text. Zahlen. Bild. Emmerich Kelih (Graz) R.U.R. – Rossum’s Universal Robots: Datenverarbeitung in Sprach-, Kultur- und Literaturwissenschaft

Transformationen: Text. Zahlen. Bild. Emmerich Kelih (Graz)

  • Upload
    nira

  • View
    31

  • Download
    1

Embed Size (px)

DESCRIPTION

R.U.R. – Rossum’s Universal Robots: Datenverarbeitung in Sprach-, Kultur- und Literaturwissenschaft. Transformationen: Text. Zahlen. Bild. Emmerich Kelih (Graz). Nummer. Sprache. Mittelwert der Wortlänge (in Silben). 1. Englisch. 1,4. 2. Französisch. 1,6. 3. Deutsch. 1,7. 4. - PowerPoint PPT Presentation

Citation preview

Page 1: Transformationen: Text. Zahlen. Bild. Emmerich Kelih (Graz)

 Transformationen: Text. Zahlen. Bild.

 Emmerich Kelih (Graz)

 

R.U.R. – Rossum’s Universal Robots:

Datenverarbeitung in Sprach-, Kultur- und Literaturwissenschaft

Page 2: Transformationen: Text. Zahlen. Bild. Emmerich Kelih (Graz)

Nummer Sprache Mittelwert der Wortlänge (in Silben)

1 Englisch 1,4

2 Französisch 1,6

3 Deutsch 1,7

4 Esperanto 1,9

5 Italienisch 2,0

6 Griechisch 2,1

7 Ungarisch 2,2

8 Russisch 2,2

9 Lateinisch 2,4

10 Türkisch 2,5

Aus: W. Fucks (1968): Nach allen Regeln der Kunst. S. 80

1. Wortlänge und Sprachtypologie

Page 3: Transformationen: Text. Zahlen. Bild. Emmerich Kelih (Graz)

Englisch Deutsch Italienisch Russisch Türkisch 0

0,5

1

1,5

2

2,5

3M

ittle

re W

ort

l änge (

Sil b

en)

Serie1

Mittlere Wortlänge (gemessen in Silben)

Aus: W. Fucks (1968): Nach allen Regeln der Kunst. S. 80

Page 4: Transformationen: Text. Zahlen. Bild. Emmerich Kelih (Graz)

2. Autorenschaft und Wortlänge

Autor WL (Graph.)

Autor WL(Graph.)

Autor WL (Graph.)

K I 5,522 Š I 5,553 TD 1 5,721

K II 5,609 Š II 5,686 TD 2 5,753

K. ges.

5,566 Š. ges.

5,603 TD 4 6, 016

        TD ges.

5,851

Aus: Kjetsaa, G. (1984): The Authorship of the Quiet Don. S. 71-73

Page 5: Transformationen: Text. Zahlen. Bild. Emmerich Kelih (Graz)

Ivan Cankar: “Hiša Marije Pomočnice“

Mittlere Wortlänge: Einzelkapitel vs. Gesamtext

1 2 3 4 GM 5 6 7 8 91,5

1,6

1,7

1,8

1,9

2

Mitt

lere

Wo r

t läng

e in

Sil b

e n

Einzelkapitel Gesamtmittelwert

Page 6: Transformationen: Text. Zahlen. Bild. Emmerich Kelih (Graz)

3. Textsortentypologie

Aus: Poniž, Denis (1974): Slovenski jezik ~literatura ~računalniki. S. 115-117

številka Tip besedila število zlogov v besedi

1 časopisni I 2,29

2 časopisni II 2,08

3 strokovni I 2,28

4 strokovni II 2,09

5 strokovni III 1,90

6 esejistični I 2,26

7 esejistični II 2,01

8 prozni I 1,95

9 prozni II 1,90

10 prozni III 1,82

11 poetični I 1,87

12 poetični II 1,84

13 poetični III 1,89

14 dramatični I 1,97

15 dramatični II 1,91

16 dramatični III 1,74

Page 7: Transformationen: Text. Zahlen. Bild. Emmerich Kelih (Graz)

GesamtkorpusN=153

ProsaN1 = 102

Poesie N2 = 51

N 1.2. = 50Presse

N1.1.= 52Lit. Prosa

Page 8: Transformationen: Text. Zahlen. Bild. Emmerich Kelih (Graz)

4. Silbendefinition

“Navadno pa je v besedi toliko zlogov, kolikor je v njej samoglasnikov,

ki jih običajmo tudi pišemo s črkami za samoglasnike“

(J. Toporišič 2000, 88).

Vokale (V) Silbendef. I Silbendef. II

a, e, i, o, u 1 V = 1 Silbe K + r + K = 1 Silbe

    R/r + K

Page 9: Transformationen: Text. Zahlen. Bild. Emmerich Kelih (Graz)

5. Auszählungsprinzipien

 

a.)    Akronyme

Beispiele:

SMS EsEmEs

SDS EsDeEs

NK EnKa

JLA JeLeA

Page 10: Transformationen: Text. Zahlen. Bild. Emmerich Kelih (Graz)

b.) Abkürzungen - Auszug

Akürzung Ersetzung I Ersetzung II

angl. angleško angleščina

dol. določen dolenjski

c. k. cesarsko- kraljevi cesarsko-kraljevski

c. kr. cesarsko- kraljevi cesarsko-kraljevski

c.kr. cesarsko- kraljevi cesarsko-kraljevski

dipl. diplomiran diplomatski

doc. docent  

dr. doktor drugo

etc. et cetera  

fr. francoščina francoski

g. gospod  

ga. gospa  

gdč. gospodična  

gen. general generalen

Aus: Primož, Jakopin (1999): Zgornja meja entropije pri leposlovnih besedilih v slovenskem jeziku.

Page 11: Transformationen: Text. Zahlen. Bild. Emmerich Kelih (Graz)

Beispiele:

Text Ersetzung

V angl. drami V angleški drami

c.-kr. c.kr.c. kr.c. k

cesarsko-kraljevicesarsko-kraljevski 

Page 12: Transformationen: Text. Zahlen. Bild. Emmerich Kelih (Graz)

c.) Zahlen

 

Beispiel:

Bilo je leta 1907. Bilo je leta tisoč devetsto sedem.

 

Včeraj 10. oktobra je bil poseben praznik. Včeraj desetega oktobra je bil poseben praznik

Page 13: Transformationen: Text. Zahlen. Bild. Emmerich Kelih (Graz)

d.) Fremdsprachliches

 

Doppelvokale

Beispiel:

Wiener Neustadt Viner Nejstadt

Lorry Lorri

Page 14: Transformationen: Text. Zahlen. Bild. Emmerich Kelih (Graz)

6. Exkurs: 0-silbige Wörter 

Ivan, Cankar: Hiša Marije Pomočnice (HMP)

Text Wörter (abs.)

Silben (abs.)

Mittlere Wortlänge/ Silben

HMP (mit 0-silbigen Wörtern)

29718 55212 1.8579

HMP (mit 1-silbigen Wörtern)

29459 55212 1.8742

Page 15: Transformationen: Text. Zahlen. Bild. Emmerich Kelih (Graz)

Merkmal: Textlänge in Silben

  Textgattung

Prosa(lit.)

Presse Poesie Total

N 52 50 51 153

Mittelwert () 3999,98 1084,16 269,86 1803,73

Median (Md) 2777,00 880,00 223,00 883,00

Stabw. (s) 2943,47 784,47 191,75 2393,19

Kurtosis (g1) 1,80 5,91 9,12 6,61

Schiefe (g2) 1,36 2,08 2,49 2,40

Page 16: Transformationen: Text. Zahlen. Bild. Emmerich Kelih (Graz)

Multivariate Diskriminanzanalyse:

a.) Für jeden Text unter Angabe von zugehörigen Wahrscheinlichkeiten eine individuelle Zuordnung zu einem der betreffenden Texttypen.

b.) Keine individuelle Entscheidung

Page 17: Transformationen: Text. Zahlen. Bild. Emmerich Kelih (Graz)

Scatterplot der Diskriminanzvariablen

Page 18: Transformationen: Text. Zahlen. Bild. Emmerich Kelih (Graz)

-6 -4 -2 0 2 4

1015

2025

6

-6 -4 -2 0 2 4

1015

2025

6

-6 -4 -2 0 2 4

1015

2025

6

-6 -4 -2 0 2 4

dim2

1015

2025

dim

1

1

11 1

1

111 1

1 111 1111 1

111

111

1

1 1 11

11

111

111 11

11 1 1

1

11 111 11 1

3

3

3

33

3

3

33

33

33 3 33

33

3

33

3

33

33

3

33

33

3

33

3

3

3

33

33 3

33

3

3

3

3

3

33

2 22

2

2

2

2

2

2

2 22

2

222

2

2

2 2

2

2

2

22

2

22

2

22

2

2

2

2

2

2

2

2

2

2

2

22 22

2

22

2

-6 -4 -2 0 2 4

1015

2025

-6 -4 -2 0 2 4

1015

2025

-6 -4 -2 0 2 4

1015

2025