Upload
nira
View
31
Download
1
Embed Size (px)
DESCRIPTION
R.U.R. – Rossum’s Universal Robots: Datenverarbeitung in Sprach-, Kultur- und Literaturwissenschaft. Transformationen: Text. Zahlen. Bild. Emmerich Kelih (Graz). Nummer. Sprache. Mittelwert der Wortlänge (in Silben). 1. Englisch. 1,4. 2. Französisch. 1,6. 3. Deutsch. 1,7. 4. - PowerPoint PPT Presentation
Citation preview
Transformationen: Text. Zahlen. Bild.
Emmerich Kelih (Graz)
R.U.R. – Rossum’s Universal Robots:
Datenverarbeitung in Sprach-, Kultur- und Literaturwissenschaft
Nummer Sprache Mittelwert der Wortlänge (in Silben)
1 Englisch 1,4
2 Französisch 1,6
3 Deutsch 1,7
4 Esperanto 1,9
5 Italienisch 2,0
6 Griechisch 2,1
7 Ungarisch 2,2
8 Russisch 2,2
9 Lateinisch 2,4
10 Türkisch 2,5
Aus: W. Fucks (1968): Nach allen Regeln der Kunst. S. 80
1. Wortlänge und Sprachtypologie
Englisch Deutsch Italienisch Russisch Türkisch 0
0,5
1
1,5
2
2,5
3M
ittle
re W
ort
l änge (
Sil b
en)
Serie1
Mittlere Wortlänge (gemessen in Silben)
Aus: W. Fucks (1968): Nach allen Regeln der Kunst. S. 80
2. Autorenschaft und Wortlänge
Autor WL (Graph.)
Autor WL(Graph.)
Autor WL (Graph.)
K I 5,522 Š I 5,553 TD 1 5,721
K II 5,609 Š II 5,686 TD 2 5,753
K. ges.
5,566 Š. ges.
5,603 TD 4 6, 016
TD ges.
5,851
Aus: Kjetsaa, G. (1984): The Authorship of the Quiet Don. S. 71-73
Ivan Cankar: “Hiša Marije Pomočnice“
Mittlere Wortlänge: Einzelkapitel vs. Gesamtext
1 2 3 4 GM 5 6 7 8 91,5
1,6
1,7
1,8
1,9
2
Mitt
lere
Wo r
t läng
e in
Sil b
e n
Einzelkapitel Gesamtmittelwert
3. Textsortentypologie
Aus: Poniž, Denis (1974): Slovenski jezik ~literatura ~računalniki. S. 115-117
številka Tip besedila število zlogov v besedi
1 časopisni I 2,29
2 časopisni II 2,08
3 strokovni I 2,28
4 strokovni II 2,09
5 strokovni III 1,90
6 esejistični I 2,26
7 esejistični II 2,01
8 prozni I 1,95
9 prozni II 1,90
10 prozni III 1,82
11 poetični I 1,87
12 poetični II 1,84
13 poetični III 1,89
14 dramatični I 1,97
15 dramatični II 1,91
16 dramatični III 1,74
GesamtkorpusN=153
ProsaN1 = 102
Poesie N2 = 51
N 1.2. = 50Presse
N1.1.= 52Lit. Prosa
4. Silbendefinition
“Navadno pa je v besedi toliko zlogov, kolikor je v njej samoglasnikov,
ki jih običajmo tudi pišemo s črkami za samoglasnike“
(J. Toporišič 2000, 88).
Vokale (V) Silbendef. I Silbendef. II
a, e, i, o, u 1 V = 1 Silbe K + r + K = 1 Silbe
R/r + K
5. Auszählungsprinzipien
a.) Akronyme
Beispiele:
SMS EsEmEs
SDS EsDeEs
NK EnKa
JLA JeLeA
b.) Abkürzungen - Auszug
Akürzung Ersetzung I Ersetzung II
angl. angleško angleščina
dol. določen dolenjski
c. k. cesarsko- kraljevi cesarsko-kraljevski
c. kr. cesarsko- kraljevi cesarsko-kraljevski
c.kr. cesarsko- kraljevi cesarsko-kraljevski
dipl. diplomiran diplomatski
doc. docent
dr. doktor drugo
etc. et cetera
fr. francoščina francoski
g. gospod
ga. gospa
gdč. gospodična
gen. general generalen
Aus: Primož, Jakopin (1999): Zgornja meja entropije pri leposlovnih besedilih v slovenskem jeziku.
Beispiele:
Text Ersetzung
V angl. drami V angleški drami
c.-kr. c.kr.c. kr.c. k
cesarsko-kraljevicesarsko-kraljevski
c.) Zahlen
Beispiel:
Bilo je leta 1907. Bilo je leta tisoč devetsto sedem.
Včeraj 10. oktobra je bil poseben praznik. Včeraj desetega oktobra je bil poseben praznik
d.) Fremdsprachliches
Doppelvokale
Beispiel:
Wiener Neustadt Viner Nejstadt
Lorry Lorri
6. Exkurs: 0-silbige Wörter
Ivan, Cankar: Hiša Marije Pomočnice (HMP)
Text Wörter (abs.)
Silben (abs.)
Mittlere Wortlänge/ Silben
HMP (mit 0-silbigen Wörtern)
29718 55212 1.8579
HMP (mit 1-silbigen Wörtern)
29459 55212 1.8742
Merkmal: Textlänge in Silben
Textgattung
Prosa(lit.)
Presse Poesie Total
N 52 50 51 153
Mittelwert () 3999,98 1084,16 269,86 1803,73
Median (Md) 2777,00 880,00 223,00 883,00
Stabw. (s) 2943,47 784,47 191,75 2393,19
Kurtosis (g1) 1,80 5,91 9,12 6,61
Schiefe (g2) 1,36 2,08 2,49 2,40
Multivariate Diskriminanzanalyse:
a.) Für jeden Text unter Angabe von zugehörigen Wahrscheinlichkeiten eine individuelle Zuordnung zu einem der betreffenden Texttypen.
b.) Keine individuelle Entscheidung
Scatterplot der Diskriminanzvariablen
-6 -4 -2 0 2 4
1015
2025
6
-6 -4 -2 0 2 4
1015
2025
6
-6 -4 -2 0 2 4
1015
2025
6
-6 -4 -2 0 2 4
dim2
1015
2025
dim
1
1
11 1
1
111 1
1 111 1111 1
111
111
1
1 1 11
11
111
111 11
11 1 1
1
11 111 11 1
3
3
3
33
3
3
33
33
33 3 33
33
3
33
3
33
33
3
33
33
3
33
3
3
3
33
33 3
33
3
3
3
3
3
33
2 22
2
2
2
2
2
2
2 22
2
222
2
2
2 2
2
2
2
22
2
22
2
22
2
2
2
2
2
2
2
2
2
2
2
22 22
2
22
2
-6 -4 -2 0 2 4
1015
2025
-6 -4 -2 0 2 4
1015
2025
-6 -4 -2 0 2 4
1015
2025