34
Morphologie f ¨ ur die Computerlexikographie E BERHARD K ARLS U NIVERSITÄT T ÜBINGEN Seminar f ¨ ur Sprachwissenschaft Morphologie für die Computerlexikographie Claudia Kunze [email protected], [email protected] Computational Lexicography Morphologie f ¨ ur die Computerlexikographie – p.1

die für ographie aph r xik Le Morphologie Computerle · Kasus, Numer us, T empus, P erson etc. Neben dem System der Fle xionsmor pheme, einem In v entar mit n ur w enigen Elementen,

Embed Size (px)

Citation preview

Page 1: die für ographie aph r xik Le Morphologie Computerle · Kasus, Numer us, T empus, P erson etc. Neben dem System der Fle xionsmor pheme, einem In v entar mit n ur w enigen Elementen,

Morphologie fur die Computerlexikographie

EBERHARDKARLSUNIVERSITÄTTÜBINGENSeminarfurSprachwissenschaft

Mor

phol

ogie

für

die

Com

pute

rlexi

kog

raph

ieC

laud

iaK

unze

[email protected],

[email protected]

Com

puta

tiona

lLex

icog

raph

y

Mor

phol

ogie

fur

die

Com

pute

rlexi

kogr

aphi

e–

p.1

Page 2: die für ographie aph r xik Le Morphologie Computerle · Kasus, Numer us, T empus, P erson etc. Neben dem System der Fle xionsmor pheme, einem In v entar mit n ur w enigen Elementen,

EBERHARDKARLSUNIVERSITÄTTÜBINGENSeminarfurSprachwissenschaftT

hem

en

Mot

ivat

ion

eini

geG

rund

begr

iffe

der

Mor

phol

ogie

Kod

ieru

ngm

orph

olog

isch

erA

ngab

enin

Wör

terb

üche

rn

Sys

tem

efü

rdi

em

orph

olog

isch

eA

naly

se

Mor

phol

ogie

fur

die

Com

pute

rlexi

kogr

aphi

e–

p.2

Page 3: die für ographie aph r xik Le Morphologie Computerle · Kasus, Numer us, T empus, P erson etc. Neben dem System der Fle xionsmor pheme, einem In v entar mit n ur w enigen Elementen,

EBERHARDKARLSUNIVERSITÄTTÜBINGENSeminarfurSprachwissenschaftB

edeu

tung

der

mor

phol

ogis

che

nA

naly

sefü

rdi

eC

L

Die

mor

phol

ogis

che

Ana

lyse

von

Wor

tform

enis

tfür

die

text

basi

erte

Com

pute

rlexi

kogr

aphi

eau

szw

eiG

ründ

enbe

sond

ers

wic

htig

:

LE

MM

AT

ISIE

RU

NG:

Zuo

rdnu

ngfle

ktie

rter

lexi

kalis

cher

Ein

heite

nau

fihr

eje

wei

ligle

xika

lisch

rele

vant

enG

rund

form

en

NE

UW

OR

TB

ILD

UN

G:

Pro

dukt

ivitä

tder

Spr

ache

grei

fthä

ufig

aufb

erei

tsim

Lexi

kon

verz

eich

nete

lexi

kalis

che

Ein

heite

nzu

rück

:mor

phol

ogis

che

Pro

zess

ede

rD

ER

IVA

TIO

Nun

dK

OM

PO

SIT

ION

Ein

schr

änku

ngau

fdie

für

uns

rele

vant

enA

ufga

ben

der

Suc

he

imW

örte

rbuc

hun

dde

rLe

xiko

nerw

eite

rung

Mor

phol

ogie

fur

die

Com

pute

rlexi

kogr

aphi

e–

p.3

Page 4: die für ographie aph r xik Le Morphologie Computerle · Kasus, Numer us, T empus, P erson etc. Neben dem System der Fle xionsmor pheme, einem In v entar mit n ur w enigen Elementen,

EBERHARDKARLSUNIVERSITÄTTÜBINGENSeminarfurSprachwissenschaftE

inig

eG

rund

begr

iffe

TO

KE

N:e

ine

Zei

chen

kette

inei

nem

Text

,die

inde

nm

eist

enF

älle

nal

sT

EX

TW

OR

T

inte

rpre

tiert

wer

den

kann

.Dav

onzu

unte

rsch

eide

nsi

nddi

eso

g.N

ICH

T-W

OR

TE

Rdu

rch

z.B

.Sch

reib

fehl

er,f

ehle

rhaf

teTr

ennu

ngen

,irr

tüm

lich

gese

tzte

oder

nich

tent

fern

teS

teue

rzei

chen

etc.

TY

PE:R

eprä

sent

ante

iner

Men

gevo

nTo

ken,

die

glei

chsi

ndod

erso

ähnl

ich,

dass

sie

zuei

ner

Kla

sse

gehö

ren.

Der

Sat

z(1

)W

eils

ieso

rast

en,m

usst

ensi

eof

tras

ten.

best

ehta

us8

Toke

n(o

der

10,m

itde

nbe

iden

Inte

rpun

ktio

nsze

iche

n),d

iezu

6(8

)Ty

pes

zusa

mm

enge

fass

twer

den:

Wei

l,si

e,so

,ras

ten,

mus

sten

,oft,

(,),

(.)

MO

RP

HE

M:k

lein

ste

bede

utun

gstr

agen

deE

inhe

itun

dkl

eins

ter

Bes

tand

teil

lexi

kalis

cher

Zei

chen

,mit

eige

nstä

ndig

erF

unkt

ion;

Mor

phem

esi

ndsy

stem

atis

che

Abs

trak

tione

nüb

erde

nre

alin

Wör

tern

auftr

eten

den

Bes

tand

teile

n,de

nM

OR

PH

EN.

MO

RP

H:B

esta

ndte

ilei

nes

Wor

tes,

wel

ches

eine

mM

orph

emzu

geor

dnet

wer

den

kann

;di

eZ

eich

enke

tten

s(in

:Gar

ten-

s)un

den

(in:S

olda

t-en

)si

ndM

orph

e,di

eda

sM

orph

em/G

eniti

vS

ingu

lar/

real

isie

ren.

Die

Zei

chen

kette

ung

hing

egen

real

isie

rtin

Spr

ung

kein

Mor

phem

,son

dern

istu

nsel

bstä

ndig

erB

esta

ndte

ilde

sW

orts

tam

ms.

STA

MM

-MO

RP

HE

Mbz

w.W

OR

TS

TAM

M:z

entr

ales

,bed

eutu

ngst

rage

ndes

Ele

men

tein

esW

orte

s,(le

tzte

res

mus

sm

ind.

eine

nW

orts

tam

mha

ben)

.seh

istS

tam

mvo

nse

hen,

anse

hnlic

h,F

erns

eher

etc.

Auf

teilu

ngna

chpr

imär

erW

ortk

lass

ein

Nom

inal

-,V

erba

l-un

dA

djek

tivst

ämm

eus

w.M

ehre

reW

orts

täm

me

könn

enzu

eine

mK

ompo

situ

mve

rbun

den

wer

den.

Ein

oder

meh

rere

Wor

tstä

mm

ebi

lden

den

WO

RT

KE

RN.

Mor

phol

ogie

fur

die

Com

pute

rlexi

kogr

aphi

e–

p.4

Page 5: die für ographie aph r xik Le Morphologie Computerle · Kasus, Numer us, T empus, P erson etc. Neben dem System der Fle xionsmor pheme, einem In v entar mit n ur w enigen Elementen,

EBERHARDKARLSUNIVERSITÄTTÜBINGENSeminarfurSprachwissenschaftG

rund

begr

iffe,

For

ts.

DE

RIV

AT

ION

SM

OR

PH

EM

bzw

.Affi

x:M

orph

em,d

aszu

eine

mS

tam

mhi

nzut

rete

nka

nnun

ddi

esen

sow

ohlh

insi

chtli

chde

rm

orph

osyn

takt

isch

enK

lass

e(W

orta

rt)

als

auch

der

Bed

eutu

ngsy

stem

atis

chve

ränd

ern

kann

.Suf

fix-b

artr

ittan

Ver

bals

täm

me,

verä

nder

tdi

eW

ortk

lass

ezu

Adj

ektiv

und

fügt

der

Bed

eutu

ngde

sV

erba

lsta

mm

sdi

eM

odal

itätd

es„M

öglic

hsei

ns“

hinz

u.

FL

EX

ION

SM

OR

PH

EM

:trit

tzu

Sta

mm

,Kom

posi

tum

oder

eine

mde

rivie

rten

Wor

tund

mar

kier

tdes

sen

mor

phos

ynta

ktis

che

Kat

egor

ie.M

ehre

reF

lexi

onsm

orph

eme

könn

enzu

sam

men

auftr

eten

und

z.B

.bei

Ver

ben

Tem

pus,

Num

erus

und

Per

son

mar

kier

en(m

ach-

t-es

t).

FU

GE

NM

OR

PH

EM

:kan

nzw

isch

enzw

eiS

tam

m-M

orph

eme

tret

en,m

eist

aus

laut

liche

nG

ründ

en.D

ieF

ugen

mor

phe

des

Deu

tsch

ensi

ndzw

arin

der

For

mm

itF

lexi

ven

des

Deu

tsch

enid

entis

ch,n

icht

jedo

chin

ihre

rD

istr

ibut

ion

(vgl

.Arb

eit-

s-am

t).

GR

UN

DF

OR

Mei

ner

lexi

kalis

chen

Ein

heit

(auc

hZ

ITIE

RF

OR

M:F

orm

,unt

erde

rdi

ese

lexi

kalis

che

Ein

heit

imW

örte

rbuc

hve

rzei

chne

twird

.Es

gibt

wor

tart

en-

und

spra

chsp

ezifi

sche

Kon

vent

ione

nfü

rdi

eB

ildun

gde

rG

rund

form

eine

rle

xika

lisch

enE

inhe

it.D

ieG

rund

form

kann

mit

dem

Wor

tsta

mm

zusa

mm

enfa

llen

(z.B

.rot

,kan

nab

ereb

enso

über

den

Sta

mm

hina

usge

hen

(Sta

mm

:seh

;Gru

ndfo

rm:s

ehen

).

Mor

phol

ogie

fur

die

Com

pute

rlexi

kogr

aphi

e–

p.5

Page 6: die für ographie aph r xik Le Morphologie Computerle · Kasus, Numer us, T empus, P erson etc. Neben dem System der Fle xionsmor pheme, einem In v entar mit n ur w enigen Elementen,

EBERHARDKARLSUNIVERSITÄTTÜBINGENSeminarfurSprachwissenschaftM

orph

olog

isc

heW

ortg

ram

mat

ikK

ompl

exe

Wör

ter

sind

nach

gew

isse

nR

egul

aritä

ten

aufg

ebau

t,di

esi

chm

ittel

sei

ner

“Wor

tgra

mm

atik

”st

rukt

urel

lerf

asse

nla

ssen

:

Bed

ingu

ngen

für

die

Auf

eina

nder

folg

ede

rve

rsch

iede

nen

Art

envo

nM

orph

emen

(Sta

mm

,Affi

x,F

lexi

v)fü

hren

zufo

lgen

der

kano

nisc

her

Wor

tstr

uktu

r:

(1)

PR

Ä*

STA

MM

[FU

GE

?S

TAM

M]*

SU

FF

*F

LEX

*

PR

Ä=

Prä

fix,S

TAM

M=

Sta

mm

mor

phem

,FU

GE

=F

ugen

mor

phem

,SU

FF

=S

uffix

,F

LEX

=F

lexi

v;de

rS

tern

kenn

zeic

hnet

,wie

inre

gulä

ren

Aus

drüc

ken,

das

mar

kier

teE

lem

enta

lsop

tiona

lund

belie

big

ofti

terie

rbar

(the

oret

isch

eO

ptio

n!).

Bei

spie

le:

(2)

ver-

un-t

reu-

en,U

n-w

äg-b

ar-k

eit,

Arb

eit-

s-am

t-s-

stat

istik

-en

Zw

isch

enM

orph

emen

vers

chie

dene

rK

lass

enbe

steh

enB

ezie

hung

ende

rR

ektio

nod

erde

rS

ubka

tego

risi

erun

g,äh

nlic

hw

iein

der

Syn

tax.

Das

Suf

fix-b

arsu

bkat

egor

isie

rtau

ssch

ließ

lich

verb

ale

Stä

mm

eun

dfü

hrte

inen

Kat

egor

ienw

echs

elzu

mA

djek

tivhe

rbei

.

Mor

phol

ogie

fur

die

Com

pute

rlexi

kogr

aphi

e–

p.6

Page 7: die für ographie aph r xik Le Morphologie Computerle · Kasus, Numer us, T empus, P erson etc. Neben dem System der Fle xionsmor pheme, einem In v entar mit n ur w enigen Elementen,

EBERHARDKARLSUNIVERSITÄTTÜBINGENSeminarfurSprachwissenschaftW

ortg

ram

mat

ik,

For

ts.

RIG

HT

HA

ND

HE

AD

RU

LE

(Will

iam

s:19

81):

inm

orph

olog

isch

kom

plex

enW

örte

rnis

tdas

amw

eite

sten

rech

tsau

ftret

ende

Ele

men

tder

Hea

d(K

opf)

dies

esW

orte

s,d.

h.da

ssdi

eses

Ele

men

talle

mor

phol

ogis

chre

leva

nten

Mer

kmal

ede

term

inie

rt.B

eisp

iel:

Pha

ntas

iew

ort

Wrx

lbar

keit

:

Iden

tifizi

eren

des

amw

eite

sten

rech

tsst

ehen

den

Ele

men

ts:d

asS

uffix

-kei

t

lexi

kalis

che

Bes

chre

ibun

gal

sei

nS

ubst

antiv

mit

dem

Gen

usF

emin

inum

und

eine

rbe

stim

mte

nF

lexi

onsk

lass

e

Aus

sage

nüb

erW

ortfo

rm(e

n)oh

neW

isse

nüb

erdi

eB

edeu

tung

des

Sta

mm

es(w

rxl)

mög

lich

Rek

tions

eige

nsch

afte

nde

sS

uffix

es-b

arw

eise

nau

fein

enV

erba

lsta

mm

und

die

Exi

sten

zei

nes

Ver

bsw

rxln

hin

(tei

l)aut

omat

isch

enA

naly

seun

beka

nnte

rW

örte

rin

Text

en:r

echt

sbe

ginn

enun

dna

chde

mV

erfa

hren

des

LO

NG

ES

TM

AT

CH

Fle

xive

und

Suf

fixe

iden

tifizi

eren

(die

jage

schl

osse

neK

lass

ensi

nd),

dana

chvo

nlin

ksna

chP

räfix

ensu

chen

und

den

Res

tal

sS

tam

mde

sW

orte

san

nehm

en

Mor

phol

ogie

fur

die

Com

pute

rlexi

kogr

aphi

e–

p.7

Page 8: die für ographie aph r xik Le Morphologie Computerle · Kasus, Numer us, T empus, P erson etc. Neben dem System der Fle xionsmor pheme, einem In v entar mit n ur w enigen Elementen,

EBERHARDKARLSUNIVERSITÄTTÜBINGENSeminarfurSprachwissenschaftF

lexi

onsm

orph

olog

isc

heA

naly

seF

lexi

vebi

lden

den

rech

ten

Ran

dvo

nW

örte

rn,b

isau

fseh

rw

enig

eA

usna

hmen

,in

dene

nei

nF

lexi

vim

Wor

tinne

ren

steh

enka

nn(e

ine

Lose

blat

tsam

mlu

ng

� eine

rLo

se-n

-bla

tt-sa

mm

lung

).F

lexi

vede

term

inie

ren

kong

ruen

zrel

evan

teM

erkm

ale

eine

sW

orte

sin

eine

rN

Pod

erV

P:K

asus

,Num

erus

,Tem

pus,

Per

son

etc.

Neb

ende

mS

yste

mde

rF

lexi

onsm

orph

eme,

eine

mIn

vent

arm

itnu

rw

enig

enE

lem

ente

n,ke

nntd

asD

euts

che

die

Mar

kier

ung

von

mor

phos

ynta

ktis

chen

Mer

kmal

endu

rch

Um

laut

ung

(z.B

.Bog

en–

Bög

en)

oder

Abl

autu

ngde

sS

tam

mes

(z.B

.sch

wim

men

–sc

hwam

men

).Z

wei

Art

ende

rA

mbi

guitä

tbe

ider

mor

phem

atis

chen

Ana

lyse

:

Zei

chen

kette

wie

z.B

.-en

kann

entw

eder

Teil

eine

sW

orts

tam

ms

oder

Inst

anz

eine

sF

lexi

onsm

orph

ems

sein

.Die

Wor

tform

Rah

men

ists

oin

terp

retie

rbar

als

eine

Inst

anz

des

lexi

kalis

chen

Zei

chen

s/R

ahm

/(m

itF

lexi

onse

ndun

g)od

eral

sIn

stan

zde

sle

xika

lisch

enZ

eich

ens

/Rah

men

/(oh

neF

lexi

onse

ndun

g).D

iese

Art

der

Am

bigu

ität

vers

chle

chte

rtda

sE

rgeb

nis

eine

rLe

mm

atis

ieru

ng.S

tatis

tisch

eV

erfa

hren

könn

enhe

lfen,

die

imge

gebe

nen

Kon

text

wah

rsch

einl

iche

reG

rund

form

ausz

uwäh

len.

Die

Fle

xive

selb

stsi

ndhi

nsic

htlic

hih

rer

Fun

ktio

nm

ehrd

eutig

:Zei

chen

kette

-en,

anei

nen

verb

alen

Sta

mm

ange

häng

t,ka

nnIn

finiti

vfor

mod

erer

ste

oder

dritt

eP

erso

nP

lura

ldes

Prä

sens

mar

kier

en;P

robl

emz.

B.b

eim

Par

t-of

-spe

ech-

Tagg

ing,

wo

Unt

ersc

heid

ung

zwis

chen

infin

iter

und

finite

rV

erbf

orm

zutr

effe

nis

t.S

tatis

tisch

eV

erfa

hren

eign

ensi

chau

chhi

erzu

rA

usw

ahld

erko

ntex

tuel

lwah

rsch

einl

iche

ren

Mer

kmal

saus

präg

ung.

Mor

phol

ogie

fur

die

Com

pute

rlexi

kogr

aphi

e–

p.8

Page 9: die für ographie aph r xik Le Morphologie Computerle · Kasus, Numer us, T empus, P erson etc. Neben dem System der Fle xionsmor pheme, einem In v entar mit n ur w enigen Elementen,

EBERHARDKARLSUNIVERSITÄTTÜBINGENSeminarfurSprachwissenschaftD

eriv

atio

nsm

orph

olog

isc

heA

naly

seD

eriv

atio

nsm

orph

eme

bild

eneb

enfa

llsei

nere

lativ

stab

ile,ü

bers

chau

bare

Men

gevo

nE

lem

ente

n

größ

ter

Ant

eil:

Suf

fixe,

wen

ige

Prä

fixe

deut

sche

Der

ivat

ions

mor

phol

ogie

:kei

neIn

fixe

(wie

z.B

.das

türk

isch

eV

erne

inun

gsin

fix-m

inge

l-m-iy

orum

(auf

Deu

tsch

:“Ic

hko

mm

eni

cht.”

)

Zw

isch

enkl

asse

der

AF

FIX

OID

Eod

erK

ON

FIX

E:

Defi

nitio

nvo

nM

ülle

r(1

998:

214)

:Unt

erei

nem

Kon

fixw

irdei

nW

ortb

ildun

gsel

emen

tmit

lexi

kalis

ch-b

egrif

flich

erB

edeu

tung

vers

tand

en,d

asni

chtw

ortfä

hig

ist,

sond

ern

nur

inK

ombi

natio

nm

itan

dere

nM

orph

emen

auftr

eten

kann

;ent

wed

ernu

ral

sD

eriv

atio

nsba

sis

(fan

at-)

oder

nur

als

Ers

t-bz

w.Z

wei

tglie

din

Kom

posi

ta(b

io-,

-nau

t,-t

hek

)od

erso

woh

lals

Bas

isal

sau

chal

sK

ompo

sitio

nsgl

ied

(the

rm)

prod

uktiv

eK

onfix

ede

rle

tzte

nZ

eit,

z.B

.cyb

er-

und

pseu

do-,

sind

lexi

kalis

chre

leva

nt

auto

mat

isch

eE

rken

nung

von

Der

ivat

ions

mor

phem

enm

uss

mit

Am

bigu

itätu

mge

hen

könn

en:Z

eich

enke

tte-u

ngka

nnso

woh

lein

Suf

fixse

inal

sau

chTe

ilei

nes

Wor

tsta

mm

s(e

twa

inD

ung

und

Spr

ung

).Z

ude

mS

uffix

-bar

gibt

esei

nen

form

glei

chen

Sta

mm

,wie

z.B

.in

Coc

ktai

lbar

Mor

phol

ogie

fur

die

Com

pute

rlexi

kogr

aphi

e–

p.9

Page 10: die für ographie aph r xik Le Morphologie Computerle · Kasus, Numer us, T empus, P erson etc. Neben dem System der Fle xionsmor pheme, einem In v entar mit n ur w enigen Elementen,

EBERHARDKARLSUNIVERSITÄTTÜBINGENSeminarfurSprachwissenschaftK

ompo

sitio

nsm

orph

olog

isc

heA

naly

seD

erim

Deu

tsch

enpr

oduk

tivst

eP

roze

ssde

rK

OM

PO

SIT

ION

oper

iert

über

der

offe

nen

Kla

sse

der

Wor

tstä

mm

eun

dde

rko

mpl

exen

Wör

ter.

Kom

posi

takö

nnen

desh

alb

nich

tvol

lstä

ndig

imLe

xiko

ner

fass

twer

den,

aber

esis

tnüt

zlic

h,w

enn

nich

tim

Lexi

kon

verz

eich

nete

Kom

posi

tafo

rmal

inih

reB

esta

ndte

ileze

rlegt

wer

den,

die

dann

imLe

xiko

nau

fgef

unde

nw

erde

nkö

nnen

.M

öglic

heA

mbi

guitä

ten

beid

erZ

erle

gung

:

Rei

nfo

rmal

eA

mbi

guitä

ten

(seh

rse

lten)

,z.B

.

(3)

Sta

ub-e

cke-

nvs

.Sta

u-be

cken

Str

uktu

relle

Am

bigu

itäte

nbe

idre

i-un

dm

ehrg

liedr

igen

Kom

posi

ta:e

ine

Hof

mus

ikka

pelle

als

Mus

ikka

pelle

amH

ofe

eine

sA

delig

ense

inod

erei

neK

apel

le,d

ieH

ofm

usik

spie

lt.

Auf

gabe

:Wor

inbe

steh

tdie

Am

bigu

itätd

esW

orte

sW

acht

raum

?

auto

mat

isch

eA

naly

sede

rsy

ntak

tisch

enun

dse

man

tisch

enB

ezie

hung

ende

rB

esta

ndte

ileei

nes

Kom

posi

tum

ssc

hläg

tfeh

l:B

eisp

ielW

ortp

aar

Sch

wei

nesc

hnitz

el–

Jäge

rsch

nitz

el,f

orm

alan

alog

eF

orm

en,d

eren

Bes

tand

teile

aber

inve

rsch

iede

nen

inha

ltlic

hen

Bez

iehu

ngen

steh

en(S

chni

tzel

vom

Sch

wei

nbz

w.S

chni

tzel

nach

Jäge

rart

)

mor

phol

ogis

ches

Ana

lyse

syst

emG

ER

TW

OL:

http://www2.lingsoft.fi/cgi-bin/gertwol

Mor

phol

ogie

fur

die

Com

pute

rlexi

kogr

aphi

e–

p.10

Page 11: die für ographie aph r xik Le Morphologie Computerle · Kasus, Numer us, T empus, P erson etc. Neben dem System der Fle xionsmor pheme, einem In v entar mit n ur w enigen Elementen,

EBERHARDKARLSUNIVERSITÄTTÜBINGENSeminarfurSprachwissenschaftM

orph

olog

isc

heA

ngab

enin

Wör

terb

üche

rn

Übe

rsic

htüb

erve

rsch

iede

nem

orph

olog

isch

eB

esch

reib

unge

nin

Prin

twör

terb

üche

rnun

dm

asch

inen

lesb

aren

Wör

terb

üche

rnfü

rde

nm

ensc

hlic

hen

Ben

utze

rm

itz.

T.se

hrun

ters

chie

dlic

hen

Ver

fahr

ende

rD

arst

ellu

ng,j

ena

chP

häno

men

und

Zie

lgru

ppe

Ang

aben

zur

Fle

xion

Ang

aben

zur

Der

ivat

ion

Ang

aben

zur

Kom

posi

tion

Mor

phol

ogie

fur

die

Com

pute

rlexi

kogr

aphi

e–

p.11

Page 12: die für ographie aph r xik Le Morphologie Computerle · Kasus, Numer us, T empus, P erson etc. Neben dem System der Fle xionsmor pheme, einem In v entar mit n ur w enigen Elementen,

EBERHARDKARLSUNIVERSITÄTTÜBINGENSeminarfurSprachwissenschaftA

ngab

enzu

rF

lexi

on

Ang

abe

alle

rV

ollfo

rmen

eine

rle

xika

lisch

enE

inhe

itis

tehe

rse

lten

Prin

twör

terb

üche

rze

igen

aus

Pla

tzgr

ünde

nm

eist

nur

Lexe

me

mit

unre

gelm

äßig

enP

arad

igm

envo

llstä

ndig

an

elek

tron

isch

eW

örte

rbüc

her

erw

ägen

Ang

abe

alle

rV

ollfo

rmen

auch

beir

egel

mäß

igfle

ktie

rend

enle

xika

lisch

enE

inhe

iten

(Pla

tzar

gum

ente

ntfä

llt)

Abb

ildun

g1:

Art

ikel

zum

Stic

hwor

tthr

owau

sde

mC

ollin

sE

nglis

hD

ictio

nary

Mor

phol

ogie

fur

die

Com

pute

rlexi

kogr

aphi

e–

p.12

Page 13: die für ographie aph r xik Le Morphologie Computerle · Kasus, Numer us, T empus, P erson etc. Neben dem System der Fle xionsmor pheme, einem In v entar mit n ur w enigen Elementen,

EBERHARDKARLSUNIVERSITÄTTÜBINGENSeminarfurSprachwissenschaftA

ngab

enzu

rF

lexi

on,

For

ts.

deut

sche

eins

prac

hige

Lexi

kogr

aphi

e:es

gibt

häufi

gE

ckfo

rmen

beiS

ubst

antiv

en

mei

stve

rdic

htet

eA

ngab

evo

nG

eniti

vS

ingu

lar

und

Nom

inat

ivP

lura

l(S

gbA

und

Plb

A)

nebe

nde

rZ

itier

form

,dem

Nom

inat

ivS

ingu

lar:

geüb

ter

Ben

utze

rka

nnal

lean

dere

nF

orm

ener

schl

ieß

en.

Abb

ildun

g2:

Art

ikel

zum

Stic

hwor

tR

ahm

enau

sde

rel

ektr

onis

chen

Ver

sion

von

Wah

rigs

Deu

tsch

emW

örte

rbuc

hM

orph

olog

iefu

rdi

eC

ompu

terle

xiko

grap

hie

–p.

13

Page 14: die für ographie aph r xik Le Morphologie Computerle · Kasus, Numer us, T empus, P erson etc. Neben dem System der Fle xionsmor pheme, einem In v entar mit n ur w enigen Elementen,

EBERHARDKARLSUNIVERSITÄTTÜBINGENSeminarfurSprachwissenschaftA

ngab

enzu

rF

lexi

on,

For

ts.

Var

iant

e:A

ngab

evo

nE

ckfo

rmen

unre

gelm

äßig

erV

erbe

n,en

twed

erin

exte

rnen

Tabe

llen

(der

Um

text

e)od

erin

den

Art

ikel

nde

ren

tspr

eche

nden

Ver

ben

sow

ohli

nei

nspr

achi

gen

als

auch

inzw

eisp

rach

igen

Wör

terb

üche

rn

Ang

abe

des

Infin

itivs

,der

zwei

ten

oder

dritt

enP

erso

nS

ingu

lar

Prä

sens

,der

erst

enP

erso

nS

ingu

lar

Prä

terit

umun

dde

sP

artiz

ipP

erfe

kt(B

eisp

iel:

rate

n,rä

tst,

riet,

gera

ten)

.

Geb

rauc

hvo

nV

erw

eise

nfü

hren

entw

eder

aus

dem

Wör

terv

erze

ichn

ishe

raus

zuF

orm

enta

feln

inde

nU

mte

xten

des

Wör

terb

uchs

oder

aufe

inen

Ein

trag

imW

örte

rver

zeic

hnis

,in

dess

enF

orm

kom

men

tar

die

benö

tigte

nIn

form

atio

nen

gege

ben

wer

den.

Abb

.3ze

igtd

enE

intr

agR

ahm

enau

sde

rel

ektr

onis

chen

Ver

sion

des

Ber

tels

man

nR

echt

schr

eibw

örte

rbuc

hs.B

eiA

nklic

ken

eine

rsp

ezifi

sche

nZ

iffer

gela

ngtm

anzu

rF

orm

enta

fel,

die

das

kom

plet

teF

orm

enpa

radi

gma

anha

ndei

nes

kano

nisc

hen

Bei

spie

lein

trag

san

gibt

.

Unt

erst

ützu

ngde

sB

enut

zers

inP

rodu

ktio

nssi

tuat

ion

zur

Bild

ung

der

korr

ekte

nV

ollfo

rmen

spez

ifisc

her

lexi

kalis

cher

Zei

chen

(alle

Ver

fahr

en)

Mor

phol

ogie

fur

die

Com

pute

rlexi

kogr

aphi

e–

p.14

Page 15: die für ographie aph r xik Le Morphologie Computerle · Kasus, Numer us, T empus, P erson etc. Neben dem System der Fle xionsmor pheme, einem In v entar mit n ur w enigen Elementen,

EBERHARDKARLSUNIVERSITÄTTÜBINGENSeminarfurSprachwissenschaftA

ngab

enzu

rF

lexi

on,

For

ts.

Abb

ildun

g3:

Art

ikel

zum

Stic

hwor

tR

ahm

enau

sde

rel

ektr

onis

chen

Ver

sion

des

Ber

tels

man

nR

echt

schr

eibw

örte

rbuc

hsM

orph

olog

iefu

rdi

eC

ompu

terle

xiko

grap

hie

–p.

15

Page 16: die für ographie aph r xik Le Morphologie Computerle · Kasus, Numer us, T empus, P erson etc. Neben dem System der Fle xionsmor pheme, einem In v entar mit n ur w enigen Elementen,

EBERHARDKARLSUNIVERSITÄTTÜBINGENSeminarfurSprachwissenschaftA

ngab

enzu

rF

lexi

on,

For

ts.

expl

izite

sV

erw

eis-

Ver

fahr

envo

ral

lem

inzw

eisp

rach

igen

Wör

terb

üche

rnun

din

eins

prac

hige

nLe

rner

wör

terb

üche

rn:A

ufna

hme

unre

gelm

äßig

erV

ollfo

rmen

lexi

kalis

cher

Zei

chen

als

Ver

wei

sein

träg

ein

das

Wör

terv

erze

ichn

is

Ang

abe

enth

ältz

ugeh

örig

eG

rund

form

(Bas

isei

ntra

g)un

dm

anch

mal

zusä

tzlic

hm

orph

osyn

takt

isch

eM

erkm

ale

der

Vol

lform

Unt

erst

ützu

ngde

rB

enut

zer

beid

erLe

mm

atis

ieru

ngw

ähre

ndde

rR

ezep

tion

frem

dspr

achi

ger

Text

e

Bei

spie

l:V

erw

eise

intr

agcu

poau

sde

mK

lett

Wör

terb

uch

Spa

nisc

h-D

euts

ch

(4)

cupo

I.3.

pret

deca

ber

II...

.

schw

ierig

:Ang

abe

verm

utet

erE

insc

hrän

kung

enbe

ider

Bild

ung

der

Vol

lform

en,z

.B.

die

Ang

abe

eine

sni

chtv

orha

nden

enP

lura

ls(P

lbA

:o.P

l.)od

erzu

rE

insc

hrän

kung

der

Ste

iger

bark

eitv

onA

djek

tiven

.

Bei

deA

rten

von

Ang

aben

sind

nur

inde

rP

rodu

ktio

nssi

tuat

ion

von

Nut

zen

sollt

enau

fgrü

ndlic

her

Kor

pusa

naly

seba

sier

tsei

n(b

isla

ngis

tdas

beid

enei

nspr

achi

gen

Wör

terb

üche

rnde

sD

euts

chen

nich

tder

Fall)

Mor

phol

ogie

fur

die

Com

pute

rlexi

kogr

aphi

e–

p.16

Page 17: die für ographie aph r xik Le Morphologie Computerle · Kasus, Numer us, T empus, P erson etc. Neben dem System der Fle xionsmor pheme, einem In v entar mit n ur w enigen Elementen,

EBERHARDKARLSUNIVERSITÄTTÜBINGENSeminarfurSprachwissenschaftA

ngab

enzu

rD

eriv

atio

nW

ortb

ildun

gsel

emen

tew

ieA

FF

IXE

,A

FF

IXO

IDE

und

KO

NF

IXE

sollt

enle

xika

lisch

besc

hrie

ben

wer

den,

ggf.

als

eige

neE

intr

äge

oder

sons

tals

List

ein

den

Um

text

en.M

ülle

rs(1

989)

Vor

schl

ag:

ausr

eich

ende

sem

antis

che

Ein

ordn

ung,

diffe

renz

iert

nach

Geb

rauc

hsw

eise

n,

Cha

rakt

eris

ieru

ngde

rB

asis

wör

ter

nach

Wor

tart

sow

iegg

f.in

gram

mat

isch

erun

dse

man

tisch

erH

insi

cht,

Ver

ände

rung

enbe

ider

Wor

tbild

ung

(Um

laut

ung,

Fug

enm

orph

eme

etc.

),

Res

trik

tione

nbe

ider

Aus

wah

lder

Wor

tbas

is,

Hin

wei

seau

fSyn

onym

eun

dA

nton

yme.

Bei

spie

lein

trag

zum

Wor

tbild

ungs

elem

ent-

able

,-ib

leau

sde

mO

xfor

dA

dvan

ced

Lear

ner’s

Dic

tiona

ryof

Cur

rent

Eng

lish,

der

scho

nei

nige

der

Mül

lers

chen

Anf

orde

rung

enbe

dien

t:

-ab

le,

-ible

[...]

suff

1(w

ithns

form

ing

adjs

)ha

ving

orsh

o-w

ing

the

qual

ityof

fash

iona

ble

com

fort

able

;2(w

ithvs

for-

min

gad

js)

(a)

that

may

orm

ust

be:

eata

ble

paya

ble

re-

vers

ible

.(b)

tend

ing

to:c

hang

eabl

e

peris

habl

e. Mor

phol

ogie

fur

die

Com

pute

rlexi

kogr

aphi

e–

p.17

Page 18: die für ographie aph r xik Le Morphologie Computerle · Kasus, Numer us, T empus, P erson etc. Neben dem System der Fle xionsmor pheme, einem In v entar mit n ur w enigen Elementen,

EBERHARDKARLSUNIVERSITÄTTÜBINGENSeminarfurSprachwissenschaftA

ngab

enzu

rD

eriv

atio

n,F

orts

.A

ltern

ativ

erA

nsat

zin

Kem

pcke

sW

örte

rbuc

hD

euts

chal

sFr

emds

prac

he,e

inem

Lern

erw

örte

rbuc

hm

itnu

rca

.20

000

Ein

träg

en:

zuel

emen

tare

nle

xika

lisch

enE

inhe

iten

wer

den

Der

ivat

ione

nun

dK

ompo

sita

ange

gebe

n(W

ortfa

mili

e)

syst

emat

isch

eU

nter

stüt

zung

des

Lern

ers

beid

erE

rwei

teru

ngse

ines

frem

dspr

achl

iche

nW

orts

chat

zes

Art

ikel

zum

Stic

hwor

tmeh

r

� meh

r[..

.]<

Inde

finitp

ron.

:für

Mas

k.,F

em.,

Neu

tr.un

dP

l.;K

omp.

zu

�� vi

el;

� auch

meh

-re

re>

;

� TAF

EL

X/d

rück

tau

s,da

ssei

neA

nzah

l,ei

neM

enge

über

ein

best

imm

tes

Maß

hina

usge

ht/:

<ad

j.>er

hat

(vie

l)

� Gel

d,B

üche

ral

sw

ir;

erw

illno

ch

� Büc

her

kauf

en;

esw

aren

� Leut

eda

,als

dude

nkst

;<su

bst.>

erha

t

� verla

ngt,

als

sie

leis

ten

konn

te;s

ieha

t

� von

ihm

erw

arte

t;da

rfes

etw

asse

in?

�� m

ehr,

Meh

r,m

ehre

n,m

ehre

rlei,

meh

rfac

h,M

ehrh

eit

verm

ehre

n–

meh

rdeu

tig,

Stim

men

meh

rhei

t,vi

elm

ehr;

vgl.

meh

r/M

ehr-

;vgl

.vi

el

Nur

die

rege

lmäß

ige

Ana

lyse

von

sign

ifika

nten

Kor

pora

kann

eine

zuve

rläss

ige

Gru

ndla

gefü

rdi

eB

esch

reib

ung

von

Wor

tbild

ungs

elem

ente

nbi

lden

,z.B

.neu

eW

ortb

ildun

gsel

emen

teau

ffind

enun

ddi

eP

rodu

ktiv

itäte

xist

iere

nder

Wor

tbild

ungs

elem

ente

eins

chät

zen.

Mor

phol

ogie

fur

die

Com

pute

rlexi

kogr

aphi

e–

p.18

Page 19: die für ographie aph r xik Le Morphologie Computerle · Kasus, Numer us, T empus, P erson etc. Neben dem System der Fle xionsmor pheme, einem In v entar mit n ur w enigen Elementen,

EBERHARDKARLSUNIVERSITÄTTÜBINGENSeminarfurSprachwissenschaftA

ngab

enzu

rK

ompo

sitio

nS

elek

tive

Auf

nahm

evo

nK

ompo

sita

inei

nW

örte

rbuc

h;m

itei

ner

Prä

fere

nzfü

rop

ake

(aus

den

Bes

tand

teile

nni

chtr

egel

haft

sem

antis

cher

schl

ieß

bare

)ge

genü

ber

tran

spar

ente

nK

ompo

sita

.

Lang

ensc

heid

tsLe

rner

wör

terb

uch

und

das

sech

sbän

dige

WdG

gebe

ntr

ansp

aren

teK

ompo

sita

an(s

.Bei

spie

lein

trag

Lehr

erau

sde

mLa

ngen

sche

idtG

roß

wör

terb

uch

Deu

tsch

als

Frem

dspr

ache

)

tran

spar

ente

Kom

posi

tasi

ndal

sS

uble

mm

ata

ohne

eige

nen

sem

antis

chen

Kom

men

tar

amS

chlu

ssde

sA

rtik

els

eine

sde

rbe

teili

gten

Wor

tstä

mm

eau

fgef

ührt

poly

sem

eLe

xem

een

thal

ten

Kom

posi

taal

sS

uble

mm

ata

amS

chlu

ssde

sje

wei

ligen

sem

antis

chen

Sub

kom

men

tars

Ang

abe

der

Ste

llung

des

Sta

mm

esin

nerh

alb

des

Kom

posi

tum

sal

sE

rst-

oder

Zw

eitg

lied

L

� h

� rer

der;

-s,

-;j-d

,de

rbe

san

e-r

Sch

ule

Unt

erric

htgi

bt

Sch

üler

ein

stre

nger

,er

-fa

hren

erL.

� :Er

istL

.für

Mat

hem

atik

u.P

hysi

kan

e-m

Gym

nasi

um;W

enha

btih

ral

sL.

inS

port

?

� K-:

Lehr

er-,

-aus

bild

ung,

-ber

uf,

-ehe

paar

,-ko

llegi

um,

-kon

fere

nz,

-man

gel

,-s

chw

emm

e,

-zim

mer

,-ü

bers

chu

ß

-K:

Ber

ufss

chu

l-,G

rund

schu

l-,H

aupt

schu

l-,

Son

ders

chu

l-;B

iolo

gie-

,C

hem

ie-,

Deu

tsc

h-,

Eng

lisc

h-,

Fra

nzös

isc

h-,

Late

in-,

Mat

hem

tik-,

Phy

sik-

,S

port

-

� hier

zuL

� h

� re

� rin

die

;-,-

nen

Mor

phol

ogie

fur

die

Com

pute

rlexi

kogr

aphi

e–

p.19

Page 20: die für ographie aph r xik Le Morphologie Computerle · Kasus, Numer us, T empus, P erson etc. Neben dem System der Fle xionsmor pheme, einem In v entar mit n ur w enigen Elementen,

EBERHARDKARLSUNIVERSITÄTTÜBINGENSeminarfurSprachwissenschaftS

yste

me

für

die

mor

phol

ogis

che

Ana

lyse

:G

ER

TW

OL

GE

RT

WO

L(‚G

erm

anTw

oLe

velM

orph

olog

y‘)

wur

dein

Fin

nlan

den

twic

kelt

und

wird

von

der

Fir

ma

Ling

soft

vert

riebe

n.D

ieE

ntw

ickl

erch

arak

teris

iere

nG

ER

TW

OL

so:

GE

RT

WO

Lis

tein

Sys

tem

zur

auto

mat

isch

enW

ortfo

rmer

kenn

ung

deut

sche

rW

örte

r.D

ieth

eore

tisch

eG

rund

lage

des

GE

RT

WO

L-S

yste

ms

bild

etdi

esp

rach

unab

häng

ige

mor

phol

ogis

che

Ana

lyse

met

hode

ZW

EI-

EB

EN

EN

-MO

DE

LL

[...]

von

Pro

fess

orK

imm

oK

oske

nnie

mi[

...]G

ER

TW

OL

verf

ügtü

ber

ein

Wor

tform

enle

xiko

nvo

net

wa

6000

0W

ortfo

rmen

,der

enG

eltu

ngsb

erei

chdu

rch

eine

umfa

ssen

deD

eriv

atio

nsm

orph

olog

ieun

dei

nen

volls

tänd

igen

Mec

hani

smus

zur

Kom

posi

tabi

ldun

ger

hebl

ich

erw

eite

rtw

ird[..

.]B

eide

rm

orph

olog

isch

enA

naly

segi

btG

ER

TW

OL

die

mög

liche

nLe

sung

enei

ner

deut

sche

nW

ortfo

rman

.D

ieLe

sung

enbe

steh

enau

sde

rG

rund

form

des

Wor

tes

und

aus

mor

phol

ogis

chen

Dat

enzu

rG

rund

form

.(H

aapa

lain

en:1

995,

http://www2.lingsoft.fi/cgi-bin/gertwol

)

GE

RT

WO

Len

thäl

tReg

elap

para

tfür

die

mor

phol

ogis

che

Ana

lyse

und

eine

umfa

ngre

iche

lexi

kalis

che

Res

sour

ce.

spra

chun

abhä

ngig

eB

asis

der

Reg

elko

mpo

nent

e:Z

wei

-Ebe

nen-

Mor

phol

ogie

(vgl

.K

oske

nnie

mi:1

983)

Fok

usau

fdie

verw

ende

tele

xika

lisch

eR

esso

urce

Kod

ieru

ngm

orph

olog

isch

erIn

form

atio

nin

GE

RT

WO

Lim

Ver

glei

chzu

den

Kod

ieru

ngsg

epflo

genh

eite

nin

Prin

twör

terb

üche

rnM

orph

olog

iefu

rdi

eC

ompu

terle

xiko

grap

hie

–p.

20

Page 21: die für ographie aph r xik Le Morphologie Computerle · Kasus, Numer us, T empus, P erson etc. Neben dem System der Fle xionsmor pheme, einem In v entar mit n ur w enigen Elementen,

EBERHARDKARLSUNIVERSITÄTTÜBINGENSeminarfurSprachwissenschaftE

igen

scha

ften

von

GE

RT

WO

L

volls

tänd

ige

flexi

onsm

orph

olog

isch

eun

dei

neum

fass

ende

deriv

atio

ns-

und

kom

posi

tions

mor

phol

ogis

che

Ana

lyse

,abe

rke

ine

sem

antis

chen

oder

synt

aktis

chen

Ana

lyse

n;

lexi

kalis

che

Dat

enba

sier

enau

fdem

lexi

kalis

chen

Mat

eria

lein

esde

utsc

h-en

glis

chen

Wör

terb

uchs

von

Har

perC

ollin

s,m

itko

rpus

basi

erte

rE

rwei

teru

ngun

dH

inzu

nahm

evo

nE

igen

nam

en.D

asW

ortfo

rmen

lexi

kon

umfa

ssti

nsge

sam

tetw

a85

000

Ein

träg

e;

lexi

kalis

che

Res

sour

cevo

nG

ER

TW

OL

umfa

sste

inS

tam

mfo

rmen

lexi

kon

und

ein

Vol

lform

enle

xiko

nso

wie

wei

tere

Teill

exik

a(s

.u.)

;

Ein

Sta

mm

form

-Ein

trag

best

ehta

usde

rS

tam

mfo

rmde

sje

wei

ligen

Wor

tes

sow

iede

mpa

ssen

den

Fle

xion

skla

ssen

kürz

el,d

asdi

eso

gena

nnte

nF

orts

etzu

ngsk

lass

en(E

ndun

gspa

radi

gmen

)sp

ezifi

zier

t;

Ein

Vol

lform

-Ein

trag

best

ehta

usei

ner

Wor

tform

und

ihre

nm

orph

osyn

takt

isch

enM

erkm

alen

.

Die

inG

ER

TW

OL

kodi

erte

nF

lexi

onsk

lass

enfa

ssen

(Gru

ppen

von)

Sta

mm

form

enso

wie

For

tset

zung

skla

ssen

zusa

mm

en.A

ußer

dem

wer

den

mor

phop

hone

mis

che

Phä

nom

ene

wie

der

schw

a-A

usfa

llbe

rück

sich

tigt;

Ver

ben

wer

den

hins

icht

lich

des

Mod

us,T

empu

s,de

rP

erso

nun

dde

sN

umer

usge

kenn

zeic

hnet

;zw

ölfK

onju

gatio

nskl

asse

nfü

rsc

hwac

hko

njug

iere

nde

Ver

ben;

die

star

ken

Ver

ben

sind

inzw

ölfH

aupt

konj

ugat

ions

klas

sen

eing

etei

lt;

Mor

phol

ogie

fur

die

Com

pute

rlexi

kogr

aphi

e–

p.21

Page 22: die für ographie aph r xik Le Morphologie Computerle · Kasus, Numer us, T empus, P erson etc. Neben dem System der Fle xionsmor pheme, einem In v entar mit n ur w enigen Elementen,

EBERHARDKARLSUNIVERSITÄTTÜBINGENSeminarfurSprachwissenschaftE

igen

scha

ften

von

GE

RT

WO

L,F

orts

.

Sub

stan

tive

wer

den

hins

icht

lich

Gen

us,N

umer

usun

dK

asus

geke

nnze

ichn

et.

Sub

stan

tive

sind

inze

hnH

aupt

dekl

inat

ions

klas

sen

eing

etei

lt;ei

new

eite

reU

nter

glie

deru

ngfü

hrtz

uca

.300

Dek

linat

ions

klas

sen.

Jede

Dek

linat

ions

klas

sebe

steh

tau

sei

ner

For

tset

zung

skla

sse

mit

Sin

gula

rfor

men

und

eine

rm

itP

lura

lform

en.

Des

wei

tere

nw

erde

npr

oduk

tive

Abl

eitu

ngse

lem

ente

(=D

eriv

atio

nssu

ffixe

)m

orph

osyn

takt

isch

mar

kier

t.

Adj

ektiv

ew

erde

ndu

rch

die

Mer

kmal

eK

ompa

rier

bark

eit,

Num

erus

,Kas

usun

dG

enus

char

akte

risie

rt:r

egel

mäß

ige

Adj

ektiv

ew

erde

nin

sieb

zehn

Dek

linat

ions

klas

sen

eing

etei

lt.E

benf

alls

mor

phos

ynta

ktis

che

Mar

kier

ung

prod

uktiv

erA

blei

tung

sele

men

te(=

Der

ivat

ions

suffi

xe);

Neb

enH

aupt

wor

tkla

ssen

wer

den

eini

geP

rono

min

a,di

eA

rtik

el,N

umer

alia

und

Eig

enna

men

mor

phol

ogis

chko

dier

t;

erfa

sstd

asS

yste

mde

rP

räfig

ieru

ngde

rV

erbe

n,un

ters

chei

deta

btre

nnba

reun

dni

cht-

abtr

ennb

are

Prä

fixe;

besc

hrei

bteb

enfa

llsP

räfix

evo

nS

ubst

antiv

enun

dA

djek

tiven

;

Bei

Suf

figie

rung

wird

unte

rsch

iede

nzw

isch

en:a

)D

eriv

atio

n1.

Gra

des

als

der

Suf

figie

rung

anei

nen

Wor

tsta

mm

und

b)sy

ntag

mat

isch

erD

eriv

atio

nal

sA

nfüg

enei

nes

Suf

fixes

anei

nan

dere

sS

uffix

;ent

hält

ca.8

0W

ortb

ildun

gsm

uste

rdi

eses

Typs

;

Mor

phol

ogie

fur

die

Com

pute

rlexi

kogr

aphi

e–

p.22

Page 23: die für ographie aph r xik Le Morphologie Computerle · Kasus, Numer us, T empus, P erson etc. Neben dem System der Fle xionsmor pheme, einem In v entar mit n ur w enigen Elementen,

EBERHARDKARLSUNIVERSITÄTTÜBINGENSeminarfurSprachwissenschaftE

igen

scha

ften

von

GE

RT

WO

L,F

orts

.

Mar

kier

ung

des

nich

t-m

arki

erte

berg

angs

eine

rle

xika

lisch

enE

inhe

itvo

nei

ner

Wor

tkla

sse

indi

ean

dere

(Kon

vers

ion)

.Unt

erdi

eses

Sch

ema

wer

den

auch

subs

tant

ivis

che

Zus

amm

enrü

ckun

gen

(z.B

.Ste

lldic

hein

)su

bsum

iert

;

Kom

posi

tions

mor

phol

ogie

:Beh

andl

ung

der

Fug

enm

orph

eme;

Ann

ahm

e,da

ssdi

eF

ugen

elem

ente

dekl

inat

ions

klas

sens

pezi

fisch

sind

;

Sub

stan

tivis

che

Zw

eitg

liede

rvo

nK

ompo

sita

,die

nich

tals

selb

stän

dige

Wör

ter

vork

omm

en,w

urde

nin

ein

Teill

exik

onau

fgen

omm

en;e

benf

alls

Teill

exik

onfü

rH

albs

uffix

eun

dni

cht-

selb

stän

dige

adje

ktiv

isch

eZ

wei

tglie

der;

Suf

fixe

wer

den

inhe

imis

che

(nat

ive)

und

frem

deS

uffix

ege

tren

nt.V

ondi

eser

gesc

hlos

sene

nK

lass

ede

rS

uffix

ew

erde

ndi

ehi

eral

sH

AL

BS

UF

FIX

Ebe

zeic

hnet

enA

ffixo

ide

und

Kon

fixe

getr

ennt

und

inei

nem

ande

ren

Teill

exik

onbe

schr

iebe

n.

Mor

phol

ogie

fur

die

Com

pute

rlexi

kogr

aphi

e–

p.23

Page 24: die für ographie aph r xik Le Morphologie Computerle · Kasus, Numer us, T empus, P erson etc. Neben dem System der Fle xionsmor pheme, einem In v entar mit n ur w enigen Elementen,

EBERHARDKARLSUNIVERSITÄTTÜBINGENSeminarfurSprachwissenschaftA

bbild

ung

enG

ER

TW

OL

Abb

ildun

g4:

Info

rmat

ione

nzu

mS

tichw

ortA

rbei

terv

erei

nigu

ng

Abb

ildun

g5:

Info

rmat

ione

nzu

mS

tichw

orta

bzus

inge

nM

orph

olog

iefu

rdi

eC

ompu

terle

xiko

grap

hie

–p.

24

Page 25: die für ographie aph r xik Le Morphologie Computerle · Kasus, Numer us, T empus, P erson etc. Neben dem System der Fle xionsmor pheme, einem In v entar mit n ur w enigen Elementen,

EBERHARDKARLSUNIVERSITÄTTÜBINGENSeminarfurSprachwissenschaftW

ordM

ana

ger

und

Can

ooK

ompo

nent

ende

sS

yste

ms

Wor

dMan

ager

(Fa.

Can

oo,B

asel

):

Lem

mat

isie

rer,

der

Vol

lform

enau

fdie

Bas

isfo

rm(e

n)re

duzi

ert;

Fle

xion

sana

lyse

zur

Bes

timm

ung

der

Fle

xion

sele

men

teei

nes

Wor

tes;

Wor

tana

lyse

:Woh

lgef

orm

thei

ts-C

heck

;Bes

timm

ung

der

Wor

tele

men

te;

Wor

tform

enge

nera

tor

zur

Erz

eugu

ngal

ler

Vol

lform

enzu

eine

rB

asis

form

.

zugr

unde

liege

ndes

Wör

terb

uch

mit

ca.2

5000

0B

asis

form

en,z

um

ehr

als

3M

ill.

Vol

lform

enex

pand

ierb

ar;

Ana

lyse

unbe

kann

ter

Wör

ter

(nic

htfe

hler

frei

);

zugr

unde

liege

nde

Tech

nolo

gie:

Fin

iteS

tate

Tran

sduc

er

Abb

ildun

g6:

Fin

iteS

tate

Tran

suce

r

Mor

phol

ogie

fur

die

Com

pute

rlexi

kogr

aphi

e–

p.25

Page 26: die für ographie aph r xik Le Morphologie Computerle · Kasus, Numer us, T empus, P erson etc. Neben dem System der Fle xionsmor pheme, einem In v entar mit n ur w enigen Elementen,

EBERHARDKARLSUNIVERSITÄTTÜBINGENSeminarfurSprachwissenschaftW

ordM

ana

ger

,For

ts.

Info

rmat

ions

syst

emau

fder

Web

seite

von

Can

oo:S

.www.canoo.net/

mit

Wor

tabf

rage

und

Link

szu

wic

htig

enB

erei

chen

(Wör

terb

üche

r,R

echt

schr

eibu

ng,F

lexi

on,W

ortb

ildun

g,In

dex

und

Term

inol

ogie

)lä

dtzu

mE

xper

imen

tiere

nei

n.

mor

phol

ogis

che

Ana

lyse

von

Wör

tern

wird

gest

ützt

von

eine

rR

eihe

von

Spe

zial

wör

terb

üche

rn;

eige

neS

pezi

alw

örte

rbüc

her

für

Rec

htsc

hrei

bung

,Fle

xion

,Wor

tbild

ung

und

Mor

phol

ogie

;Ver

linku

ngm

itex

tern

enR

esso

urce

nLE

O(D

euts

ch-E

nglis

ches

Übe

rset

zung

swör

terb

uch)

und

der

deut

sche

nW

ikip

edia

(alle

rdin

gsnu

rfü

rim

Can

oo-W

Bvo

rhan

dene

Stic

hwör

ter)

;

Spe

zial

-Wör

terb

üche

rba

sier

enau

fdem

Mor

phol

ogis

chen

Wör

terb

uch

von

Can

oo:

enth

ältm

ehr

als

200

000

Ein

träg

eun

dun

dge

neri

ertm

ehr

als

2M

ill.W

örte

r(W

ortfo

rmen

);

zuje

dem

Ein

trag

enth

ältd

asm

orph

olog

isch

eW

Bal

lege

neri

erte

nW

ortfo

rmen

(auc

hm

ehrg

liedr

ige

lexi

kalis

che

Ein

heite

n),s

owie

ihre

mor

phos

ynta

tkis

chen

und

schr

eibu

ngsr

elev

ante

nC

hara

kter

istik

a;di

eau

sde

mE

intr

agge

neri

erte

nE

intr

äge,

der

oder

die

Ein

träg

e,au

sde

mde

rE

intr

agge

neri

ertw

urde

,die

jew

eilig

eF

lexi

onsr

egel

n,so

wie

die

mit

dem

Ein

trag

asso

ziie

rten

Rec

htsc

hrei

breg

eln;

Mor

phol

ogie

fur

die

Com

pute

rlexi

kogr

aphi

e–

p.26

Page 27: die für ographie aph r xik Le Morphologie Computerle · Kasus, Numer us, T empus, P erson etc. Neben dem System der Fle xionsmor pheme, einem In v entar mit n ur w enigen Elementen,

EBERHARDKARLSUNIVERSITÄTTÜBINGENSeminarfurSprachwissenschaftW

ordM

ana

ger

,For

ts.

Rec

htsc

hrei

bwör

terb

uch:

meh

ral

s25

000

0de

utsc

heS

chla

gwör

ter

und

Red

ewen

dung

en:

alte

und

neue

Sch

reib

ung

(mit

Dar

stel

lung

des

Ver

hältn

isse

sde

rbe

iden

Var

iant

enzu

eina

nder

:Ers

etzu

ngod

erA

ltern

ativ

e)so

wie

Link

szu

den

Reg

eln

der

neue

nR

echt

schr

eibu

ng;

Ang

aben

zure

gion

alen

Var

iant

enun

dS

chw

eize

rS

chre

ibun

gsva

riant

enso

wie

Ang

aben

zum

Geb

rauc

h;

beiV

erbe

nda

sfü

rdi

eB

ildun

gde

rzu

sam

men

gese

tzte

nZ

eitfo

rmen

verw

ende

teH

ilfsv

erb

und

beiS

ubst

antiv

enda

sG

enus

;

Fle

xion

swör

terb

uch:

volls

tänd

ige

Fle

xion

stab

elle

nfü

r20

000

0de

utsc

heS

tichw

örte

rm

itca

.2M

ill.W

ortfo

rmen

und

Wor

tkat

egor

isie

rung

enso

wie

Link

szu

den

Fle

xion

sreg

eln:

Dek

linat

ions

tabe

llen

für

Sub

stan

tive

berü

cksi

chtig

thom

ogra

phe

Ein

träg

ew

ieM

ange

lod

erS

ervi

ce),

sow

ieU

mla

utun

gim

Plu

ralu

nter

dem

Etik

ett

Bes

onde

rhei

ten

;

Var

iant

envo

nF

lekt

ions

form

en(z

.B.i

ndig

enes

und

eing

edeu

tsch

tes

Par

adig

ma)

sind

ange

führ

t,z.

B.b

eiIn

dex,

Atla

s,K

onto

.

Wör

terb

uch

der

deut

sche

nW

ortb

ildun

g:W

ortb

ildun

gszu

sam

men

hän

gefü

rüb

er20

000

0de

utsc

heS

tichw

örte

r,m

itLi

nks

zude

nen

tspr

eche

nden

Wor

tbild

ungs

rege

ln:

mor

phol

ogis

che

Wor

tana

lyse

nin

For

mvo

nA

blei

tung

sgra

phen

;wei

tere

Der

ivat

ione

nun

dK

ompo

sita

aufG

rund

lage

des

Suc

hwor

tes;

Nen

nung

orth

ogra

phis

cher

Ver

ände

rung

enM

orph

olog

iefu

rdi

eC

ompu

terle

xiko

grap

hie

–p.

27

Page 28: die für ographie aph r xik Le Morphologie Computerle · Kasus, Numer us, T empus, P erson etc. Neben dem System der Fle xionsmor pheme, einem In v entar mit n ur w enigen Elementen,

EBERHARDKARLSUNIVERSITÄTTÜBINGENSeminarfurSprachwissenschaftW

ordM

ana

ger

,For

ts.

Wör

terb

uch

der

Mor

phol

ogie

:mor

phos

ynta

ktis

che

Kla

ssifi

zier

unge

nde

rru

nd2

Mill

.W

ortfo

rmen

der

200

000

deut

sche

nS

tichw

örte

r.S

owoh

lWor

tform

enal

sau

chW

ortb

ildun

gen

könn

enin

tera

ktiv

anal

ysie

rtun

dge

neri

ertw

erde

n;

zuV

ollfo

rmen

wer

den

die

Lexe

me

(rep

räse

ntie

rtdu

rch

Gru

ndfo

rm)

mit

den

mor

phos

ynta

ktis

chen

Mer

kmal

enan

geze

igts

owie

die

Pos

ition

en,d

ieV

ollfo

rmen

inde

nP

arad

igm

endi

eser

Lexe

me

anne

hmen

;übe

rsic

htlic

heG

esta

ltung

der

Tabe

llen;

zusä

tzlic

hau

fWeb

site

:Rec

htsc

hrei

bprü

fer,

inde

nm

anTe

xtei

ngeb

enun

dau

fkor

rekt

eS

chre

ibun

gpr

üfen

lass

enka

nn;A

nzei

gede

rW

örte

r,de

ren

Sch

reib

ung

durc

hdi

eO

rtho

grap

hier

efor

mbe

rühr

twer

den;

Anz

eige

der

nich

tabg

edec

kten

Wör

ter;

Übe

rprü

fung

auch

nach

Ort

hogr

aphi

estil

(ZE

ITvs

.N

ZZ);

Fazi

t:S

yste

mha

tein

ebe

eind

ruck

ende

Abd

ecku

ng,b

eson

ders

inde

rK

ombi

natio

nei

nes

groß

enW

örte

rbuc

hsm

itei

ner

Ana

lyse

kom

pone

nte

für

unbe

kann

teW

örte

r

Abb

ildun

g7:

Wor

tbild

ungs

anal

yse

von

Gru

ndve

rsor

gung

Mor

phol

ogie

fur

die

Com

pute

rlexi

kogr

aphi

e–

p.28

Page 29: die für ographie aph r xik Le Morphologie Computerle · Kasus, Numer us, T empus, P erson etc. Neben dem System der Fle xionsmor pheme, einem In v entar mit n ur w enigen Elementen,

EBERHARDKARLSUNIVERSITÄTTÜBINGENSeminarfurSprachwissenschaftA

bbild

ung

enC

anoo

Abb

ildun

g8:

Fle

xion

sana

lyse

von

vors

inge

n

Mor

phol

ogie

fur

die

Com

pute

rlexi

kogr

aphi

e–

p.29

Page 30: die für ographie aph r xik Le Morphologie Computerle · Kasus, Numer us, T empus, P erson etc. Neben dem System der Fle xionsmor pheme, einem In v entar mit n ur w enigen Elementen,

EBERHARDKARLSUNIVERSITÄTTÜBINGENSeminarfurSprachwissenschaftA

bbild

ung

enC

anoo

Abb

ildun

g9:

Info

rmat

ione

nzu

mS

tichw

ortA

ufsc

hluß

Mor

phol

ogie

fur

die

Com

pute

rlexi

kogr

aphi

e–

p.30

Page 31: die für ographie aph r xik Le Morphologie Computerle · Kasus, Numer us, T empus, P erson etc. Neben dem System der Fle xionsmor pheme, einem In v entar mit n ur w enigen Elementen,

EBERHARDKARLSUNIVERSITÄTTÜBINGENSeminarfurSprachwissenschaftA

bbild

ung

enC

anoo

Abb

ildun

g10

:Kom

posi

tafe

ldzu

mW

ortb

ildun

gsel

emen

tVer

sorg

ung

Mor

phol

ogie

fur

die

Com

pute

rlexi

kogr

aphi

e–

p.31

Page 32: die für ographie aph r xik Le Morphologie Computerle · Kasus, Numer us, T empus, P erson etc. Neben dem System der Fle xionsmor pheme, einem In v entar mit n ur w enigen Elementen,

EBERHARDKARLSUNIVERSITÄTTÜBINGENSeminarfurSprachwissenschaftV

ergl

eic

hG

ER

TW

OL

-W

ordM

ana

ger

Bei

deS

yste

me

beru

hen

aufF

inite

Sta

teTr

ansd

ucer

Tech

nolo

gie.

Ein

Ana

lyse

vers

uch

mit

den

Ein

gabe

wör

tern

Zei

tung

sang

ebot

und

dazw

isch

ensa

ng,d

iebe

ide

nich

tin

den

Sys

tem

wör

terb

üche

rnvo

rhan

den,

aber

rela

tivei

nfac

hzu

anal

ysie

ren

sind

,zei

gtve

rgle

ichb

are

Res

ulta

te:

Wäh

rend

man

beiG

ER

TW

OL

eine

äuß

erst

knap

pfo

rmul

iert

eA

naly

seer

hält,

beko

mm

tm

anbe

iCA

NO

Oei

new

enig

erau

ssag

ekrä

ftige

,gra

phis

chab

eran

spre

chen

der

gest

alte

teB

esch

reib

ung;

wei

tere

Info

rmat

ione

nsi

nddu

rch

Ank

licke

nde

rA

naly

seel

emen

teab

rufb

ar;

GE

RT

WO

L:G

roß

schr

eibu

ngde

sW

orte

sw

eist

aufe

inN

omen

-Vor

kom

men

hin.

Bei

Can

oosp

ielt

Sch

reib

ung

amW

orta

nfan

gke

ine

Rol

le.C

anoo

gene

rier

tz.B

.für

dazw

isch

ensa

ngei

new

eite

reA

naly

sem

itsa

ngal

sno

min

alem

Kop

f(hi

erni

cht

zutr

effe

nd);

Bei

deS

yste

me

vers

agen

,wen

nw

eder

das

gesa

mte

Wor

tnoc

hdi

eB

esta

ndte

ilele

xika

lisch

verz

eich

nets

ind:

Ana

lyse

beis

piel

Cyb

erw

ar(E

nde

Feb

ruar

2007

verz

eich

nete

Goo

gle

für

dies

esW

ortc

a.62

000

Tref

fer

aufd

euts

chen

Web

seite

n)w

irdvo

nke

inem

der

beid

enS

yste

me

anal

ysie

rt.

Mor

phol

ogie

fur

die

Com

pute

rlexi

kogr

aphi

e–

p.32

Page 33: die für ographie aph r xik Le Morphologie Computerle · Kasus, Numer us, T empus, P erson etc. Neben dem System der Fle xionsmor pheme, einem In v entar mit n ur w enigen Elementen,

EBERHARDKARLSUNIVERSITÄTTÜBINGENSeminarfurSprachwissenschaftM

orph

olog

isc

heA

naly

seun

dP

räse

ntat

ion

imV

ergl

eic

h

Fle

xion P

rintw

örte

rbüc

her,

GE

RT

WO

L:E

ndun

gspa

radi

gmen

wer

den

kodi

ert(

GE

RT

WO

Lin

expl

izite

rer

Wei

se);

Can

ooun

dM

orph

y:P

arad

igm

enw

erde

nko

mpl

ettk

odie

rt;

Prin

twör

terb

üche

r:A

ngab

evo

nE

ckfo

rmen

für

Sub

stan

tivle

mm

ata;

Ber

ücks

icht

igun

gm

orph

opho

nem

isch

erP

häno

men

ein

GE

RT

WO

L:gr

oße

Zah

lvo

nF

lexi

onsk

lass

enin

sb.b

eiS

ubst

antiv

en;U

mla

utun

gdu

rch

eine

Reg

el;

inP

rintw

örte

rbüc

hern

wird

Um

laut

ung

anje

dem

einz

elne

nE

intr

agm

arki

ert;

kom

plet

teA

uflis

tung

unre

gelm

äßig

erF

orm

enin

GE

RT

WO

L,C

anoo

etc.

als

Wor

tform

en;

expl

izite

Nen

nung

auch

inde

nm

eist

enP

rintw

örte

rbüc

hern

.

Der

ivat

ion

GE

RT

WO

L:ex

pliz

iteLi

stun

gun

dm

orph

osyn

takt

isch

eK

lass

ifika

tion

der

Affi

xeun

dA

ffixo

ide;

Prin

twör

terb

üche

rha

ben

selte

nS

yste

mat

ikun

dK

onsi

sten

zvo

nG

ER

TW

OL

GE

RT

WO

Lha

tkei

nesy

ntak

tisch

enA

ngab

enun

dda

mit

auch

kein

eS

ubka

tego

risi

erun

gsan

gabe

nvo

nS

uffix

en,w

iez.

B.d

asO

xfor

dA

dvan

ced

Lear

ner’s

Dic

tiona

ry(O

ALD

);

Mor

phol

ogie

fur

die

Com

pute

rlexi

kogr

aphi

e–

p.33

Page 34: die für ographie aph r xik Le Morphologie Computerle · Kasus, Numer us, T empus, P erson etc. Neben dem System der Fle xionsmor pheme, einem In v entar mit n ur w enigen Elementen,

EBERHARDKARLSUNIVERSITÄTTÜBINGENSeminarfurSprachwissenschaftV

ergl

eic

h,F

orts

.m

orph

olog

isch

eK

onve

rsio

nw

irdin

Prin

twör

terb

üche

rnnu

rin

Zus

amm

enha

ngm

itei

nher

gehe

nder

sem

antis

cher

Ver

ände

rung

besc

hrie

ben

-G

ER

TW

OL

sche

int

syst

emat

isch

ervo

rzug

ehen

Kom

posi

tion

Aufl

istu

ngvo

nK

ompo

sita

,wie

inP

rintw

örte

rbüc

hern

,nic

htno

twen

dig

bei

Sys

tem

en,d

ieei

neA

naly

seko

mpo

nent

efü

run

beka

nnte

Wör

ter

habe

nw

ieG

ER

TW

OL

und

Can

oo;

für

die

Lem

maa

ufna

hme

wic

htig

eU

nter

sche

idun

gzw

isch

entr

ansp

aren

ten

und

opak

enK

ompo

sita

entfä

llt(b

eitr

ansp

aren

ten

Kom

posi

taka

nnm

andi

eG

esam

tbed

eutu

ngau

sde

rB

edeu

tung

der

Bes

tand

teile

ersc

hlie

ßen

,z.B

.A

pfel

baum

;bei

opak

enK

ompo

sita

nich

t,z.

B.B

ierd

ecke

lste

uer)

,da

kein

ese

man

tisch

enB

esch

reib

unge

nvo

rgen

omm

enw

erde

n;

syst

emat

isch

eB

ehan

dlun

gvo

nF

ugen

mor

phem

en(d

iehi

erde

nF

lexo

nskl

asse

nde

rS

täm

me

zuge

ordn

etw

erde

n)um

sow

icht

iger

beiG

ER

TW

OL

und

Wor

dMan

ager

;

Fug

enm

orph

eme

als

Wor

tbild

ungs

elem

ente

ohne

eige

nen

sem

antis

chen

Sta

tus

wer

den

inP

rint-

WB

nich

tbeh

ande

lt(s

yste

mat

isch

eB

esch

reib

ung

gehö

rtin

(Wör

terb

uch-

)Gra

mm

atik

).

Mor

phol

ogie

fur

die

Com

pute

rlexi

kogr

aphi

e–

p.34