POLISEMIJA KAO NEIZVESNOST ZNAČENJA...

Preview:

Citation preview

POLISEMIJA KAO NEIZVESNOST ZNAČENJA REČI

Dušica Filipović Đurđević

Odsek za psihologiju, Univerzitet u Novom SaduLaboratorija za eksperimentalnu psihologiju, Univerzitet u Beogradu

VIŠEZNAČNOST REČI SKORO DA NE PRIMEĆUJEMO...

Engleski jezik: “The spirit is willing, but the flesh is weak.”

Ruski jezik...

Engleski jezik: “The Vodka is good, but the meat is rotten.”

I...VRLO NAM JE KORISNA

Čiko, koliko je sati?....Ne znam, pitaj Zagora.

Muž mi je doneo kokošku i rekao da je spremim za nedelju. Nisam znala šta kokoške nose, pa sam joj obukla ovu haljinicu.

Da li jedete suši?....Ne, uvek jedem s usta!

Da li ste došli s juga?...Ne, došao sam s ladu.

Svi su bili na mojoj strani, zato se čamac i prevrnuo.

DA LI JE HUMOR JEDINA KORIST OD VIŠEZNAČNOSTI?

Da li bi nam život bio jednostavniji da sve reči imaju jedno značenje?

Da li je višeznačnost “korisna” za obradu jezika?

OBLICI VIŠEZNAČNOSTI REČI

Homografija

Cele noći grad je padao na grad.

Homoformija

Dok sam radio, slušao sam radio.

Homonimija

Pop sluša pop.

Polisemija

Kljun se popeo na kljun.

Postoji dodatni kriterijum za razlikovanje.

Značenje jedini kriterijum za razlikovanje.

HOMONIMIJA VS. POLISEMIJA

Homonimija – reči sa više nepovezanih značenjapop – sveštenikpop – vrsta muzike

Polisemija – reči sa više povezanih značenjakljun – deo tela pticekljun – prednji deo aviona, broda, cipele...

Posledica slučaja

Sistematska pojava u jeziku

Usporava obradu

Ubrzava obraduRodd, Gaskell & Marslen-Wilson, 2002Beretta, Fiorentino & Poeppel, 2005

kljun

kljunSve ptice imaju

kljunCipela ima

kljun

NEIZVESNOST ZNAČENJA

?kljun

??

??

?

CILJ(Filipović Đurđević, 2007)

• Višeznačnost → neizvesnost značenja

• kao što su predložili (Gilhooly & Logie, 1980)

NEIZVESNOST ZNAČENJA REČI

Ne postoji → znam tačno

šta će da se desi.

Maksimalna → sve je moguće.

juni →

TRADICIONALNO – BROJ ZNAČENJA

zglobbalkon

NEIZVESNOST ZNAČENJA REČI

TRADICIONALNO – BROJ ZNAČENJA

0

1

2

3

4

5

6

1 2 3 4 5

Broj značenja

RT

Porast u broju značenja praćen kraćim vremenom obrade. Rodd, Gaskell & Marslen-Wilson, 2002Beretta, Fiorentino & Poeppel, 2005

NEIZVESNOST ZNAČENJA REČI

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

Ver

ovat

noća

bradazglobbalkon

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

Vero

vatn

oća

...0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

Vero

vatn

oća

...

NEIZVESNOST ZNAČENJA REČI

Dva izvora neizvesnosti

Više značenja

→ veća neizvesnost

Ujednačenija učestalost upotrebe značenja

→ veća neizvesnost

Ispitano ranijim istraživanjima

Cilj!

KAKO IZMERITI NEIZVESNOST?

Mera neizvesnosti → Entropija

∑=

⋅−=n

iii ppEntropija

0log

verovatnoća

Mera broja značenja→Mera (ne)ujednačenosti verovatnoća značenja→ Redundansa

EntropijaMaxEntropijaredundansa

.1−=

)(log. jaBrojZnacenEntropijaMaks =

CILJ – POKAZATI DA JE:

• Entropija distribucije verovatnoća značenja adekvatan opis višeznačnosti reči.

• Kognitivni sistem osetljiv

• ne samo na broj značenja,

• već i na verovatnoće pojedinih značenja – redundansu.

Za procenuneizvesnosti značenjapotrebno poznavati

verovatnoćeznačenja reči!

REČNIK MATICE SRPSKE• 150 polisemičnih imenica• Raspon značenja: 2 do 18• Raspon frekvencije: 10 do 999

• Prikupljene procene • familijarnosti reči• konkretnosti značenja reči

02468

10

1214161820

1 9 17 25 33 41 49 57 65 73 81 89 97 105 113 121 129 137 145

logpN

(log) Frekvencija

Broj značenja

• Ispitanici navode sva značenja neke reči kojih mogu da sete

• Total meaning metric (Azuma, 1996)

• Klasifikovanje prikupljenih značenja

FORMIRANJE DISTRIBUCIJE VEROVATNOĆA ZNAČENJA

5.710.021govoriti u bradu

(mumlati)

2.180.021simbol za visok pološaj

(zna se ko nosi bradu u ovoj kući)

4.710.042simbol za starost, učenost

(seda brada)

3.240.042osetljivo mesto kod boksera

(staklena brada)

3.940.094deo ploda kukuruza-kukuruzna svila

(kukuruzna brada)

6.940.3918dlake na muškoj bradi

(Obrij tu bradu!)

6.750.2971.990.3918deo lica, deo vilice

(Imam rupicu na bradi)

FamTNHpFBRADA (ispitanici)

EKSPERIMENTI

Da li neizvesnost značenja utiče na vreme prepoznavanja reči?Entropija

Da li ujednačenost verovatnoća značenja utiče na obradu?Redundansa

EKSPERIMENT 1Zadatak leksičke odluke54 studenta prve godine psihologije150 imenica i 150 pseudoimenicaKorelacioni nacrt

Nezavisne varijable:Dužina reči(log) frekvencija lemeFamilijarnost rečiKonkretnost rečiEntropija / Broj značenja i redundansa

Zavisna varijabla:Vreme reakcije

dužina reči: β=0.02, t(7435)=4.41, p<0.0001(log) frekvencija leme: β=-0.024, t(7435)=-8.84, p<0.0001

familijarnost reči: β=-0.052, t(7435)=-6.30, p<0.0001entropija: β=-0.285, t(7435)=-2.97, p<0.01

entropija (nelinearno): β=0.021, t(7435)=3.04, p<0.01familijarnost*entropija: β=0.042, t(7435)=2.79, p<0.01

• Analiza linearnih mešovitih efekata

• Slučajni efektiIspitaniciStimulusi

• Fiksni efekti

EKSPERIMENT 1Entropija

dužina reči: β=0.018, t(7435)=4.08, p<0.0001(log) frekvencija leme: β=-0.025, t(7435)=-9.22, p<0.0001

familijarnost reči: β=-0.053, t(7435)=-6.49, p<0.0001broj značenja: β=-0.002, t(7435)=-2.92, p<0.01

broj značenja (nelinearno): β= 0.0002, t(7435)=2.91, p<0.01redundansa: β=0.241, t(7435)=4.13, p<0.0001

• Analiza linearnih mešovitih efekata

• Slučajni efektiIspitaniciStimulusi

• Fiksni efekti

EKSPERIMENT 1

Broj značenja i redundansa

EKSPERIMENT 2: FAKTORIJALNI NACRT

Nveliko

Nmalo

T velikoT malo

0

0 . 1

0 . 2

0 . 3

0 . 4

0 . 5

0 . 6

0 . 7

1 2 3 4 5 6 7 8 9 1 00

0 . 1

0 . 2

0 . 3

0 . 4

0 . 5

0 . 6

0 . 7

1 2 3 4 5 6 7 8 9 1 0

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

1 2 3 4 5 6 7 8 9 100

0.1

0.2

0.3

0.4

0.5

0.6

0.7

1 2 3 4 5 6 7 8 9 10

EKSPERIMENT 2Zadatak leksičke odluke18 studenata prve godine psihologije60 imenica i 60 pseudoimenicaDva faktora:

broj značenja, dva nivoa (N=9.1, N=16) redundansa, dva nivoa (T=0.10, T=0.21).

Grupe stimulusa ujednačene po: frekvenciji lemefamilijarnostikonkretnostibroju značenja procenjenim na osnovu Rečnika Matice srpske

broju slova.

EKSPERIMENT 2

640

650

660

670

680

690

700

710

720

manji broj značenja veći broj značenja

RT

(ms manja redundansa

veća redundasa

• Analiza linearnih mešovitih efekata

• Slučajni efekti

Ispitanici dužina reči: F(1,987)=13.814, p<0.01(log) frekvencija leme: F(1,987)=6.34, p<0.05

familijarnost: F(1,987)=12.958, p<0.001broj značenja (kategorije): F(1,987)=4.292, p<0.05

redundansa (kategorije): F(1,987)=7.252, p<0.01

• Fiksni efekti

NALAZIEntropija predstavlja kognitivno relevantan opis višeznačnosti reči.

Veća entropija → brža obrada.

Pored broja značenja, na vreme obrade utiče ujednačenost verovatnoća značenja.

Više značenja → brža obrada.Veća ujednačenost značenja → brža obrada.

0

0.1

0.2

0.3

0.4

0.5

0.6

0.7

1 2 3 4 5 6 7 8 9 100

0 . 1

0 . 2

0 . 3

0 . 4

0 . 5

0 . 6

0 . 7

1 2 3 4 5 6 7 8 9 1 0

TEZA:Efekat entropije distribucije značenja u skladu sa modelima distribuirane obrade pri prepoznavanju vizuelno prikazanih reči.

(Seidenberg & McClelland, 1989)Povratna aktivacija sa semantičkog nivoa.

(Hino & Lupker, 1996)Polisemija

Veći stepen povratne aktivacije usled smanjene kompeticije između jedinica koje se preklapaju.

(Rueckl, 1995)Ukoliko stepen aktivacije prati učestalost značenja, predviđamo veći stepen povratne aktivacije za reči sa ujednačenim frekvencijama značenja.

Homonimija i ostali oblici višeznačnosti (nepovezana značenja)Sporija obrada usled kompeticije na semantičkom nivouPredikcija – entropija usporava obradu

(Rogers, Marslen-Wilson & Davis, 2008, AMLaP)

PROBLEMI U OPISU VIŠEZNAČNOSTI REČI• Problemi u formiranju distribucije verovatnoća značenja

na osnovu iskaza ispitanika:

• Kategorizacija odgovora?

• Korekcija broja značenja?

• Rečnik, ili ispitanici?

• Nedostatak jedinstvenog opisa za različite vrste višeznačnosti

• Homonimija vs. polisemija- ista mera facilitira/inhibira u zavisnosti od vrste višeznačnosti

POTREBAN ALTERNATIVNI NAČIN OPISIVANJA VIŠEZNAČNOSTI REČI

• Opisati višeznačnost bez oslanjanja na subjektivne procene

• Naći jedinstvenu meru za različite vrste višeznačnosti

(Schütze, 1998)

Moscoso del Prado Martìn, Kostić & Filipović Đurđević (submitted)

VEKTORSKI ZASNOVANA SEMANTIČKA ANALIZA• Tehnika kvantitativne lingvistike

• Kvantitativni opis značenja reči

• Značenje reči = kontekst u kojem se reč pojavljuje

• Predstavljanje reči preko n-dimenzionog vektora

00000triosobaosnovmuzikarazličitreč

Kontekst

Frekvencija pojavljivanja reči u datom kontekstu

• Prozor širine od 7 reči

• Centralna pozicija ciljna reč

• Registrovanje unapred odabranih kontekst reči u +/- 3 susedne pozicije

00000triosobaosnovmuzikarazličitreč

FORMIRANJE VEKTORA

• Više"Ako pokušam da ispričam vic, trudeći se pri tom da

reč istovremeno dobije tri različita značenja, to

je kao kad čuješ tri različite muzike u isto vreme,

što je neprijatno i zbunjujuće i nije tako fino kao

beli šum. To je kao kad bi tri osobe pokušale da s

tobom istovremeno razgovaraju o različitim

stvarima. Iz tog razloga u ovoj knjizi nema

viceva."

Hadon, Mark (2004).Čudan događaj sa psom u neko doba noći.Beograd, Naroda knjiga.

00000triosobaosnovmuzikarazličitreč

• Više"Ako pokušam da ispričam vic, trudeći se pri tom da

reč istovremeno dobije tri različita značenja, to

je kao kad čuješ tri različite muzike u isto vreme,

što je neprijatno i zbunjujuće i nije tako fino kao

beli šum. To je kao kad bi tri osobe pokušale da s

tobom istovremeno razgovaraju o različitim

stvarima. Iz tog razloga u ovoj knjizi nema

viceva."

Hadon, Mark (2004).Čudan događaj sa psom u neko doba noći.Beograd, Naroda knjiga.

00000triosobaosnovmuzikarazličitreč

• Više"Ako pokušam da ispričam vic, trudeći se pri tom da

reč istovremeno dobije tri različita značenja, to

je kao kad čuješ tri različite muzike u isto vreme,

što je neprijatno i zbunjujuće i nije tako fino kao

beli šum. To je kao kad bi tri osobe pokušale da s

tobom istovremeno razgovaraju o različitim

stvarima. Iz tog razloga u ovoj knjizi nema

viceva."

Hadon, Mark (2004).Čudan događaj sa psom u neko doba noći.Beograd, Naroda knjiga.

00000triosobaosnovmuzikarazličitreč

• Više"Ako pokušam da ispričam vic, trudeći se pri tom da

reč istovremeno dobije tri različita značenja, to

je kao kad čuješ tri različite muzike u isto vreme,

što je neprijatno i zbunjujuće i nije tako fino kao

beli šum. To je kao kad bi tri osobe pokušale da s

tobom istovremeno razgovaraju o različitim

stvarima. Iz tog razloga u ovoj knjizi nema

viceva."

Hadon, Mark (2004).Čudan događaj sa psom u neko doba noći.Beograd, Naroda knjiga.

00000triosobaosnovmuzikarazličitreč

• Više"Ako pokušam da ispričam vic, trudeći se pri tom da

reč istovremeno dobije tri različita značenja, to

je kao kad čuješ tri različite muzike u isto vreme,

što je neprijatno i zbunjujuće i nije tako fino kao

beli šum. To je kao kad bi tri osobe pokušale da s

tobom istovremeno razgovaraju o različitim

stvarima. Iz tog razloga u ovoj knjizi nema

viceva."

Hadon, Mark (2004).Čudan događaj sa psom u neko doba noći.Beograd, Naroda knjiga.

00000triosobaosnovmuzikarazličitreč

• Više"Ako pokušam da ispričam vic, trudeći se pri tom da

reč istovremeno dobije tri različita značenja, to

je kao kad čuješ tri različite muzike u isto vreme,

što je neprijatno i zbunjujuće i nije tako fino kao

beli šum. To je kao kad bi tri osobe pokušale da s

tobom istovremeno razgovaraju o različitim

stvarima. Iz tog razloga u ovoj knjizi nema

viceva."

Hadon, Mark (2004).Čudan događaj sa psom u neko doba noći.Beograd, Naroda knjiga.

00000triosobaosnovmuzikarazličitreč

• Više"Ako pokušam da ispričam vic, trudeći se pri tom da

reč istovremeno dobije tri različita značenja, to

je kao kad čuješ tri različite muzike u isto vreme,

što je neprijatno i zbunjujuće i nije tako fino kao

beli šum. To je kao kad bi tri osobe pokušale da s

tobom istovremeno razgovaraju o različitim

stvarima. Iz tog razloga u ovoj knjizi nema

viceva."

Hadon, Mark (2004).Čudan događaj sa psom u neko doba noći.Beograd, Naroda knjiga.

00000triosobaosnovmuzikarazličitreč

• Više

00000triosobaosnovmuzikarazličitreč

"Ako pokušam da ispričam vic, trudeći se pri tom da

reč istovremeno dobije tri različita značenja, to

je kao kad čuješ tri različite muzike u isto vreme,

što je neprijatno i zbunjujuće i nije tako fino kao

beli šum. To je kao kad bi tri osobe pokušale da s

tobom istovremeno razgovaraju o različitim

stvarima. Iz tog razloga u ovoj knjizi nema

viceva."

Hadon, Mark (2004).Čudan događaj sa psom u neko doba noći.Beograd, Naroda knjiga.

• Više

00000triosobaosnovmuzikarazličitreč

"Ako pokušam da ispričam vic, trudeći se pri tom da

reč istovremeno dobije tri različita značenja, to

je kao kad čuješ tri različite muzike u isto vreme,

što je neprijatno i zbunjujuće i nije tako fino kao

beli šum. To je kao kad bi tri osobe pokušale da s

tobom istovremeno razgovaraju o različitim

stvarima. Iz tog razloga u ovoj knjizi nema

viceva."

Hadon, Mark (2004).Čudan događaj sa psom u neko doba noći.Beograd, Naroda knjiga.

• Više

00000triosobaosnovmuzikarazličitreč

"Ako pokušam da ispričam vic, trudeći se pri tom da

reč istovremeno dobije tri različita značenja, to

je kao kad čuješ tri različite muzike u isto vreme,

što je neprijatno i zbunjujuće i nije tako fino kao

beli šum. To je kao kad bi tri osobe pokušale da s

tobom istovremeno razgovaraju o različitim

stvarima. Iz tog razloga u ovoj knjizi nema

viceva."

Hadon, Mark (2004).Čudan događaj sa psom u neko doba noći.Beograd, Naroda knjiga.

• Više

00000triosobaosnovmuzikarazličitreč

"Ako pokušam da ispričam vic, trudeći se pri tom da

reč istovremeno dobije tri različita značenja, to

je kao kad čuješ tri različite muzike u isto vreme,

što je neprijatno i zbunjujuće i nije tako fino kao

beli šum. To je kao kad bi tri osobe pokušale da s

tobom istovremeno razgovaraju o različitim

stvarima. Iz tog razloga u ovoj knjizi nema

viceva."

Hadon, Mark (2004).Čudan događaj sa psom u neko doba noći.Beograd, Naroda knjiga.

• Više

00000triosobaosnovmuzikarazličitreč

"Ako pokušam da ispričam vic, trudeći se pri tom da

reč istovremeno dobije tri različita značenja, to

je kao kad čuješ tri različite muzike u isto vreme,

što je neprijatno i zbunjujuće i nije tako fino kao

beli šum. To je kao kad bi tri osobe pokušale da s

tobom istovremeno razgovaraju o različitim

stvarima. Iz tog razloga u ovoj knjizi nema

viceva."

Hadon, Mark (2004).Čudan događaj sa psom u neko doba noći.Beograd, Naroda knjiga.

• Više

00000triosobaosnovmuzikarazličitreč

"Ako pokušam da ispričam vic, trudeći se pri tom da

reč istovremeno dobije tri različita značenja, to

je kao kad čuješ tri različite muzike u isto vreme,

što je neprijatno i zbunjujuće i nije tako fino kao

beli šum. To je kao kad bi tri osobe pokušale da s

tobom istovremeno razgovaraju o različitim

stvarima. Iz tog razloga u ovoj knjizi nema

viceva."

Hadon, Mark (2004).Čudan događaj sa psom u neko doba noći.Beograd, Naroda knjiga.

• Više"Ako pokušam da ispričam vic, trudeći se pri tom da

reč istovremeno dobije tri različita značenja, to

je kao kad čuješ tri različite muzike u isto vreme,

što je neprijatno i zbunjujuće i nije tako fino kao

beli šum. To je kao kad bi tri osobe pokušale da s

tobom istovremeno razgovaraju o različitim

stvarima. Iz tog razloga u ovoj knjizi nema

viceva."

Hadon, Mark (2004).Čudan događaj sa psom u neko doba noći.Beograd, Naroda knjiga.

00011triosobaosnovmuzikarazličitreč

• Više

00011triosobaosnovmuzikarazličitreč

"Ako pokušam da ispričam vic, trudeći se pri tom da

reč istovremeno dobije tri različita značenja, to

je kao kad čuješ tri različite muzike u isto vreme,

što je neprijatno i zbunjujuće i nije tako fino kao

beli šum. To je kao kad bi tri osobe pokušale da s

tobom istovremeno razgovaraju o različitim

stvarima. Iz tog razloga u ovoj knjizi nema

viceva."

Hadon, Mark (2004).Čudan događaj sa psom u neko doba noći.Beograd, Naroda knjiga.

• Više"Ako pokušam da ispričam vic, trudeći se pri tom da

reč istovremeno dobije tri različita značenja, to

je kao kad čuješ tri različite muzike u isto vreme,

što je neprijatno i zbunjujuće i nije tako fino kao

beli šum. To je kao kad bi tri osobe pokušale da s

tobom istovremeno razgovaraju o različitim

stvarima. Iz tog razloga u ovoj knjizi nema

viceva."

Hadon, Mark (2004).Čudan događaj sa psom u neko doba noći.Beograd, Naroda knjiga.

00121triosobaosnovmuzikarazličitreč

• Više

00121triosobaosnovmuzikarazličitreč

"Ako pokušam da ispričam vic, trudeći se pri tom da

reč istovremeno dobije tri različita značenja, to

je kao kad čuješ tri različite muzike u isto vreme,

što je neprijatno i zbunjujuće i nije tako fino kao

beli šum. To je kao kad bi tri osobe pokušale da s

tobom istovremeno razgovaraju o različitim

stvarima. Iz tog razloga u ovoj knjizi nema

viceva."

Hadon, Mark (2004).Čudan događaj sa psom u neko doba noći.Beograd, Naroda knjiga.

• Više"Ako pokušam da ispričam vic, trudeći se pri tom da

reč istovremeno dobije tri različita značenja, to

je kao kad čuješ tri različite muzike u isto vreme,

što je neprijatno i zbunjujuće i nije tako fino kao

beli šum. To je kao kad bi tri osobe pokušale da s

tobom istovremeno razgovaraju o različitim

stvarima. Iz tog razloga u ovoj knjizi nema

viceva."

Hadon, Mark (2004).Čudan događaj sa psom u neko doba noći.Beograd, Naroda knjiga.

10121triosobaosnovmuzikarazličitreč

• Više

10121triosobaosnovmuzikarazličitreč

"Ako pokušam da ispričam vic, trudeći se pri tom da

reč istovremeno dobije tri različita značenja, to

je kao kad čuješ tri različite muzike u isto vreme,

što je neprijatno i zbunjujuće i nije tako fino kao

beli šum. To je kao kad bi tri osobe pokušale da s

tobom istovremeno razgovaraju o različitim

stvarima. Iz tog razloga u ovoj knjizi nema

viceva."

Hadon, Mark (2004).Čudan događaj sa psom u neko doba noći.Beograd, Naroda knjiga.

VEKTORSKI ZASNOVANA SEMANTIČKA ANALIZA• Kosinusna distanca – ugao između vektora odslikava

povezanost značenja reči koje vektori predstavljaju.

vrabac

slavuj

noj

VEKTORSKI ZASNOVANA SEMANTIČKA ANALIZA VIŠEZNAČNIH REČI

• Formiranje vektora drugog reda(Schütze, 1998)

• Korak 1: Odvojeni vektori za pojedinačna pojavljivanja reči.

10000tri – 300110tri – 200011tri – 1

osobaosnovmuzikarazličitreč

00011tri – 1osobaosnovmuzikarazličitreč

3010osoba3500osnov0521muzika1024različit0013reč

osobaosnovmuzikarazličitrečKorak 2: Vektori prvog reda za kontekst reči.

00011tri – 1osobaosnovmuzikarazličitreč

3010osoba3500osnov0521muzika1024različit0013reč

osobaosnovmuzikarazličitreč

10334tri – 1osobaosnovmuzikarazličitreč

00011tri – 1osobaosnovmuzikarazličitreč

3010osoba3500osnov0521muzika1024različit0013reč

osobaosnovmuzikarazličitreč

VEKTORI DRUGOG REDA• Korak 3: Suma odgovarajućih vrednosti vektora prvog reda

kontekst reči koje su pronađene u susedstvu datog pojavljivanja ciljne reči.

03010tri – 315225tri – 210334tri – 1

osobaosnovmuzikarazličitreč

VEKTORI DRUGOG REDA• Kosinusna distanca – ugao između vektora odslikava

povezanost pojedinih značenja višeznačnih reči koje vektori predstavljaju.

kljun ptice

kljun – nos/usta

kljun aviona

BIT MODELMoscoso del Prado Martìn, Kostić & Filipović Đurđević (submitted)

• Polazna tačka – vektori drugog reda

• Multidimenzionalna distribucija značenja reči u semantičkom prostoru.

• Mešavina multidimenzionalnih Gausovih distribucija

- određivanje parametara bez unapred zadatkog broja komponenti!

• RT u funkciji neizvesnosti, tj. diferencijalne entropije multidimenzionalne distribucije.

KOOPERACIJA VS. KOMPETICIJA

• Diferencijalna entropija pod uticajem:

• Generalne širine distribucije

LAKOĆA AKTIVACIJE

• Broj komponenti (broj Gausovih distribucija)• Relativne verovatnoće komponenti• Stepen razdvojenosti komponenti

KOMPETICIJA

EGE VS. NEGENTROPIJA

• EGE(Entropy of Equivalent Gaussian)

• Generalna varijabilnost konteksta• Odslikava kooperaciju povezanih

značenja – polisemija.

• Negentropija• EGE – diferencijalna entropija• Odslikava kompeticiju između

nepovezanih značenja – homonimija.

• Analiza vremena reakcije na skupu homonima i polisemičnih reči(Moscoso del Prado Martìn et al., submitted)

NAŠ CILJ

• Efekat EGE i

• odsustvo efekta negentropije

• na skupu isključivo polisemičnih imenica srpskog jezika

• koristeći metod kojeg su predložili Moscoso del Prado Martìnet al. (submitted).

FORMIRANJE KONTINUALNE DISTRIBUCIJE VEROVATNOĆA• Metod predložen od Moscoso del Prado Martìn et al. (submitted)

• Vektori drugog reda za 150 polisemičnih imenica srpskog jezika(Schütze, 1998)

• 1000 najfrekventnijih reči kao kontekst reči

• Ebart – elektronska baza od 70 miliona reči

• 130 reči sa više od 500 pojavljivanja

• Procenjeni EGE i Negentropija.

EKSPERIMENT

Zadatak vizuelne leksičke odluke 54 studenta prve godine psihologije150 imenica i 150 pseudoimenicaKorelacioni nacrt

Nezavisne varijable:Dužina reči(log) frekvencija lemeFamilijarnost rečiKonkretnost rečiEGE / Negentropija

Zavisna varijabla:Vreme reakcije

REZULTATI• Analiza linearnih mešovitih efekata (RT VLD Eksperiment)

• Slučajni efekti: IspitaniciStimulusi (reči)

• Fiksni efekti: Dužina reči: β=0.014, t(1,6573)=3.07, p<0.01

(log) Frekvencija leme: β=-0.022, t(1,6573)=-7.89, p<0.001 Familijarnost reči: β=-0.043, t(1,6573)=-5.13, p<0.001

Entropija (diskretno p): β=-0.014, t(1,6573)=-2.62, p<0.01 Entropija (diskretno p), nelinearno: β=0.027, t(1,6573)=3.78, p<0.001

Entropija (diskretno p) * Familijarnost reči: β=0.051, t(1,6573)=2.70, p<0.01 EGE: β=-0.084, t(1,6573)=-2.46, p=0.01

EFEKAT EGE

REZIME

Polisemija može da se opiše kao varijabilnost konteksta u kojima se reč javlja.

EGE (Entropy of Equivalent Gaussian) ubrzava obradu polisemičnih reči.

Negentropija multidimenzionalne distribucije kontekstualnih vektora nema uticaja na obradu.

ZAKLJUČCI

Polisemične reči se brže obrađuju zahvaljujući:

širokoj aktivaciji u semantičkom prostoru i

smanjenoj kompeticiji između komponenti distribucije koje se preklapaju u velikoj meri.

Potvrđene predikcije izvedene iz modela koji

ne zahteva subjektivne procene ispitanika

pruža jedinstven okvir za različite vrste višeznačnosti

KOGNITIVNI SISTEM VOLI REČI KOJE MOGU DA SE KORISTE U RAZLIČITIM POVEZANIM ZNAČENJIMA

HVALA

Ovo istraživanje sufinansirano je od strane Ministarstva nauke i zaštite životne sredine Republike Srbije

(projekat broj: 149039D).

Recommended