Upload
taariq
View
33
Download
4
Embed Size (px)
DESCRIPTION
Az alaktan az információs pszicholingvisztikában. Pléh Csaba 3. Óra Információs Pszicholingvisztika a PPKE diákjainak 2014 ősz [email protected]. Áttekintés. A morfológia fogalma Szófelismerés és alaktani elemzés. A szuffixumok feldolgozása agglutinatív nyelvekben. - PowerPoint PPT Presentation
Citation preview
Az alaktan az információs pszicholingvisztikában
Pléh Csaba3. Óra
Információs Pszicholingvisztika a PPKE diákjainak 2014 ősz
Áttekintés
• A morfológia fogalma • Szófelismerés és alaktani elemzés.• A szuffixumok feldolgozása agglutinatív nyelvekben. • Elemző és egészleges modellek kombinációja. • Az igekötő levágás és a komplex igék képviselete.• Az alaktani szabályok és az allomorfia: észlelés,
produkció és elsajátítás. • A szabályok és szokások vitája az alaktanban: a
konnekcionisták és Pinker. • Alaktan afáziás és egyéb patológiás folyamatokban.• Alternatívák az alaktanban és a nyelvhasználat mint
értékhordozó (stigmatizációs folyamatok).
Morfológia
• A szavak belső szerkezetét vizsgálja
• Morféma: legkisebb jelentéssel bíró nyelvi egység• Szó és szóalak
• elkelkáposztásíthatatlanságaitokért
• Hány morféma ez a szóalak?
Morfológiai folyamatok• A morfémák kombinációkészsége nyelvről nyelvre változik:
– Poliszintetikus nyelvek: többszörösen összetett szavak, teljes mondatokat fejezhet ki egy szó.
• Ajjiliurumavagit. (inuktitut)Le akarlak fényképezni.
– Izoláló nyelvek: ritka az összetett szó, a grammatikai morfémák is szabadon állnak.
• I want to take a picture of you. (angol)Le akarlak fényképezni.
• Flektáló nyelv: szláv, latin. Tőtípusok – Agglutináló nyelvek: nyelvtani morfémák többnyire kötöttek,
lexikai morfémák többnyire szabadok.• Le akarlak fényképezni.• Szatellita szerveződés: minden megkülönböztetés másik
morféma kalap-ja-im-nak • Egy-egy nyelv története mozoghat a típusok között.
Az alaktan bonyolódása csökkenti a beszélők számát
Nettle, 2012
Szavak száma és szóalakok a bibliafordításban. Ragozóknál sok alak s kevés szó
Sekély morfológiai: sok fonéma, sok szó
Az alaktan viszonylagos szerepének következményei
(Gergely és Pléh, 1995) Gazdag alaktan
gyors döntések lokálisabb megértés emlékezet szavaknál
(Németh Dezső)
Szegényes alaktanlassabb döntésegészlegesebb
megértés emlékezet
frázisoknál
• A morfémákat emlékezetünkben tároljuk: mentális lexikon morfématár része
• A tárolt morfémákból kombinációs szabályok szerint alkotunk szavakat.– prefixáció: be-megy, be-olvas, ? ki-rándul – Szuffixáció drájv-ot, kólá-val – Szóösszetétel sörkorcsolya – kettőzés (egyszer-egyszer, tutyi-mutyi)– szóvegyülés (citrancs)
• A kombinációs szabályok többnyire nem egyéni szavakra vonatkoznak, hanem kategóriákra:
• Főnév + bAn : helyet jelölő főnév• Le + mozgást jelentő ige : lefelé mozgást jelentő
ige
A szavak világa
• Tövek és végződések: a szavak felépítése
barátomat
barát om at
Feladatok
szegmentálás tő felismerés Végződések kezelése
felismerés összegzés
Mi történik egy bonyolult szónál? A pszichológusok régóta méricskélik ezt
• Holisztikus hozzáférés: erdők
• Teljesen analitikus • erdőben
• egyes kenyeret kenyér kenyeret ? ? ? gyakori idiomatikus szabálytalan
Feldolgozás
Elemződefault
EgészlegesGyakori
Egyedi: házasság
Az áttetszőség szerepe Magyari Lilla előfeszítéses
kiolvasási kísérletei
0
10
20
30
40
50
60
70
80
90
100
ÁttetszőSzeszély - Szeszélyes
HomályosÍr - Iroda
Elő
fesz
íté
s (m
sec)
Taft: prefixum levágási modell
Magyar példák
• Meg-olvas
• Fel-gondol
• Ki-teg
• Melyiket nehezebb eldönteni?
• Levágás: megolvas meg + olvas
• nem megy a kombináció
A levágási modell a a magyarban
• Szegmentálást segíti: hangsúly elől, szóalak korlátok
• A töveket és a ragot dolgozzuk fel elsődlegesen (Juhász és Pléh), lassabban, mint az angol vagy olasz
• Fürdőkád hatás 15001600170018001900200021002200230024002500
buolv
asás
ában
bem
erek
ül
kitag
adás
akov
Döntések hosszú sok morfémás szavaknál: Pléh és Juhász 1995
bathtub effectAithchison
Eleje – vége jó Eleje jó Vége jó
Ha egy pinaglló mbengbereti a sznyráát Pgenbiken, az akár tdoánrot is getheszejrt Amikerában. Vinalgkábun mdenin mninnedel öfüsszegg, menidn cseketüedlenk abápjalan vtja áltoztatha meg a jvöőt. Még elzépeklni is reémes,
A nő nyumlogaar vákgyi. A házsagaás elrtotmol, a láany kamkdioasz- ő eregy kevbéés tajallá a hetlyé, és úgy ézir, rdviöidőre mujszá tálvo keneirlü a hétkölótpaijzan. Eztré fodjaag el egy bajatrá megtáváhí, aknike van egy kis motjeel
A ágmany acsk sesűrkeéget üszl és aszőrekot. Max enm thite nolva, ohgy a ajsát őrbén lkel taszegpamtalnia zet. Jó arzsu olvt, kai glodoban él a leséefge és álksinya lelmett. A
A szavak eleje számít Fazekas szövegjavítási feladat
A szavak rekonstrukciója sikeresebb, ha mind a szó eleje mind a vége helyesen van leírva
Az előfeszítési helyzet
RPOBLÉMA
PROBLÉMA
Előfeszítési hatás a kezdetnél: A rontott szó lelassít az elején és a
végén
200
220
240260
280
300
320
340
360380
1 2 3 4 5 Azonos
RT
PORB
LÉM
A
PRO
LBÉM
A
PRO
BLM
ÉA
PRO
BLÉ
AM
Várhelyi Klára
Hasonló szavak, mint a gatingnél Böllár Tő
Böllér-ak bölléruk Jel
Böllér-nak böllér-nuk Rag
Böllér-ak-nek böllér-uk-nek Jel belül
A vizsgálati anyag alapja
• 60 kétszótagú főnév, Németh Kornél gating vizsgálata alapján
• Forrás: MOKK korpusz(www.szoszablya.hu)
• 4 csoport egyediségi pont és gyakoriság alapján
Gyakori Ritka
Korai kenyér,
műsor
böllér ,
gyűszű
Késői város ,
csapat
pincsi ,
krokett
A ragozott szavak
kenyérnek kenyérben kenyérre
kenyerekkenyerak/ kenyerik kenyerem
kenyeram/ kenyerim kenyered
kenyerad/ kenyerid
kenyereknekkenyeraknek/kenyeriknek kenyerekben
kenyerakben/ kenyeriken
kenyerekre
kenyerakra/ kenyerikra
kenyeremnekkenyeramnek/kenyerimnek kenyeremben
kenyeramben/kenyerimben
kenyeremre
kenyeramra/kenyerimre
kenyerednekkenyeradnek/ kenyeridnek kenyeredben
kenyeradben/ kenyeridben
kenyeredre
kenyeradra/ kenyeridra
• Előfordulások: csak tő, jel, rag vagy jel és rag
• Rontás a tőben (kunyérem) a jelben (kenyérid) vagy a ragban (kenyeredbun)
• Létező, de rosszul illesztett (kenyérim) vagy nem létező toldalékok (kenyérum)
A vizsgálat felépítése
• 72, 18 és 34 év közötti résztvevő a Budapesti Műszaki Egyetem hallgatói közül
• 44 (átlag életkor: 21,41 év) nő és 28 (átlag életkor: 21,75 év) férfi
• Minden kísérleti személy döntést hozott az összes szóról, az ingerek fele létező, fele nem létező szó volt
• A szavak egy fixációs kereszt felvillanása után jelentek meg és a kísérleti személyek az i (létező) és r (nem létező) billentyűk segítségével válaszoltak
Eredmények – helyes válaszok
• Mind a gyakoriság mind a hibatípus hatása szignifikáns
• A szó gyakorisága és a hibatípus felismerésének gyakorisága között is szignifikáns korreláció figyelhető meg
• Minél később fordul elő a hiba a szóban, elutasítása annál könnyebb és gyorsabb
ritka
gyakori
Eredmények - reakcióidők
• Mind a gyakoriság, mind a hibatípus hatása szignifikáns
• A létező szavak elfogadása lassabb, mint a nem létezők elutasítása
• A nem létező tövek elutasítása lassabb, mint a nem létező toldalékoké
• Nincs egyértelmű fürdőkád hatás
• A két magánhangzó harmóniát sértő hibatípus közt nincs különbég, viszont ezekhez képest a nem létező toldalékok elutasítása gyorsabb
ritka
gyakor
i
Szóközepén előforduló rontások gyakori szavaknál
• Gyorsabb reakcióidő, de gyakoribb hibázások• Lehet egy optimalizálási mechanizmus eredménye
Reakcióidő
Helyes válaszok
Gyakori
A rontás alattomossága
• A rontás előtt lévő 4 karakter előfordulási gyakorisága a MOKK korpuszban, pl.: bölléred - böllérudléru-782 előforduláslére-75283 előfordulás
• A két szám hányadosának logaritmusa (ngram-faktor) határozza meg a rontás alattomosságának a mértékét
Tényleg külön dolgozzuk fel a ragokat hallva is ?
• „A hálószobában kóválygott a fejem a csókjaidtól.”
• „A hálószobában mindent belengett illatával a levendula.”
• A második közben nehezebb meghallani a kattanást, mert fel kell dolgozni a szót.
Menetközbeni feldolgozás és az alaktan (Gergely és Pléh)
• Extra hang felismerése és az alaktani terhelés
• A végződés feldolgozás már menet közben, hallgatáskor végbemegy 250
270
290
310
330
350
370
390
410
csók ja id tól ~
több morf
tőszó
Jellegzetes hangrekonstrukciós anyag (Dankovics Natali )
A majmot nézik a gyerekek. – kattanó zaj
Mondatpéldák a rekonstrukcióban
• Többesszám helye • (1a) A macskák megették a kolbászt.• (1b) A kolbászt megették a macskák.
• Tárgyrag helye• (2a) A macskát kergeti a kutya.• (2b) A kutya kergeti a macskát.
• Ige vonzatkerete• (3 a) Kati hitt Imrének Velencében.• (3b) Kati hitt az ének erejében.
• Elhagyható esetragok:• (4a) Hiányzik a papucsomnak a bojtja.• (4b) Hiányzik a motorcsónak a partról.
Az alaktan hatásai
• A komplexebb alaktan-mondattan kölcsönhatás megfigyelhető
Elhagyható
Vonzat
Tárgy
Többes
0 50 100
Ala
ktan
i tén
yező
k
Hanghelyreállítás %
Alap Morfológia
Az információelmélet beemelése
Kostic, Baayen, Moscoso
• Kostic: infomennyiség szabja meg az időt, nem a formaszám
a morféma összes alakjához viszonyítva az adott alakPl. háznak Dat Gen
Kostic adatai és az Információ mércéje
Milin RI frekvencia és entrópia függő
Modell: információs maradvány magyaráz jobban
RI meghatározói a szerbben
Házi feladat
• Szuffixumok információs elemzése a magyarban. Entrópiamércék ragokkal s képzőkkel
• Különböző gyakoriságú tövek szaturációja. Hány alakjuk fordul elő, s milyen entrópiával.
• Entrópia és szegmentáció. Hogyan segít?
• Főnevek és igék entrópiája
• Szóhossz, nyelvtani komplexitás és mozgósított szókincs (tokenek) irodalom szövegben