Lernen und Gedächtnis Vorlesung Christian Kaernbach Teil 1: Lernen

Preview:

Citation preview

Lernen und Gedächtnis

VorlesungChristian Kaernbach

Teil 1: Lernen

„Automatisches“ Lernen

• Behaviorismus und die Folgen– Der Mensch als Reiz-Reaktions-System

– Mentale Größen sind• moderater Behaviorismus: nicht erfaßbar• radikaler Behaviorismus: nicht existent

– Klassisches Konditionieren– Instrumentelles Konditionieren– Kritik am Behaviorismus

• Implizites Lernen• Wahrnehmungslernen• Handlungslernen

Klassisches Konditionieren

• unkonditionierter Stimulus (US)– Pawlow: Fleisch– z. B. Luftstrom gegen Hornhaut

• unkonditionierte Reaktion (UR)– Pawlow: Speichelbildung– hier: Lidschlag

• konditionierter Stimulus (CS)– Pawlow: Klingel– z. B. Ton

• konditionierte Reaktion (CR)– Pawlow: Speichelbildung– hier: Lidschlag– CR UR

Klassisches Konditionieren• Die CR wird schnell gelernt.

– eine CS-US Koppelung kann ausreichen.

• Sie kann zwar „gelöscht“ werden,– wiederholte Darbietung von CS ohne US.

• aber sie wird nie vergessen.– bei weiterer CS-US Koppelung:

• Ersparnis– ohne weitere CS-US Koppelung:

• spontane Erholung• Kontext (Erneuerung)• US o.ä. (Wiederherstellung)• Relevanz: Stabilität der Phobie

• Gegenkonditionieren• Clockwork Orange

Stanley Kubrick / Anthony Burgess

CS

US

CS

US

CS

US

Zeitverhältnisse

• simultan

• verzögert

• rückwirkend

CS

US

CS

US

CS

US

• simultan

• verzögert

• rückwirkend

250

500

750

125

Zeitverhältnisse

CR ist antizipatorische Reaktion auf den US

Paßfähigkeit von US und CS

• Experiment mit Ratten:– US1: Stromschlag

US2: Brechreiz

– CS1: TonCS2: Süßstoff

CS1+CS2+US1: CR nur bei CS1 CS1+CS2+US2: CR nur bei CS2

• Ein Geschmacksreiz ist ein besserer Prädiktor für Brechreiz als ein Ton

• Ein externer Reiz ist ein besserer Prädiktor für Stromschlag als ein Geschmack

Neurophysiologiedes klassischenKonditionierens

• us1 Mantelrand berührenus2 Siphon berühren

ur schwacher Kiemenrückzug

• US Stromschlag Schwanz UR starker Kiemenrückzug

• CS1 Mantelrand berührenoder CS2 Siphon berührenpaaren mit US Stromschlag Schwanz

CR starker Kiemenrückzugselektiv auf CS1 oder CS2(CS+ bzw. CS–)

• Hebb Lernregel (1949)

Klassische Konditionierung:Was wird gelernt?

• konditionierter „Reflex“?– Reflex US UR– neue Verbindung CS UR = neuer Reflex?– CS CR UR!– gelernt wird nicht CS CR, sondern CS US

• UR verhindern: CR wird trotzdem gelernt• US entwerten (US: Futter bei hungrigen/satten Ratten)• CS2 mit CS1 paaren, dann CS1 mit US: CR auf CS2

Klassische Konditionierung:Was wird gelernt?

• Informationswert des CS– Hauptparameter: Kontiguität P(US|CS)

Wahrscheinlichkeit, daß US auftritt, wenn CS gegeben wurde

– ebenfalls wichtig: Basisrate P(US|–CS)Wahrscheinlichkeit, daß US auftritt,wenn kein CS gegeben wurde

– Informationswert: Kontingenz P = P(US|CS) – P(US|–CS)

P(US|–CS)

Klassische Konditionierung:Was wird gelernt?

• Informationswert des CS– Hauptparameter: Kontiguität P(US|CS)

Wahrscheinlichkeit, daß US auftritt, wenn CS gegeben wurde

– ebenfalls wichtig: Basisrate P(US|–CS)Wahrscheinlichkeit, daß US auftritt,wenn kein CS gegeben wurde

– Informationswert: Kontingenz P = P(US|CS) – P(US|–CS)

Menschen

Instrumentelles Konditionieren• klassisches Konditionieren:

respondentes Verhalten(Reaktion auf einen Reiz)

• instrumentelles Konditionieren:operantes Verhalten zur Herbeiführung einer Konsequenz

• benötigt: „Verstärker“nach KonsequenzReaktion positiv negativ

geschieht positive Bestrafung Verstärkung

entfällt Bestrafung negative

Verstärkung

Instrumentelles Konditionieren• benötigt: „Verstärker“nach KonsequenzReaktion positiv negativ

geschieht positive Bestrafung Verstärkung

entfällt Bestrafung negative Verstärkung

• Verstärker (operationale Def.)

ein Reiz, der die Auftretenswahrscheinlichkeit einer Reaktion erhöht(Skinner, 1938)

Fortfall des Verstärkers = Löschung

Beispiel Echogedächtnis bei TierenEchogedächtnis bei Tieren

• Wüstenrennmäuse (Kooperation mit Holger Schulze, Magdeburg)

0

5

10

15

20

25

30

0 5 10 15 20

Trainingsdauer [Tage]

Tra

inin

gsle

istu

ng 20 ms

40 ms 60 ms

100 ms80 ms

• Naive Tiere (N=21, 4 pro Gruppe):– shuttle box, go/no-go task– Periodenlänge 20...100 ms– 60 EV pro Tag

• Hochtrainierte Tiere (N=2),Periode wird bei guter Leistung verlängert:

– 160 Tage Training (9600 EV!)– maximal 400 ms

Zeitverhältnisse, Paßfähigkeit

• CS-US Abstand am besten ca. 500 ms• R-V Abstand am besten ca. 500 ms

• US und CS müssen paßfähig sein• R und V müssen paßfähig sein

– instinctive drift (Breland & Breland)

Instrumentelles Lernen:Was wird gelernt?

• Kontingenzlernen– kein neues Verhalten

• Wasserman et al. (1993):– VPn drücken Taste.

– Manchmal geht dann das Licht an: P(O|R).

– Manchmal geht das Licht auch so an: P(O|–R).

– Kausalurteil: VPn-Urteile reflektieren die Größe von P(O|R) – P(O|–R)

Instrumentelles Lernen:Was wird gelernt?

• Kontingenzlernen– kein neues Verhalten

• Wasserman et al. (1993):– VPn drücken Taste.

– Manchmal geht dann das Licht an: P(O|R).

– Manchmal geht das Licht auch so an: P(O|–R).

– Kausalurteil: VPn-Urteile reflektieren die Größe von P(O|R) – P(O|–R) Ratten

shaping, chaining

• Verstärken erst von Bewegungsansatz,dann peu à peu von weitergehender Bewegung.

• Separates Einlernen von Teilbewegungen,dann Verkettung verstärken.

• Dressur

Aberglauben

• Skinner (1948):– keine Kontingenz

zwischen Reaktion und Verstärker:alle 15 s Futter

– Tauben lernenirrelevante Bewegungsmuster

• Staddon & Simmelhag (1971)– Replikation von Skinner, aber

gleichförmigeres Verhalten, antizipatorisch

• Brown & Jenkins (1968): “autoshaping”– in zufälligen Intervallen wird Tastatur beleuchtet, dann kommt Futter

– Tauben picken auf Taste, als ob dadurch das Futter käme

Der Behaviorismus und die Pädagogik

• Give me a dozen healthy infants, well-formed, and my own specified world to bring them up in and I'll guarantee to take any one at random and train him to become any type of specialist I might select--doctor, lawyer, artist, merchant-chief and, yes, even beggar-man and thief, regardless of his talents, penchants, tendencies, abilities, vocations, and race of his ancestors. I am going beyond my facts and I admit it, but so have the advocates of the contrary and they have been doing it for many thousands of years. (Watson, Behaviorism, 1924, S.104)

• Denn wir können die Kinder nach unserem Sinne nicht formen; So wie Gott sie uns gab, so muß man sie haben und lieben, Sie erziehen aufs beste und jeglichen lassen gewähren. Denn der eine hat die, die anderen andere Gaben;Jeder braucht sie, und jeder ist doch nur auf eigene Weise Gut und glücklich.(Goethe, Hermann und Dorothea)

Instrumentelles Lernen aus Sicht der Betroffenen

Ich habe ihn gut dressiert.Kaum drücke ich den Hebel herunter,

kommt er gerannt und gibt mir eine Nuß.

Implizites Lernen

• findet beiläufig statt

• ohne Aufmerksamkeitszuwendung

• bleibt unbewußt

experimentelle Paradigmen

• Steuerung komplexer Systeme

• Erlernen von versteckten Kovarianzen

• Sequenzenlernen

• Erlernen einer finite state Grammatik

finite state Grammatik

in out

X

K

P

T

P

X

S

K

S

T

• TXS• PKPS• TSSSXXTTTKPS• TXSS

Unbewußtes Lernen

• Ist Wissen, daß in Paradigmen des impliziten Lernens demonstriert wird, wirklich unbewußt?

• Wie sensitiv ist der Test auf Bewußtheit verglichen mit dem Test der Fertigkeit?– Sensitivität kaum vergleichbar

– multiple choice statt freier Bericht• aber: Aha-Erlebnis bei Befragung vermeiden

– z. B. Wissensfragmente beim Grammatiklernen

– gute Abschätzung der Kausalstärke beim instr. Lernen• Sind sich klassische konditionierte Ratten

(Kontiguität + Basisrate) ihres Wissens „bewußt“? (mental map)

Wahrnehmungslernen

• Kückensortierer können männliche von weiblichen Kücken unterscheiden

• bessere Gesichtserkennung für die jeweils eigene Ethnizität

• Eltern können eineiige Zwillinge unterscheiden

oft gesehen → besser unterscheidbar

Wahrnehmungslernen

• einfache Unterscheidungsaufgaben– Tonhöhe (Lautstärke, ...)

• 1 kHz trainiert → 4 kHz nur etwas besser

• mit Aufgabe besseres Lernen, aber auchohne Aufgabe Verbesserung

• mehr Kortex für diese Frequenz,spezifischere rezeptive Felder

– Verniergenauigkeit (Nonius)• am Ende besser als ein

rezeptives Feld auf der Retina

• generalisiert nicht auf– andere Orientierung– anderen Retina-Ort

Wahrnehmungslernen?

• McCollough-Effekt (McCollough, 1965)– Adaptieren zu bestimmten

Farb-Orientierungs-Kombinationen

Wahrnehmungslernen

• McCollough-Effekt– „Adaptierung“ von Zellen im visuellen Kortex,

die sowohl auf Farbe als auch auf Orientierung reagieren

– Unterschied zu klassischen Nachbildern:lange Persistenz (1 Tag, 1 Woche, 1 Jahr)

– kein klassisches Adaptieren im Sinne von Ermüden, Habituieren, etc. (das wäre kürzer)

doch Lernen? Rekodierung? Reprogrammierung?

Wahrnehmungslernen?

• Prismenadaptation

Woher wissen wir, wo die Dinge sind,

die wir sehen?

?

Wahrnehmung und Handlung

Objekt Wahrnehmung

Wahrnehmung als „Bild“

و ت ؤظ ز كه ن غ

ج د ى

ZeichentheorieHermann von Helmholtz, 1879

Wahrnehmung

Handlung

Korrelationstheorien

Die Wahrnehmung dient dem Handeln

James J. Gibson, 1979

Experimente mit Prismenbrillen

Fresnelprismen

www.prism-adaptation.de

Wahrnehmung

Handlung

Experimente mit Prismenbrillen

و ت ؤظ ز كه ن غ

ج د Handlungى

Wahrnehmung

Handlung

Wahrnehmung???

zentraleRepräsentation

räumlichen Wissens

räumlichesWissen

ist „verteilt“

Martin, T.A., et al. (1996). kein Transfer von Unterhandwürfen zu OberhandwürfenKitazawa et al. (1997): kein Transfer von schnellem zu langsamen Zeigebewegungen

Verdacht: Die genaue Bewegungsausführung ist relevant.

???Handlung

Wahrnehmung

Adaptation Adaptation

Einfluß der Trajektorie– Touch screen– Horizontaler Balken als Kinnstütze

dadurch pro Hand zwei Trajektorien– 72 Teilnehmer,

zufällig in vier Gruppen eingeteilt– Zielposition zentral (Block 2&4)

oder horizontal randomisiert (Block 1&3)– Prismenbrille (Block 3)

mit 16.7° horizontaler Verschiebung (Basis links)

• Block 1 „Eingewöhnung“ mit visuellem Feedback (Licht ist an),20 Versuche (5 Wiederholungen 4 Trajektorien)

• Block 2 „Vortest“ ohne Feedback (Licht ist aus), 20 Versuche (54)

• Block 3 „Adaptation“ mit Prismenbrille, mit visuellem Feedback,80 Versuche (801) nur eine Trajektorie wird geübt, 4

Gruppen• Block 4 „Nachtest“ ohne Feedback,

20 Versuche (54)

Ergebnisse

Passive Hand:Block 4 vs. Block 2 Block 4 minus Block 2

0102030

-80 -60 -40 -20 0 20 40 60

PHST PHAT

µ = 3 ± 1.8 mmµ = 1 ± 1.7 mm

-60

-50

-40

-30

-20

-10

01 2 3 4 5

AHAT

AHST

Linear(AHST)Linear(AHAT)

Dynamik

0102030

-80 -60 -40 -20 0 20 40 60

AHST AHAT

µ = -46 ± 2.2 mmµ = -26 ± 2.3 mm

PH Passive Hand ST Selbe TrajektorieAH Aktive Hand AT Andere Trajektorie

Horizontalfehler [mm]

Hor

izon

talf

ehle

r [m

m]

Horizontalfehler [mm]

Hor

izon

talf

ehle

r [m

m]

Durchgang

Ergebnisse

-60

-50

-40

-30

-20

-10

01 2 3 4 5

AHAT

AHST

Linear(AHST)Linear(AHAT)

Dynamik

PH Passive Hand ST Selbe TrajektorieAH Aktive Hand AT Andere Trajektorie

-60

-50

-40

-30

-20

-10

01 2 3 4 5

AHAT: B234 dominantAHAT: B234 schwachAHST: B234 dominantAHST: B234 schwach

Händigkeit

-60

-50

-40

-30

-20

-10

01 2 3 4 5

AHAT: B3 o, B4-2 uAHAT: B3 u, B4-2 oAHST: B3 o, B4-2 oAHST: B3 u, B4-2 u

über/unter

vertraute / unvertraute Bewegungen

non-pref

non-pref

Hor

izon

talf

ehle

r [m

m]

Hor

izon

talf

ehle

r [m

m]

Hor

izon

talf

ehle

r [m

m]

DurchgangDurchgangDurchgang

ein erstes Fazit

• kein Transfer zur passiven Handnur ca. 50% Transfer zur jeweils anderen Trajektorie der aktiven Hand

• „passiver“ Zerfall der Adaptationungewohnte Bewegungen werden leichter adaptiert

Adaptation ist keine Rekalibrierung der visuellen Wahrnehmungsonst hätte man 100% Transfer auf passive Hand erwarten müssenund keine vollständige Rekalibrierung der Propriozeptionsonst hätte man 100% Transfer auf andere Trajektorie der aktiven Hand erwarten müssen.

Umlernen von Motor Skripts ?

Einwand: gleiche Startposition, aber leicht verschiedene Endposition,Endposition der anderen Trajektorie wurde nicht adaptiert.

Weitere Experimente

-59-49

-90

-60

-30

0

Nac

heff

ekt [

mm

]

gleich verschiedenTrajektorie

Kreisbewegungen einschieben

-80

-51

-90

-60

-30

0

Nac

heff

ekt [

mm

]

gleich verschieden

Startposition

Abhängigkeit von der Startposition

Weitere Experimente

mit/ohne Gewichtsarmband

-55-44

-90

-60

-30

0

Nac

heff

ekt

[mm

]

gleich verschieden

Gewicht

Vertikale Generalisierung

-90

-60

-30

0

Nac

heff

ekt [

mm

]

hoch hoch/tief tief

hochmittetief

adaptiert

getestet

Weitere Experimente

Dynamik der Adaptation in Block 3abwechselnd mit/ohne Feedback / Terminales Feedback

0102030405060708090

100

0 5 10 15 20feedback Anzahl

Hor

izon

tale

r Fe

hler

[m

m]

blind (alt. mit Vollfeedback)terminales feedback

ein zweites Fazit• Adaptation überträgt sich nicht auf die passive Hand,

und nicht vollständig auf andere Trajektorien der aktiven Hand,auch bei gleichen Start- und Endpunkten.

• Adaptation von Zeigebewegungen geschieht vermutlich hauptsächlich

durch Umlernen von Motor Skripts. Handlungslernen• Es gibt keine zentrale Repräsentation räumlichen Handlungswissens.

Räumliches Handlungswissen ist verteilt. Knowing where is knowing how to.

• Aber was ist mit unserer phänomenalen Erfahrung? Diese scheint nicht notwendig für stimulusgetriebene Handlungen (Zeigen, Greifen)

– blindsight Patient fängt Ball– Stratton (1897) fährt Fahrrad mit Umkehrbrille

obwohl er die Welt noch auf dem Kopf stehen sieht.

• Wozu ist phänomenale Erfahrung dann gut?ein spätes Produkt der Evolution, das es uns ermöglicht, alternative Handlungsschemas durchzuspielen. Tolman, E.C. (1948). Cognitive maps in rats and men. Psychological Review, 55, 189-208.

Millionenquiz

• Bitte sortieren Sie die folgenden Städte von West nach Ost (links nach rechts)– Mailand– Neapel– Rom– Venedig

Millionenquiz

• Bitte sortieren Sie die folgenden Städte von West nach Ost (links nach rechts)– Mailand: 9° 11'– Venedig: 12° 19'– Rom: 12° 29'– Neapel: 14° 15'

Illusion:Räumliches Wissen istbewußt, einheitlich, zentral, genau, unddient Greifhandlungen, genauso wie Planung

ein zweites Fazit

Zwei Repräsentationen räumlichen Wissens:

I II

unbewußt bewußt

verteilt einheitlich, zentral

genau verzerrt

stimulusgetriebene Planung Handlungen

Dissoziation von Handeln und Wahrnehmung

Handeln und Erleben

• Ebbinghaus-Illusion

• Müller-Lyer-Täuschung

• ...– Wahrnehmung wird getäuscht– Greifhandlung erfolgt präzise– (Befunde nicht unstrittig)

Das sensomotorische Kontrollsystem

motorischerPlan

FeedbackControllerFehlersignal

motorischesSystem

FeedforwardController

Plankopie

+

Sensorik

ZNS

Interne Modelle

ZNS

motorischerPlan

motorischesSystem

FeedbackController

+

– Fehlersignal

Efferenzkopie

Sensorik

Vorwärtsmodell(erwartete Sensorik)

„inverses Modell“

FeedforwardController

(Reafferenz)

Literatur zur Handlungssteuerung: Müsseler/Prinz, Allgemeine Ps.

• Kapitel 6b-3: Neuronale Repräsentationen von Bewegung– Kortex

• primärer motorischer Kortex, M1 (somatotopisch)• Assoziationskortex

– Basalganglien– Kleinhirn

• Kapitel 6c-3: Motorische Wahrnehmungstheorien– u.a.: Biologische Bewegungen (biological motion)

• nicht lesen: Kapitel 6c-4, Gemeinsame Repräsentationen für Wahrnehmung und Handlung

• Kapitel 6c-5: Dissoziationen zwischen Wahrnehmung und Handlung– hervorzuheben: Abschnitt 6c-5.4: Das Modell von Goodale und

Millner

Literatur zur Handlungssteuerung: Müsseler, Allgemeine Psychologie (2008)

• Kapitel VI 17-3: Neuronale Repräsentationen von Bewegung

• Kapitel VI 18-3: Motorische Wahrnehmungstheorien

• nicht lesen: Kapitel VI 18-4, Gemeinsame Repräsentationen für Wahrnehmung und Handlung

• Kapitel VI 18-5: Dissoziationen zwischen Wahrnehmung und Handlung– hervorzuheben: Abschnitt 18-5.4: Das Modell von Goodale und

Millner

Recommended