TP 2: Situationsabhaengiges Verstaerkungslernen FNW/IBIO

14
P 2: Situationsabhaengiges Verstaerkungslerne FNW/IBIO Jochen Braun, [email protected] Oussama Hamid, [email protected] Roos Houtkamp, [email protected]

description

TP 2: Situationsabhaengiges Verstaerkungslernen FNW/IBIO. Jochen Braun, [email protected] Oussama Hamid, [email protected] Roos Houtkamp, [email protected]. Experimenteller Teil:. - PowerPoint PPT Presentation

Transcript of TP 2: Situationsabhaengiges Verstaerkungslernen FNW/IBIO

Page 1: TP 2: Situationsabhaengiges Verstaerkungslernen                                 FNW/IBIO

TP 2: Situationsabhaengiges Verstaerkungslernen

FNW/IBIO

Jochen Braun, [email protected] Hamid, [email protected] Houtkamp, [email protected]

Page 2: TP 2: Situationsabhaengiges Verstaerkungslernen                                 FNW/IBIO

Experimenteller Teil:

Dokumentiere Verstaerkungslernen visuomotorischer Assoziationen

Dokumentiere Situationsabhaengigkeit

Korreliere Reizstatistik mit Lernerfolg

Page 3: TP 2: Situationsabhaengiges Verstaerkungslernen                                 FNW/IBIO

Visuelle Objekte

Fraktale Objekte sind

• unvertraut• einpraegsam• unterscheidbar

Page 4: TP 2: Situationsabhaengiges Verstaerkungslernen                                 FNW/IBIO

Motorische Assoziationen

Zwei motorische Antworten (links und rechts)

• keine Assoziationen mit Objekten

• Antwort durch Tastendruck

• Verstaerkung durch Farbaenderung (gruen fuer ‘richtig’, rot fuer ‘falsch’)

Page 5: TP 2: Situationsabhaengiges Verstaerkungslernen                                 FNW/IBIO

Erlernen Visuomotorischer Assoziationen

Experimenter defines two lists of (arbitrary) target objects: members of first list call for response a (e.g., top, left), members of second list for response B (e.g., bottom, right).

Naive subjects attempt to learn these associations by trial and error.

Page 6: TP 2: Situationsabhaengiges Verstaerkungslernen                                 FNW/IBIO

Situationsabhaengikeit A

Target and distractor objects reverse roles every 60 trials or so, necessitating relearning of visuomotor associations.

Retention of initial visuomotor associations becomes evident after second reversal.

Zielreize

Distraktor-reize

~60 Darbietungen

1st reversal 2nd reversal

Page 7: TP 2: Situationsabhaengiges Verstaerkungslernen                                 FNW/IBIO

Situationsabhaengigkeit B: Zeitliche Abfolge

0 1 1 1

1 0 1 1

1 1 0 0

1 1 1 0

1 1 1 0

2 1 0 0

0 1 0 2

0 0 2 1

Uebergaenge gleichverteilt

Keine Wiederholungen

Bestimmte Uebergaenge gehaeuft

Einige Wiederholungen

Page 8: TP 2: Situationsabhaengiges Verstaerkungslernen                                 FNW/IBIO

Unabhaengige Variablen

• Haeufung der Uebergaenge• Zahl der Wiederholungen

Abhaengige Variablen

• Lerngeschwindigkeit• Geschwindigkeit der Reakti- vierung nach 2. Umkehr

Objektsequenz, -statistik

Lernmodell

Nimitek

Page 9: TP 2: Situationsabhaengiges Verstaerkungslernen                                 FNW/IBIO

Theoretischer Teil:

Model of Yu & Dayan (2005)

Erweiterung auf Situationsabhaengigkeit

Page 10: TP 2: Situationsabhaengiges Verstaerkungslernen                                 FNW/IBIO

Uncertainty and Attention

Angela Yu, Peter Dayan

Page 11: TP 2: Situationsabhaengiges Verstaerkungslernen                                 FNW/IBIO

The Experiment• 5- Arrows

• Trial: target after cue

• Subject: report target

• Block1: T-1 trials, blue is relevant, prediction probability:

•Block2: from trial T on, blue not relevant any more, for instance red with new

Page 12: TP 2: Situationsabhaengiges Verstaerkungslernen                                 FNW/IBIO

Mathematical Analysis

Page 13: TP 2: Situationsabhaengiges Verstaerkungslernen                                 FNW/IBIO

The Ideal Learner Algorithm

Zt is the normalizing constant for the distribution

• Iterative method for computing the joint posterior• Integration is expensive

Page 14: TP 2: Situationsabhaengiges Verstaerkungslernen                                 FNW/IBIO

Erweiterung von Yu und Dayan

0 1 0 00 0.7 0 0

1 1 1 0

2 1 0 0

0 1 0 2

0 0 2 1

Bedeutsamkeit undZuverlaessigkeit der Einzelobjekte

Bedeutsamkeit und Zuverlaessigkeitder Objektuebergange