eLearning - Methoden der Psychologie - TU Dresden - Benutzerbeiträge [de]

Modelltypen

2018-10-30T12:44:11Z

Schäfer:

{{Nav|Navigation|Modelltypen|Kognitive Modellierung|Hauptseite}}

Modelle stellen Abbilder von realen Systemen dar. Sie versuchen die Komplexität der Realität vereinfacht darzustellen und fokussieren dabei auf wesentliche Merkmale und Relationen. Welche Aspekte als relevant betrachtet werden ist abhängig vom Ziel der Modellierung. Doch was kann man sich nun konkret unter Modellen vorstellen? Worin unterscheiden sie sich?

Eine erste grobe Einteilung könnte folgendermaßen aussehen:
* '''Realmodelle''': z.B. eine Maus mit einer Mutation auf dem NLGN3-Gen als „Tiermodell“ für Autismus
* '''Ikonische''' (anschauliche) '''Modelle''': z.B. Modelleisenbahn oder eine architektonische Zeichnung
* '''Verbalmodelle''': eine verbale Theorie in natürlicher Sprache: z.B. [https://de.wikipedia.org/wiki/Kognitive_Dissonanz Dissonanztheorie]
* '''Formalmodelle''': mathematische Gleichungen oder Computerprogramme, z.B. [[Rescorla Wagner|Rescorla-Wagner Modell]]

In der Psychologie sind Verbalmodelle aktuell noch am weitesten verbreitet, allerdings nimmt der Anteil formalisierter Modelle stetig zu, was aufgrund ihrer vielen [[Vorteile formaler Modelle|Vorteile]] und im Vergleich zu anderen Naturwissenschaften als Fortschritt angesehen wird (vgl. z.B. [https://www.wissenschaftsrat.de/download/archiv/6603-17.pdf Stellungnahme des Wissenschaftsrates]) . Der Fokus dieses Moduls wird deshalb auf Formalmodellen und deren unterschiedlichen Ausprägungen liegen.

Es gibt eine große Vielzahl verschiedener Modelle und diese lassen sich anhand verschiedener Aspekte unterscheiden. Die Kenntnis dieser Unterscheidungen hilft ein Modell zu finden, das optimal zum eigenen Erkenntnisinteresse passt.

== Abgrenzung nach Zweck und Komplexität ==

Formalmodelle lassen sich nach Michael Dawson unterteilen in:
* [[Statistische Modelle|Statistische Modelle]]
* [[Mathematische Modelle|Mathematische Modelle]]
* [[Synthetische und Explanative Modelle|Synthetische / Explanative Modelle]]

Diese Modelltypen besitzen unterschiedliche Merkmale, welche in den folgenden Artikeln näher beschrieben werden. Aufgrund ihrer spezifischen Eigenschaften eignen sie sich für verschiedene Anwendungssituationen. Statistische Modelle etwa sind in der empirisch ausgerichteten Psychologie zur Beschreibung von Daten bestimmter Fälle weit verbreitet, zur Theoriebildung im Sinne einer Abstraktion konkreter Daten jedoch nur bedingt geeignet. Dies ist hingegen mittels mathematischer und komputationaler Modelle möglich.

== Abgrenzung durch Analyseebene ==

Viele Einteilungssysteme unterscheiden Modelle anhand einer wichtigen Entscheidung, die man beim Modellieren treffen muss: auf welcher Ebene (Abstraktion) will man ein System betrachten und analysieren? Modelle unterscheiden sich also auch darin, auf welche Abstraktions- oder Analyseebene sie abzielen.

Der britische Psychologe, Mathematiker und Informatiker [https://de.wikipedia.org/wiki/David_Marr David Marr] schlug vor, Informationsverarbeitungssysteme, wie zum Beispiel das visuelle System, auf drei unterschiedlichen, komplementären Ebenen zu analysieren:
* '''Komputationale Ebene''' (''computational level''): Was tut das System? Welchen Zweck, welche Logik, welche Strategien verfolgt es dabei?
* '''Algorithmische Ebene''' (''algorithmic level''): Wie arbeitet das System? Mit welchen Repräsentationen arbeitet es und welche Prozesse wendet es zur Erzeugung und Transformation dieser Repräsentationen an?
* '''Technische oder Implementierungsebene''' (''implementational level''): Wie ist das System physikalisch realisiert? (für Kognitionen: Durch welche neuronalen Strukturen oder Prozesse wird das Phänomen implementiert?)

Da die Ebenen nur leicht miteinander verknüpft sind, sind sie relativ unabhängig voneinander. Trotzdem empfahl Marr einen Top-Down Ansatz bei der Modellbildung, d.h. bei der abstrakteren komputationalen Ebene anzufangen und sukzessive ins Detail zu gehen.

[[File:Modelltypen Tab1.PNG||650px]]

Einen ähnlichen Drei-Ebenen-Ansatz für kognitive Modelle verfolgten [https://de.wikipedia.org/wiki/Allen_Newell Newell] und [https://de.wikipedia.org/wiki/Herbert_A._Simon Simon] (1976):
* '''Wissensebene''': erklärt das Systemverhalten durch Berufung auf dessen Ziele und Wissen
* '''Symbolebene''': hier werden Ziele und Wissen in Symbole enkodiert und durch deren Manipulation miteinander verbunden
* '''Physische Ebene''': physikalische Realisierung der Symbolstrukturen und deren Manipulation

[https://en.wikipedia.org/wiki/Ron_Sun Ron Sun] und Kollegen (2006) postulierten dagegen einen sehr anderen Ansatz, der stärker auf die Unterscheidung der zu untersuchenden Phänomene, also deren Wirkungsbereich, Größenordnung oder Grad der Abstraktion fokussiert. Die daraus resultierenden Unterschiede in der Analyse decken sich mit den unterschiedlichen wissenschaftlichen Disziplinen, von der mikroskopischen zur makroskopischen Ebene. Folgende Ebenen der Analyse werden dabei unterschieden:
* '''Soziologische Ebene''': kollektives Verhalten von Agenten, Inter-Agenten-Prozesse, soziokulturelle Prozesse, Agenten-Umwelt-Interaktionen
* '''Psychologische Ebene''': individuelles Verhalten, Annahmen, Wissen, Konzepte, Fähigkeiten (inklusive Wahrnehmung, Emotion etc.)
* '''Komponenten Ebene''': symbolische Berechnungen, konnektionistische/neuronale Netze, semantische Netzwerke
* '''Physiologische Ebene''': biologische Substrate, neuronale Aktivierungen, strukturelle Unterschiede
Laut Sun können sich alle Ebenen wechselseitig wichtigen Input liefern, sich also sowohl bottom-up (biologische Grenzen einer kognitiven Theorie) als auch top-down (Einbettung individuellen Verhaltens in soziale Normen und Werte) informieren und beschränken.

[[File:Modelltypen Tab2.PNG||600px]]

Auf die potentielle Kritik, ein bestimmtes Modell oder (kognitive) Modelle allgemein wären in ihrer Erklärungskraft zu eingeschränkt und würden ein Phänomen nicht in seiner Gänze fassen, lässt sich ggf. entgegnen, dass ein Modell i.d.R. nur eine oder wenige Ebenen der Betrachtung einnimmt und generell auch nicht alle diese erfüllen kann, weshalb für ein umfassendes Verständnis des Phänomens natürlich auch die anderen Ebenen berücksichtigt werden müssen.

== Abgrenzung durch das Ziel der Modellierung: Auswertung vs. Theoriebildung ==

Modelle können zudem darin unterschieden werden, an welcher Stelle des Forschungsprozesses sie eingesetzt werden. So dienen manche Modelle vorrangig als reine Auswertungsmethode: Sie dienen zur sparsamen Beschreibung der Daten oder zur Analyse oberflächlich versteckter Zusammenhänge. Andere Modelle hingegegen dienen vorrangig als Instrument zur Theorie- und Hypothesenbildung: Sie unterstützen Wissenschaftler dabei, ihre Theorien zu entwickeln, zu spezifizieren und Vorhersagen abzuleiten.

Diese ganz andere Kategorisierung von Modellen ist nicht ganz unabhängig von den anderen Kategorisierungsarten und kann verwirrend erscheinen, wenn wir z.B. die Einteilung von Dawson in statistische und mathematische Modelle betrachten. Statistische Modelle werden i.d.R. als reine Auswertungsmethode verwendet, um bestimmte Daten zusammenzufassen und interpretierbare Parameter daraus zu extrahieren, z.B. den Mittelwert und die Streuung. Mathematische Modelle hingegen werden i.d.R. als theoriebildende Modelle verwendet. Für beide ist aber eine gegenteilige Verwendung nicht ausgeschlossen.

Zum Beispiel wird das [[Sequential Sampling Modelle|Diffusions Modell]] oft dafür genutzt, Parameter wie die Drift Rate aus empirischen Daten zu gewinnen. Der Vorteil liegt auf der Hand, denn das Modell berücksichtigt sowohl Reaktionszeitdaten als auch die Reaktionskorrektheit und beschreibt folglich die Daten besser als ein reiner Reaktionszeit-Mittelwert. In dieser Hinsicht könnte man es nach Dawson als statistisches Modell einordnen; es wäre eine etwas komplexere Auswertungsmethode, die einem hilft, latente Variablen zu identifizieren (ähnlich z.B. einer Faktoranalyse). Allerdings ist es auch (eingeschränkt) möglich, dieses Modell zur Theorienbildung zu verwenden, etwa indem die Parameter oder ihre Relation modifiziert oder uminterpretiert werden, oder indem zusätzliche Drifteinflüsse angenommen werden, die verschieden schnelle kognitive Prozesse widerspiegeln. Solchen Modifikationen spiegeln theoretische Annahmen wider und aus ihnen lassen sich neue Vorhersagen ableiten, die dann empirisch geprüft werden können. In dieser Hinsicht könnte man das Modell nach Dawson auch als mathematisches Modell einordnen, denn es beschreibt einen kognitiven Prozess mit mathematischen Mitteln und unterstützt so die Theoriebildung.

Kognitive Modellierung

2018-10-28T15:59:43Z

Schäfer:

{{Nav|Navigation|Kognitive Modellierung|Hauptseite}}

Herzlich Willkommen im Bereich „Kognitive Modellierung“ des E-Learning-Moduls Methoden der Psychologie!

Kognitive Modellierung stellt einen aufstrebenden Zweig in der Psychologie und den kognitiven Neurowissenschaften dar. Modellierung verfolgt das Ziel, die Basis von Kognitionen durch den Aufbau eines detaillierten Verständnisses der unterliegenden Mechanismen zu untersuchen. Dabei werden Modelle entwickelt, welche einen oder mehrere grundlegende kognitive Prozesse oder ihre Interaktionen mechanistisch erklären.
Kennzeichnend für diese Art von Modellen ist, dass sie …

* in formaler mathematischer Sprache oder mithilfe von Computeralgorithmen beschrieben werden
* aus grundlegenden Prinzipien der Kognitionsforschung abgeleitet wurden
* versuchen, eine Brücke zwischen empirisch erfasstem Verhalten und zugrundeliegenden Mechanismen, u.a. auch neuronalen Grundlagen zu schaffen

[[Datei:Puzzle_Modellierung.PNG|center|600 px]]

Sie garantieren somit zum einen logisch valide und präzise quantitative Vorhersagen und können zudem lauffähige Rechenmodelle, welche verschiedene Simulationen und virtuelle Experimente ermöglichen. Diese hohe Flexibilität eröffnet eine Vielzahl an Anwendungsmöglichkeiten sowohl innerhalb der Grundlagenforschung als auch der angewandten Wissenschaft.

Sie finden auf den folgenden Seiten eine Reihe an Informationstexten, welche in die Grundlagen der kognitiven Modellierung einführen und mit interaktiven Simulationen verzahnt sind. Diese [[Simulationen|Simulationen]] bieten Ihnen die Möglichkeit, das Gelesene direkt praktisch auszuprobieren.

Die Artikel [[Aufgaben der Modellierung|„Aufgaben der Modellierung“]] und [[Vorteile formaler Modelle|„Vorteile formaler Modelle“]] beschreiben zunächst die spezifischen theoretischen Grundlagen der kognitiven Modellierung, ihre Ziele und Merkmale.
Daran schließt sich im Artikel [[Modelltypen|„Modelltypen“]] eine Übersicht über Einteilungsmöglichkeiten von Modellen nach unterschiedlichen Gesichtspunkten an.

Die Gliederung der folgenden Artikel entspricht der Einteilung von Formalmodellen nach Michael Dawson in [[Statistische Modelle|statistische Modelle]], [[Mathematische Modelle|mathematische Modelle]] und [[Synthetische und Explanative Modelle|synthetische / explanative Modelle]]. Jeder dieser Modelltypen besitzt unterschiedliche Merkmale. Statistische Modelle dienen vorwiegend der Beschreibung von Daten bestimmter Fälle. Beispiele, welche innerhalb der einzelnen Artikel erläutert werden, stellen [[Verteilungsmodelle|Verteilungsmodelle]], [[Sequential Sampling Modelle|Sequential Sampling Modelle]] und das [[General Linear Model|GLM]] dar. Mathematische Modelle werden vorwiegend zur Generalisierung und Theoriebildung eingesetzt. Beispiele hierfür finden sich in den Artikeln [[Differentialgleichungsmodelle|„Differentialgleichungsmodelle“]], [[Reinforcement Learning|„Reinforcement Learning“]], [[Kognitive Modelle|„Kognitive Modelle“]] und [[Probabilistische Modelle|„Probabilistische Modelle“]]. Synthetische und explanative Modelle verfolgen das zentrale Ziel, zu erklären, wie Komponenten eines Modells miteinander interagieren, um ein gewünschtes Verhalten hervorzubringen. Dies wird sowohl anhand von [[Neuronale Netze|neuronalen Netzen]] als auch [[Kognitive Architekturen|kognitiven Architekturen]] und [[Agentenmodelle|Agentenmodellen]] erläutert.

Es schließen sich Texte zum Prozess des Fittings und seiner zentralen Themen ([[Objective Functions|Objective Functions]], [[Abweichungsmaße]], [[Algorithmen]], [[Level]]) an. Den Abschluss bilden Informationen zum [[Modellvergleich|Vergleich von Modellen]], welcher sowohl [[Qualitativer Modellvergleich|qualitativ]] als auch [[Quantitativer Modellvergleich|quantitativ]] erfolgen kann.

Viel Spaß und Erfolg beim Lesen, Entdecken und Ausprobieren!

Hauptseite

2018-10-28T15:59:17Z

Schäfer:

<div class="noprint" style="float:right; border:1px solid;width:320px;background-color:#F5F5F5;padding:10px">
{| cellspacing="0"
| style="padding-left:2px;"|'''PROJEKTLEITUNG''' 
[mailto:Stefan.Scherbaum@psychologie.tu-dresden.de Prof. Dr. Stefan Scherbaum] 
[mailto:Matthias.Rudolf@tu-dresden.de Dr. Matthias Rudolf] 
[mailto:Diana.Vogel@tu-dresden.de Diana Vogel] 
Initiatorin: Prof. em. Dr. Bärbel Bergmann

Ein Projekt der [http://tu-dresden.de/die_tu_dresden/fakultaeten/fakultaet_mathematik_und_naturwissenschaften/fachrichtung_psychologie/i1/methpsy Professur Methoden der Psychologie]

'''Autoren''' 
M. Reichert 
T. Schäfer 
P. Wehner 

M. Englisch 
D. Ewert-Altenhain 
P. Lemper 
J. Steffen 

M. Klein 
C. Scholl 
M. Górniak 
J. Petzoldt 
K. Schäfer 
N. Weßels 

'''Technischer Support''' 
F. Leonhardt

|}</div>

Herzlich Willkommen im E-Learning-Modul ''Methoden der Psychologie und Versuchsplanung''

Sie finden hier eine Artikelsammlung zum Einstieg in das Thema ''psychologische Forschungsmethoden'' - sie ist sowohl als begleitende Unterstützung zum ''Modul M1 Methoden der Psychologie'' des Bachelor-Programms Psychologie der TU Dresden als auch als generelles Informationsangebot zum Einstieg in das Thema ausgelegt.

Und nun viel Spaß bei der Wissenserweiterung,
 Ihr E-Learning Team

[[Datei:Puzzle_Methoden.PNG|center|650px]]

----

''Als Lernpause oder zur Überprüfung, ob die Begriffskenntnis inzwischen ausreichend ausgeprägt ist, empfehlen wir [[Methoden-Blödelei|dieses]] Schmankerl.''

Reinforcement Learning

2018-10-12T15:01:16Z

Schäfer: /* RL-Algorithmen */

{{Nav|Navigation|Mathematische Modelle|Kognitive Modellierung|Hauptseite}}

''„Of several responses made to the same situation, those which are accompanied or closely followed by satisfaction to the animal will…be more likely to recur.“''

Dieses von Thorndike bereits im Jahre 1911 postulierte Effekt-Gesetz („Law of Effect“) und die darauf aufbauenden Prinzipien der instrumentellen Konditionierung besitzen noch heute beträchtliche Erklärungskraft und sind aktuell in Form von sog. Reinforcement Learning Models (Modelle verstärkenden Lernens) in der kognitiven und komputationalen Modellierung zu finden. Beim Reinforcement Learning (RL) geht es darum, dass ein Agent (z.B. eine simulierte Versuchsperson) nicht über konkrete Hinweise oder Richtigstellungen lernt, sondern über die Konsequenzen seiner Handlungen. Konsequenzen, sog. Verstärkersignale, sind numerische Belohnungen (oder Bestrafungen), welche den Erfolg eines Handlungsausgangs repräsentieren. Der Agent versucht dabei kontinuierlich zu lernen, welche Handlungen er auswählen muss, um die gesammelte Belohnung über die Zeit zu maximieren.

Die Interaktion des lernenden Agenten mit seiner Umwelt wird dabei als sog. '''Markov-Entscheidungsproblem''' (Markov Decision Problem, MDP) beschrieben:

[[File:RL Schema.png||500px]]

Der Agent kann eine endliche Anzahl an '''Zuständen''' einnehmen. Durch '''Aktionen''' in seiner Umwelt kann er von einem Zustand in nachfolgende Zustände gelangen und dort eine numerische '''Belohnung''' erhalten. Anhand der Belohnungen, die der Agent durch seine Handlungen – also die Wahl von verschiedenen Zuständen ausgehend von dem momentanen Zustand – erhält, bemisst sich für jeden Zustand der Belohnungswert. Die Auswahl von Aktionen erfolgt anhand von sogenannten '''Strategien''' (Policies). Diese Strategien werden zur Maximierung der erwarteten akkumulierten Belohnung (dem '''Gesamtertrag''') kontinuierlich verbessert.

RL versucht eine optimale Strategie zu finden, welche die Gesamtbelohnung über die Zustände hinweg maximiert. Dazu wird eine '''Wertfunktion''' für die jeweilige Strategie erlernt. Diese Funktion beschreibt für jeden eingenommenen Zustand dessen Wert, also wie viel zukünftige Belohnung man erwarten kann, wenn man von diesem Zustand ausgehend verschiedene Aktionen durchführt. Dabei gibt es verschiedene Methoden und Algorithmen, die optimale Wertfunktion und Strategie zu bestimmen z.B. ''„Temporal Difference Learning“'' oder ''„Q-Learning“''.

== RL-Algorithmen ==

'''Temporal Difference (TD) Learning''' eignet sich dafür, die optimale Wertfunktion eines bestimmten Zustands zu bestimmen:

Basierend auf einer Sequenz von Zuständen ''s'' zu den Zeitschritten ''t'' (bis ''T'' ), denen jeweils bestimmte Belohnungen ''r'' folgen:

''st, rt+1, st+1, rt+2, …, rT, sT''

berechnet man die Wertfunktion ''V(s)'' des Zustands ''s'':

''V(s)'' = ''Eπ'' (''Rt'' | ''st'')

''π''(''a'' | ''s'') = ''P'' (''at = a'' | ''st = s'')

Wobei ''π'' die eingesetzte Strategie und ''E'' den Erwartungswert für den in Zukunft erwarteten Gesamtertrag ''Rt'', der von dem Zustand ''st'' ausgeht, darstellen.

Soll die zunehmende Abwertung zeitlich entfernterer Belohnungen berücksichtigt werden, kann dies durch eine sogenannte Discountrate ''γ'' (< 1) repräsentiert werden:
''Rt'' = ''rt+1 + γ1 rt+2 + … + γT-t-1 rT''

RL nimmt an, dass der Wert eines Zustands ''V(s)'' äquivalent zu dem erwarteten Gesamtertrag ''Rt'' ist. Die Aktualisierung der Wertfunktion - das Lernen - erfolgt also durch den Abgleich von ''V(s)'' mit ''Rt'' :

''V(st)neu'' = ''V(st)alt'' + ''α'' [ ''Rt'' – ''V(st)alt'' ]

Die Schrittgröße (oder Lernrate) wird dabei durch ''α'' (oft ''α'' = 1) repräsentiert. Wenn ''V(st)'' den erwarteten Gesamtertrag ''Rt'' korrekt vorhersagt, wird die Aktualisierung der Wertfunktion im Mittel Null betragen und der finale Wert gefunden sein.

Im '''Q-Learning''' wird ergänzend zu den Belohnungs- und Zustandsparametern der Handlungsparameter ''a'' eingeführt, der beim TD Learning nicht spezifiziert war:
''Q''(''s'', ''a'') = ''Eπ'' (''Rt'' | ''st'' , ''at'')

Über ein ähnliches Vorgehen wie beim TD Learning wird ''Q'' approximiert:

''Q(st, at)neu'' = ''Q(st, at)alt'' + ''α'' [ ''rt+1 + γ Q(st+1, at+1) – Q(st, at)'' ]

Über diese Approximation kann zusätzlich zur Wertfunktion der Zustände die optimale Strategie oder Policy für den Zustandsraum ermittelt werden.

== Probleme und Einschränkungen ==

Der RL Ansatz hat trotz seines großen Nutzens für viele Fragestellungen mit mehreren Problemen zu kämpfen, von denen einige hier vorgestellt werden:

* '''Dimensionalität''': Bei der vergleichsweise realistischen Nachstellung realer RL Probleme kann es zu einer großen Anzahl von möglichen Zuständen und Handlungen kommen, die in einer explosionsartigen Menge von Zustands-Handlungs-Kombinationen resultieren.
** Mit Funktionsapproximationen bzw. Interpolationen des Werteraums sowie einer Generalisierung der Wertefunktion wird dieses Problem zu lösen versucht.
* '''Verspätete Belohnungen''': In manchen Zustands-Handlungs-Räumen trifft die Belohnung erst sehr spät ein, d.h., es werden viele Aktionen durchgeführt und Zustände eingenommen, bis die Belohnung erscheint. Dies kann dazu führen, dass nur die Zustände, die der Belohnung zeitlich nahe vorausgehen, in ihrer Wertfunktion beeinflusst werden. Es braucht deshalb viele Schritte bis sich eine verspätete Belohnung auf alle Zustände und Aktionen auswirkt.
** Das Problem wird auf ähnliche Weise wie das Dimensionalitätsproblem gelöst.
* '''Unvollständige Beobachtbarkeit''': In realen Situationen weiß ein Agent oft nicht, in welchem Zustand er sich nach einer bestimmten Handlung exakt befinden wird. Einfache RL-Algorithmen setzen jedoch volle Beobachtbarkeit voraus.
** Dieses Problem wird durch „Partial observable Markov Decision Problems“ (POMDP) Methoden gelöst.
* '''Nicht-stationäre Umwelten''': RL-Algorithmen brauchen etwas Zeit für den Optimierungsprozess. Wenn die Umwelt sich dabei zu schnell verändert, ist das Lernen quasi unmöglich und die Annäherungsmethode schlägt fehl.

== Anwendungen des Reinforcement Learning ==

RL-Algorithmen wie TD Learning werden u.a. als Modelle für dopaminerges Lernen in den Basalganglien verwendet. So kodieren bestimmte dopaminerge Projektionen aus dem Mittelhirn einen Belohnungsvorhersagefehler. Auch das Erlernen von Fähig- und Fertigkeiten bei Menschen wird häufig mit Hilfe von RL modelliert, besonders im Kontext von implizitem Lernen.

So lässt sich mit Hilfe von RL-Modellen auch der Effekt der emotionalen Valenz von Bildern (also ob sie als positiv, neutral oder negativ wahrgenommen werden) auf nachfolgende Entscheidungen überprüfen, wie es [https://www.frontiersin.org/articles/10.3389/fpsyg.2011.00311/full Katahira und Kollegen (2011)] untersucht haben. In ihrer Studie wurden die Versuchspersonen instruiert, in 600 Durchgängen per Knopfdruck einen von zwei Zielreizen (blaues oder grünes Quadrat in der Abbildung unten) zu wählen. Die Entscheidung führte dann je nach ausgewähltem Zielreiz mit einer gewissen Wahrscheinlichkeit (grüne und blaue Pfeile) zu Bild-Outcomes unterschiedlicher Valenz (Neutral, Positiv, Negativ), also ''p''(Valenz|Entscheidung). Zum Beispiel war der grüne Reiz häufiger mit positiven Bildern und der blaue häufiger mit negativen Bildern assoziiert. Diese bedingten Wahrscheinlichkeiten wurden dann aber über die Blöcke hinweg immer wieder verändert. Nach dem Experiment wurde jedes Bild separat auf seine Valenz von den Versuchspersonen eingeschätzt.

[[File:RL Schema2.png||600px]]

Aus Sicht eine Reinforcement Modells stellen in dieser künstlichen Umwelt (dem Experiment) die Bilder die Zustände da, in die der Agent (Versuchsperson) mittels Wahl der blauen oder grünen Quadrate wechseln kann. Die Valenz der Bilder spiegelt den Belohnungs-Outcome wider.

Indem man nun das Verhalten eines solchen Modells an das Verhalten jeder Versuchperson [[Fitting & Parameter Estimation|fitted]], kann man untersuchen wie bestimmte Parameter das Entscheidungsverhalten beeinflussen, wie es sich über die Zeit verändert, je nachdem welche Entscheidung zu welchen Bildern führen. Finden die anfangs naiven Versuchspersonen eine Regel heraus bzw. bleiben sie bei positiven Erfahrungen mit einem Zielreiz konsistent bei dieser Entscheidung? Spiegelt das Entscheidungsverhalten die Valenz der Bilder wieder? Tatsächlich konnte man über das Entscheidungsverhalten mittels des RL-Modells einen Wert für die Bilder bestimmen, der den späteren Valenz-Ratings sehr ähnlich war. (Positive) emotionale Bilder stellen also auch für sich belohnende Reize dar.

Reinforcement Learning

2018-10-12T15:00:17Z

Schäfer:

Aufgaben der Modellierung

2018-10-12T14:57:59Z

Schäfer: /* Erkenntnisziel der Modellierung */

{{Nav|Navigation|Kognitive Modellierung|Hauptseite}}

Viele Dinge, die wir in unserer Umwelt erleben, sind schwierig zu verstehen. Warum zeigt eine Kerzenflamme immer nach oben? Wie kann ein großer Raubvogel so lange in der Luft treiben, ohne die ganze Zeit mit seinen Flügeln schlagen zu müssen? Auch viele Dinge, die wir selbst tun, scheinen uns unerklärlich. Wie kann es sein, dass wir manchmal so viel Ungesundes essen oder in Diskussionen aggressiv werden, obwohl wir wissen, dass es uns später ernsthaft schaden wird? Spontane Erklärungsversuche scheitern häufig an der Komplexität der betrachteten Phänomene. Um mit dieser Komplexität umzugehen, die darunterliegenden Prozesse besser zu verstehen und damit diejenigen Fragen zu beantworten, die uns Menschen beschäftigen, entwerfen Wissenschaftler Theorien und damit (mindestens [[Modelltypen|verbale]]) Modelle.

Laut Dörner (1994) ist ein Modell „eine Replikation eines Realitätsausschnitts, sein Abbild.“ Ein reales System (Urbild) wird demnach durch die Fokussierung auf wesentliche Merkmale und Relationen vereinfacht als Modell (Abbild) dargestellt. Die Trennung von Wesentlichem und Unwesentlichem (unwichtige Details) ist ein zentraler Schritt der Modellbildung und führt zur Reduktion von Komplexität. Diese Trennung ist abhängig vom jeweiligen Erkenntnisinteresse, also welche Fragen durch das Modell beantwortet werden sollen.

Die folgende Abbildung veranschaulicht den Prozess der Modellierung:

[[File:Aufgaben-Modellierung Schema1.png||600px]]

Ausgangspunkt jeder empirischen Wissenschaft und damit auch der Psychologie und ihrer Modelle ist eine reale Situation oder ein reales System, das eine Frage aufwirft. Geht man [[Induktion|induktiv]] an den Prozess heran, muss man das System in den Blick nehmen und Informationen (Daten) darüber sammeln, entweder durch Beobachtung oder im Rahmen eines Experiments. Aus der Analyse dieser Systemdaten kann man anschließend ein Modell entwickeln, welches das System am besten beschreibt. Hat man ein solches Modell, kann man aus ihm wiederum Schlussfolgerungen auf zu erwartende Daten ziehen ([[Deduktion|Deduktion]]) und so das Modell prüfen. In der Psychologie ist dies der normale [[Forschungsvorgehen|Forschungsprozess]] und das gebildete abstrakte Modell entspricht in der Regel einer verbalen [[Theorien|Theorie]].

Der Prozess der [[Vorteile formaler Modelle|Formalisierung]] besteht nun darin, aus dem abstrakten Modell ein formales Modell, und damit meistens ein Simulationsmodell abzuleiten. Um diese Modellbildung zu vollziehen, ist eine Strukturierung und Idealisierung des Systems notwendig. Ein Simulationsmodell erlaubt es dann in Computersimulationen Daten zu generieren, also Hypothesen über erwartetes Verhalten des echten Systems abzuleiten und diese dann zu vergleichen. Im Gegensatz zu verbalen Vorhersagen können diese generierten Daten u.U. eine höhere Präzision aufweisen. Durch den Vergleich der simulierten Modelldaten und der empirisch erhobenen Systemdaten können Rückschlüsse auf die Validität (= Gültigkeit) der entwickelten Modelle getroffen werden. Das Simulationsmodell kann aber auch genutzt werden, um die innere Schlüssigkeit der abstrakten Modellannahmen zu verifizieren oder zu falsifizieren (proof-of-concept).

Je nach Ergebnis der Validierung durch den Vergleich von Modelldaten und echten Daten oder durch den proof-of-concept müssen ggf. die Annahmen des abstrakten Modells oder des Simulationsmodells verbessert werden. Das daraus resultierende aktualisierte Modell wird im Anschluss erneut validiert. Dieser kreislaufartige Prozess wird so lange durchlaufen, bis er ein zufriedenstellendes Ergebnis liefert.

== Erkenntnisziel der Modellierung ==

[[File:Aufgaben-Modellierung Schema2.png||500px]]

Modelle sollen reale Systeme vereinfacht abbilden. Die genaue Relation des Modells zum realen System ist dabei zunächst unbekannt, d.h. wir wissen nicht ohne weiteres, ob unser Modell ein gutes Abbild darstellt. Um diese Frage zu lösen, hilft es, das Realsystem (z.B. ein sich verhaltender Mensch oder ein Gehirn) als einen uns unbekannten datengenerierenden Prozess zu verstehen – eine Blackbox sozusagen, in die wir nicht hineinsehen können. Dieser Prozess erzeugt Daten (Verhalten, neuronale Aktivität) bzw. wir messen Daten, die die Blackbox hervorbringt. Da wir Daten nicht im leeren Raum messen, erhalten wir die relevanten Informationen aus dem datengenerierenden Prozess immer unter bestimmten Randbedingungen, z.B. einem kontrollierten experimentellen Setup.

Wenn wir nun zu einem inneren Verständnis des datengenerierenden Prozesses kommen wollen, können wir ein Modell erstellen, welches selbst über bestimmte Randbedingungen (Festlegung von Modell-Parametern, simulierte Aufgabe/Experiment) Daten generiert (simuliertes Verhalten, simulierte neuronale Aktivität). Diese simulierten Daten können wir dann mit den Daten des echten, uns unbekannten Prozesses vergleichen, sei es qualitativ - über bestimmte Verhaltensmuster - oder quantitativ - über den sogenannten [[Fitting & Parameter Estimation|Fit]]. Durch diesen Vergleich können wir Rückschlüsse darauf ziehen, ob zwischen datengenierendem Prozess und Modell eine gültige Modellrelation besteht – das Modell also den Prozess angemessen abbildet. Über weitere Variationen der Randbedingung und anschließende weitere Simulationen können uns Modelle sogar neuartige Ergebnisse liefern, die wir durch die Manipulation der Randbedingungen des datengenerierenden Prozesses an realen Daten überprüfen können. Modelle ermöglichen uns also, neue Vorhersagen aus simulierten Experimenten zu treffen und diese dann in realen Experimenten zu überprüfen.

Hauptseite

2018-10-12T14:57:07Z

Schäfer:

<div class="noprint" style="float:right; border:1px solid;width:320px;background-color:#F5F5F5;padding:10px">
{| cellspacing="0"
| style="padding-left:2px;"|'''PROJEKTLEITUNG''' 
[mailto:Stefan.Scherbaum@psychologie.tu-dresden.de Prof. Dr. Stefan Scherbaum] 
[mailto:Matthias.Rudolf@tu-dresden.de Dr. Matthias Rudolf] 
[mailto:Diana.Vogel@tu-dresden.de Diana Vogel] 
Initiatorin: Prof. em. Dr. Bärbel Bergmann

Ein Projekt der [http://tu-dresden.de/die_tu_dresden/fakultaeten/fakultaet_mathematik_und_naturwissenschaften/fachrichtung_psychologie/i1/methpsy Professur Methoden der Psychologie]

'''Autoren''' 
M. Reichert 
T. Schäfer 
P. Wehner 

M. Englisch 
D. Ewert-Altenhain 
P. Lemper 
J. Steffen 

M. Klein 
C. Scholl 
M. Górniak 
J. Petzoldt 
K. Schäfer 
N. Weßels 

'''Technischer Support''' 
F. Leonhardt

|}</div>

Herzlich Willkommen im E-Learning-Modul ''Methoden der Psychologie und Versuchsplanung''

Sie finden hier eine Artikelsammlung zum Einstieg in das Thema ''psychologische Forschungsmethoden'' - sie ist sowohl als begleitende Unterstützung zum ''Modul M1 Methoden der Psychologie'' des Bachelor-Programms Psychologie der TU Dresden als auch als generelles Informationsangebot zum Einstieg in das Thema ausgelegt.

Und nun viel Spaß bei der Wissenserweiterung,
 Ihr E-Learning Team

[[Datei:Puzzle.png|center|600px]]

----

''Als Lernpause oder zur Überprüfung, ob die Begriffskenntnis inzwischen ausreichend ausgeprägt ist, empfehlen wir [[Methoden-Blödelei|dieses]] Schmankerl.''

Dynamische Attraktormodelle

2018-10-10T12:55:11Z

Schäfer:

{{Nav|Navigation|Mathematische Modelle|Kognitive Modellierung|Hauptseite}}

Differentialgleichungen werden häufig dafür verwendet, das Verhalten von dynamischen Systemen zu beschreiben. Unter dynamischen Systemen versteht man mathematische Modelle von zeitabhängigen Prozessen, in denen die weitere Entwicklung des Systems vom jeweiligen Anfangszustand abhängt. Mit ihnen kann man bspw. die Bewegung eines Pendels, Klima- oder Populationsveränderungen inklusive Räuber-Beute Interaktionen, aber auch kognitive Prozesse der Wahrnehmung und Entscheidung modellieren.

Eine spezielle Gruppe von dynamischen Modellen sind '''Attraktormodelle'''. Systeme mit einem Attraktor weisen eine gewisse Anzahl an Zuständen auf, an die sich ein dynamisches System im Laufe der Zeit annähert und dort schließlich verharrt. Nehmen wir an, ein dynamisches System hat genau eine Variable, die sich über die Zeit so verändert, wie es die entsprechende Differentialgleichung beschreibt. Diese Veränderung wird oft über eine sogenannte '''Potentiallandschaft''' oder Energielandschaft dargestellt. So sieht man in dem Beispieldiagramm unten das Veränderungspotential oder die Energie für jeden möglichen Zustand des Systems, also jeden möglichen Wert der Variable. Der aktuelle Zustand der Variable wird in dieser Potentiallandschaft als rote Kugel repräsentiert. Die Potentiallandschaft selbst gleicht einer Berg-Tal Landschaft und beschreibt, wie sich der aktuelle Zustand laut der Differentialgleichung ändern wird. Intuitiv gelesen bewegt sich der Ball von den Bergen in das nächstgelegene Tal. Wenn der Ball im Tal angekommen ist, spricht man von einem '''stabilen Systemzustand''' – er hat also kein Änderungspotential mehr, im Gegensatz zu den Bergen, bei welchen ein großes Potential zur Veränderung besteht. Stabile Systemzustände können auch komplexere Muster sein, als nur in einem Zustand zu verharren – also z.B. Zyklen von Zuständen. Da der Ball von den Tälern, also den stabilen Zuständen angezogen wird, nennt man diese Zustände auch '''Attraktoren'''.

[[File:Attraktormodelle 01.png|center|400px]]

Typische Attraktoren sind also:
* '''Stabile Fixpunkte''': Das System nähert sich - wenn die Zeit gegen unendlich geht - immer stärker einem bestimmten Endzustand an, indem die Dynamik allmählich nachlässt.
* '''Stabile Zyklen''': Hier ist der Endzustand kein einziger Zustand, sondern eine Abfolge immer gleicher Zustände, die sich periodisch abwechseln (Z.B. Räuber-Beute-Modell)

Das Gegenteil von einem Attraktor – die Bergespitzen sozusagen - nennt man '''Repellor''', also einen Zustand, von dem sich das System wegbewegt.

== Beispiel: Modell von Tuller et al. (1994) ==

Ein Beispiel für ein Attraktormodell aus der Psychologie ist das Wahrnehmungsmodell von Tuller und Kollegen. Sie stellten 1994 ein Modell zur Beschreibung der dynamischen Kategorisierung von gesprochenen Wörtern auf um zum Beispiel erklären zu können, unter welchen Umständen man das Wort „say“ oder „stay“ hört. Dabei verwendeten Sie eine spannende Manipulation: wenn man bei dem Wort „say“ zwischen s und a eine Lücke einbaut, dann hört man unter Umständen das Wort „stay“. Je größer die Lücke, desto stärker wir die Wahrnehmung von „stay“, je kleiner, desto eher hört man „say“. Es gibt also Länge der Lücke, bei der die beiden Wahrnehmungen gleich stark sind. Hier setzt das Modell an. Beide Wahrnehmungen sind in dem Modell potentiell stabile Zustände mit jeweils eigenem Attraktor, wie es in der Potentiallandschaft dargestellt ist.

[[File:Attraktormodelle 02.png|center|600px]]

Die Variable '''Phi''' repräsentiert dabei alle möglichen Zustände, die das System einnehmen kann: also unterschiedliche Grade der eindeutigen Interpretation als „say“ (Phi = -1) oder als „stay“ (Phi = 1). Der Startzustand, also der Zustand in dem Moment, wo man den Stimulus hört, ist neutral (Phi = 0, hier als momentaner Zustand wo die rote Kugel liegt). Das Modell beschreibt nun die Dynamik des Kategorisierungsprozesses über die folgende Gleichung (aus der die gezeigte Potentiallandschaft hergeleitet wird):

[[File:Attraktormodelle 03.png|center|600px]]

Um die Veränderung des Systemzustands über die Zeit berechnen zu können benötigen wir die Ableitung dieser Funktion:

[[File:Attraktormodelle 04.png|center|600px]]

Die Veränderung von Phi über die Zeit können wir dann durch folgende Differentialgleichung beschreiben:

[[File:Attraktormodelle 05.png|center|600px]]

Die Parameter '''k''' und '''s''' sind wesentlich für die Form der Potentiallandschaft: der Parameter k bestimmt, wie stabil die beiden Zustände „say“ und „stay“ relativ zueinander sind. Er spiegelt im obigen Experiment also die Länge der Lücke zwischen den Buchstaben s und a wider. Ist sie kurz, dann ist der Attraktor bei Phi = -1 stärker ausgeprägt, ist sie lang, dann ist der Attraktor bei Phi = 1 stärker ausgeprägt. Der Parameter s bestimmt, wie tief die Attraktoren an sich sind, wie sehr also das System dazu tendiert, den uneindeutigen Input schnell in eine Kategorie einzuteilen, also schnell in einen Attraktor „zu rutschen“.

Dieses Modell kann nun nicht nur zur Modellierung der Kategorisierung von „say“ und „stay“ verwendet werden, sondern auch auf alle anderen mehrdeutigen Stimuli angewandt werden, z.B. die '''Wahrnehmung des Neckerwürfels''':

[[File:Attraktormodelle 06.png|center|400px]]

Auch hier können wir zwei stabile Wahrnehmungszustände annehmen, einen „Ich sehe den Würfel von oben“ (links) und einen „Ich sehe den Würfel von unten“ (rechts). Analog zum „say“-„stay“ Beispiel können wir experimentell bestimmte Kanten des Würfels heller oder dunkler machen, was wieder der Parameter k abbilden würde und zu unterschiedlich tiefen Attraktoren führen würde.

Für ein besseres Verständnis der beiden Parameter steht die Webapp „Mathematische Modelle “ zur Verfügung. Dort ist es möglich den dynamischen Prozess einer perzeptuellen Entscheidung („Welche Seite des Neckerwürfels sehe ich vorne?“) über eine Animation zu beobachten und durch Manipulation diverser Parameter zu beeinflussen, zum Beispiel wie sehr Rauschen den Prozess beeinflusst und wie einfach eine Wahrnehmung durch eine Störung des Prozesses (Perturbation) beeinflusst werden kann.

== Eigenschaften dynamischer Modelle ==

Am Beispiel des Modells von Tuller et al. können wir viele typische Eigenschaften dynamischer Modelle erkennen:

'''Multistabilität''': Es existieren mehrere Attraktoren mit unterschiedlichen Attraktorbecken gleichzeitig, d.h., mehrere Endzustände sind je nach Ausgangszustand möglich.

'''Bifurkation''': Darunter versteht man eine qualitative Zustandsänderung eines nichtlinearen Systems unter dem Einfluss eines Parameters. Ein nichtlineares System hat einen Output (z.B. eine Wahrnehmung oder ein Verhalten), das nicht immer proportional zum Input (z.B. einem Reiz) ist - im Gegensatz zu einem linearen System. Das bedeutet, dass eine Vergrößerung des Inputs mal zu mehr und mal zu weniger Output führt. Daher können diese Systeme ihr Verhalten also sehr stark ändern, obwohl sich der Input nur minimal verändert hat .

Wenn wir z.B. k (den Input) schrittweise erhöhen, im Experiment mit dem Necker-Würfel also die rechten vorderen Kanten des Würfels weniger sichtbar machen, dann verschiebt sich das Gewicht der beiden Attraktoren so, dass der linke Attraktor (Wahrnehmung: „Neckerwürfel von unten“) im Vergleich zum rechten (Wahrnehmung: „Neckerwürfel von oben“) immer stärker wird. Bei einer bestimmten Ausprägung von k (der relativen Sichtbarkeit der verschiedenen Würfelkanten) führt nun jede noch so minimale weitere Änderung des Parameters (also z.B. eine weitere minimale Ausblendung der Würfelkanten) dazu, dass es nur noch ein statt zwei Attraktorbecken gibt (es könnte nur noch eine Richtung des Würfels gesehen werden). Dieser Übergang von einem (multistabilen) System mit 2 Attraktoren zu einem monostabilen System mit nur einem Attraktor bezeichnet man als Bifurkation – ebenso wie die Gegenrichtung, wenn aus einem monostabilen System ein bistabiles System wird.

[[File:Attraktormodelle 07.png|center|600px]]

Das spannende an der Bifurkation ist, dass hier die Nichtlinearität des Systems zum Tragen kommt. Im Vergleich zu den vorherigen Parameterveränderungen, können wir also mit der gleichen Schrittweite das System jetzt in seiner Qualität (ein statt zwei Attraktoren) deutlich verändern. Die Auswirkungen dieser Nichtlinearität und der dadurch entstehenden Bifurkationen spiegelt sich als Verhalten in der sogenannten Hysterese wider.

'''Hysterese''' charakterisiert ein Systemverhalten, bei dem die Ausgangsgröße (z.B. Wahrnehmung oder Verhalten) nicht allein von der Eingangsgröße (z.B. dem Reiz) abhängt, sondern auch vom vorherigen Zustand der Ausgangsgröße (z.B. der Wahrnehmung im letzten Moment). Das System kann also in Abhängigkeit seiner ''Vorgeschichte'' bei gleicher Eingangsgröße mehrere Zustände einnehmen – dies nennt man auch Pfadabhängigkeit; man könnte auch sagen es besitzt ein „Gedächtnis“.

In unserem Beispiel könnten wir im Experiment den Neckerwürfel zunächst mit gleich starken Kanten präsentieren (im Modell k = 0, siehe Abbildung), sodass keine Interpretation sich durchsetzt (der Systemzustand Phi also in der Mitte verharrt). Anschließend könnten wir die oberen rechten Kanten abschwächen (k = 0.4), sodass die „Neckerwürfel von unten“-Interpretation die Überhand gewinnt (d.h. Phi zum linken Attraktor strebt). In einem linearen System würde nun ein Rückgängigmachen dieser Parameteränderung (zurück zu k = 0 bzw. gleich starke Würfelkanten) auch zu einer Rückkehr des Systemzustands zum Anfangszustand führen (also Phi = 0). Da bei nichtlinearen Systemen aber die Vorgeschichte eine zentrale Rolle spielt, kann diese Änderung nicht einfach wieder durch k rückgängig gemacht werden, wie man im untersten Teil der Abbildung sieht. Stattdessen bewegt sich Phi nur minimal zum leicht verschobenen linken Attraktor und die Interpretation „Neckerwürfel von unten“ bleibt trotz mehrdeutiger Präsentation (k = 0) erhalten. Wir können in diesem System also für k = 0 zwei (und in Abhängigkeit des Zeitverlaufs viele weitere) Systemzustände beobachten, auch wenn alle anderen Parameter des Modells konstant gehalten werden.

[[File:Attraktormodelle 08.png|center|500px]]

== Nützliche Links ==

Eine sehr anschauliche Einführung in dynamische Attraktormodelle mit vielen Möglichkeiten zum Ausprobieren bietet die [https://ncase.me/attractors/ Seite] des Videospiel-Designers Nicky Case

Differentialgleichungsmodelle

2018-10-10T12:54:04Z

Schäfer:

{{Nav|Navigation|Mathematische Modelle|Kognitive Modellierung|Hauptseite}}

Viele Prozesse, die modelliert werden sollen, durchlaufen eine zeitliche Entwicklung: Wenn man wie in einem Film sehr viele Einzelbilder des Prozesses nacheinander machen würde, dann könnte man sehen, wie sich der Prozess langsam Schritt für Schritt entwickelt bzw. verändert. Man könnte beim Ansehen der Bilder zu der Annahme kommen, dass jeder Schritt auf den vorherigen Schritten aufbaut, so wie wir beim Denken den Eindruck haben, dass ein Gedanke den nächsten ergibt.

Das mathematische Werkzeug um solche zeitlichen Entwicklungen von Systemen und Prozessen darzustellen sind Differentialgleichungen. Differentialgleichungen sind mathematische Gleichungen, die eine Veränderung (eine Differenz) abbilden. Mathematisch gesprochen: Sie setzen eine bestimmte Funktion mit ihrer Ableitung in Beziehung. Konkret heißt das, dass die Differentialgleichung den Zusammenhang zwischen einer bestimmten Größe zum Zeitpunkt ''t'', und der daraus folgenden Veränderung dieser Größe beschreibt. Den aktuellen Wert bezeichnet man entsprechend mit ''f(t)'', und die Veränderung, besser gesagt die Veränderungsrate dieser Größe mit ''f‘(t)''.

Zum einfacheren Verständnis führen wir im Folgenden Differentialgleichungen anhand von Modellen aus unserer Nachbardisziplin, der Biologie, ein. Diese Modelle sind aufgrund ihres Gegenstandes etwas leichter greifbar als die psychologischen Versionen.

Nehmen wir als einfaches Beispiel das exponentielle Wachstum einer Bakterienkolonie der Größe p=10 zum Startzeitpunkt t0. In einer (sehr künstlichen) hypothetischen Umwelt verdoppeln sich die Bakterien ohne zu sterben zu jedem Zeitschritt t:

[[File:Differential F1.png|center|80px]]

Mathematisch könnte man die Entwicklung der Population in einer exponentiellen Formel zusammenfassen:

[[File:Differential F2.png|center|600px]]

Wir können aber auch das Wachstum von Zeitpunkt zu Zeitpunkt beschreiben, wie wir es beobachtet haben. Dann könnten wir schreiben:

[[File:Differential F3.png|center|600px]]

Von Zeitschritt zu Zeitschritt verdoppelt sich also die Population jeweils. Es könnte sein, dass eine andere Kolonie aber stärker oder schwächer wächst. Um das Modell zu verallgemeinern, können wir die Wachstumsrate, also die bisherige Verdoppelung, mit der Variablen α bezeichnen:

[[File:Differential F4.png|center|600px]]

Bisher haben wir die Zeit in ganzzahligen Schritten „portioniert“. Wenn wir nun die Zeit in kleinere Schritte als 1 aufteilen, dann bezeichnen wir diese Schritte als ∆t. Machen wir diese Schritte immer kleiner, dann betrachten wir die Zeit als kontinuierlich. Mit dieser Veränderung ist der Bakterienzuwachs (über den Faktor α) in einem Zeitintervall ∆t proportional zur Länge dieses Zeitintervalls und der Größe der Population:

[[File:Differential F5.png|center|600px]]

Diese Formel können wir umstellen, um auf der rechten Seite nur noch die Veränderung zu haben:

[[File:Differential F6.png|center|600px]]

Auf der rechten Seite steht jetzt also nur noch, wie sich das System zu einem bestimmten Zeitpunkt verändert, während auf der linken Seite dieser Gleichung der Differenzquotient steht. Für kontinuierliche Zeit, also unendlich kleine Zeitschritte, betrachten wir den Grenzwert für ∆t gegen 0. Das ist nichts anderes als die erste Ableitung, also die Änderung der Population über die (kontinuierliche) Zeit. So erhalten wir die Differentialgleichung

[[File:Differential F7.png|center|600px]]

und damit

[[File:Differential F8.png|center|600px]]

Differentialgleichungen kann man auch ausdrücken als eine Differenz ''d'' pro Zeiteinheit, in unserem Falle also die Differenz ''dp'' pro Zeiteinheit ''dt'':

[[File:Differential F9.png|center|600px]]

Dieser Ausdruck dient dazu, unendlich kleine Unterschiede in den Werten von p und t zu repräsentieren (=> das sogenannte Differential). Um unsere Differentialgleichung zu lösen, müssen wir eine Funktion ''„p(t) = …“'' finden, deren Ableitung unsere Differentialgleichung ergibt.

Ein sehr bekanntes Beispiel für Differentialgleichungsmodelle aus dem Bereich der Psychologie, das Differentialgleichungen nutzt, ist das mit dem Nobelpreis gekrönte [https://de.wikipedia.org/wiki/Hodgkin-Huxley-Modell Hodgkin-Huxley-Modell], welches die Entstehung von Aktionspotentialen in Neuronen beschreibt.

Wie kann man diese Differentialgleichungen nun in der Modellierung nutzen? In der Regel geschieht dies durch Simulation der Gleichungen an einem Computer.

== Simulation ==

Während manche Differentialgleichungen in einfacher Form ausgerechnet (man sagt: gelöst) werden können, ist für viele dieser Gleichungen keine explizite Lösung möglich. Man nähert sich daher der Lösung mittels numerischer Verfahren an – das bedeutet, man simuliert die Gleichung Zeitschritt für Zeitschritt an einem Computer, so wie wir es oben für t = [1,2,3] gezeigt haben. Die Differentialgleichung sagt uns, wie sich eine Größe über die kontinuierliche Zeit verändert, weshalb es möglich ist, die Veränderung der Größe zu simulieren, wenn man sie in mehr oder weniger großen Zeitschritten aktualisiert. Man geht folgendermaßen vor: Man multipliziert die Veränderung des Werts der interessierenden Größe mit der abgelaufenen Zeit und addiert dies zum alten Wert um einen neuen Wert zu bekommen. Der neue Wert wird zum alten Wert und erfährt ebenso eine Veränderung. Je nachdem wie groß die Zeitschritte sind, kann es dabei allerdings zu einer fehlerhaften Annäherung kommen.

Um psychologische Prozesse in ihrer Komplexität und ihren vielen Interaktionen zu modellieren, ist das oben aufgeführte Beispiel des Bakterienwachstums natürlich viel zu einfach. Betrachten wir daher – noch etwas in der Biologie bleibend - ein komplexeres Populationsmodell mit mehreren Ausgangsvariablen, das [https://de.wikipedia.org/wiki/Lotka-Volterra-Regeln Räuber-Beute-Modell von Lotka und Volterra (1925)], welches das obige Bakterienmodell auf den Fall von zwei Arten erweitert (z.B. Hasen und Füchse). Durch ihre Räuber-Beute Beziehung (Fuchs frisst Hase) weißen beide Populationen eine dynamische Kopplung zueinander auf (je mehr Füchse, desto mehr Verluste für die Hasen – je mehr Hasen, desto mehr Erfolg für die Füchse), aber auch jeweils eine Rückkopplung (Hasen haben eine Geburtenrate, Füchse eine Sterberate). In einer vereinfachten Form des Modells kann man also die Veränderung beider Populationen durch folgende Differentialgleichungen beschreiben:

[[File:Differential F10.png|center|600px]]

[[File:Differential F11.png|center|600px]]

Die sehr zu empfehlende [ncase.me Webseite] des Grafikers Nicky Case bietet die Möglichkeit unterschiedliche Modelle nachzubauen, umzuformen und zu simulieren. Unter dem folgenden [https://bit.ly/2R01jyT Link] kann das oben beschriebene Räuber-Beute-Modell ausprobiert und verändert werden (z.B. durch Veränderung der Stärke der Knoten oder Menge der Pfeile). Das Modell sähe grafisch so aus:

[[File:Differential HaseFuchs1.png|center|500px]]

Simuliert man die Räuber-Beute-Dynamik über die Zeit, erhält man – sofern beide Populationen in einem ökologischen Gleichgewicht stehen (z.B. nicht zu viele Füchse oder Hasen am Anfang existieren) - folgenden Verlauf:

[[File:Differential HaseFuchs2.png|center|400px]]

Bei dieser Räuber-Beute Beziehung spricht man auch von einem '''dynamischen System''': man hat mehrere Größen, hier die Population der Hasen und Füchse, die sich gegenseitig beeinflussen (und somit ein System bilden) und so über die Zeit verändern (also dynamisch). Die Veränderungsmusster eines solchen Systems kann man auch in seinem sogenannten Zustandsraum betrachten – also eine Abbildung der Kombination der verschiedenen möglichen Werte, welche die beiden Populationen gleichzeitig annehmen können. Muster, die sich in dieser Darstellung als stabil herausstellen, nennt man Attraktoren oder Gleichgewichtszustände, da das System sozusagen von ihnen angezogen wird und sich in diesen Mustern stabil einfindet.

[[File:Differential HaseFuchs3.png|center|400px]]

In diesem Fall ist dieser Gleichgewichtszustand ein zyklisches Wechseln zwischen einer Mehrheit an Hasen oder Füchsen. Wodurch sich solche dynamischen Systeme charakterisieren und was ein Attraktor ist, erklärt der folgende [[Dynamische Attraktormodelle|Artikel]] mit Beispielen aus der kognitionspsychologischen Forschung ausführlicher.

ACT-R

2018-10-08T17:42:43Z

Schäfer: /* Software */

{{Nav|Navigation|Kognitive Architekturen|Kognitive Modellierung|Hauptseite}}

„''All that there is to intelligence is the simple accrual and tuning of many small units of knowledge that in total produce complex cognition. The whole is no more than the sum of its parts, but it has a lot of parts.''” (John R. Anderson, 1996)

Unter diesem Prinzip erschuf der Psychologe John R. Anderson Mitte der neunziger Jahre die '''Adaptive Control of Thought – Rational''' (ACT-R), eine [[Kognitive Architekturen|kognitive Architektur]], deren Anspruch die Beschreibung und Integration zentraler Grundmechanismen menschlicher Kognition ist. Wie andere kognitive Architekturen funktioniert sie ähnlich einer Programmiersprache, über die wissenschaftliche Hypothesen durch Modellierung von kognitiven Aufgaben, Simulation von Verhaltensdaten und empirischem Abgleich getestet werden können.

== Aufbau und Bestandteile ==

Eine Veranschaulichung der groben Zusammensetzung von ACT-R sowie der neuronalen Implementierung ihrer Bestandteile ist in der folgenden Abbildung zu sehen:

[[File:ACT-R Structure.png|center|550px]]

Wie das Zitat am Anfang nahelegt, löst ACT-R das Problem komplexer Informationsverarbeitung über die Zusammenarbeit mehrerer Einheiten oder '''Module''', jedes dazu bestimmt, eine andere Form von Information zu verarbeiten. Folgende Module sind Teil dieser Architektur (es sind aber auch weitere definiert):
* ''Visuelles Modul'': Identifiziert Objekte im visuellen Feld
* ''Manuelles Modul'': Kontrolliert die Bewegung der Hände
* ''Deklaratives Modul'': Ruft Informationen aus dem Gedächtnis ab
* ''Ziel Modul'': Überwacht und zeichnet momentane Ziele und Intentionen auf

Diese Module werden in ihrer Ausführung durch ein '''Zentrales Produktionssystem''' kontrolliert, welches anschließend ein bestimmtes Verhalten erzeugt. Es kann jedoch auf den Großteil der Modul-Aktivität nicht reagieren. Stattdessen greift das Produktionssystem nur auf eine begrenzte Menge an Informationseinheiten (''Chunks'') aus den Modulen zurück, die in deren '''Zwischenspeichern''' (''Buffer'') gelagert ist. Dieses Prinzip soll menschliche Informationsverarbeitung nachahmen, bei der auch nicht alle Informationen des Langzeitgedächtnisses oder des visuellen Feldes direkt ins Bewusstsein gelangen sondern nur ein kleiner relevanter Teil. Aus den Speichern kann das Produktionssystem Informationsmuster erkennen und ggf. Veränderungen in ihnen hervorrufen. Dabei greift es auf sog. '''Produktionsregeln''' zurück, WENN-DANN Anweisungen, deren Bedingungskomponente (WENN) die aktuelle Belegung bestimmter Speicher ist (z.B. enthält der visuelle Speicher einen Chunk einer gewissen Objektkategorie) und die Aktionskomponente (DANN) Änderungen an den Speichern durchführt (z.B. einen Chunk einfordern, verändern oder löschen), sobald die Bedingung erfüllt ist. Die Veränderungen können anschließend an die Module weitergeleitet werden. Die Speicher jedes Moduls schicken die Informationen also zum Produktionssystem und bekommen Informationen von diesem zurück. So können auch die Module nur über die Informationen kommunizieren, die sie ihren Speichern zur Verfügung stellen.

Das Produktionssystem funktioniert durch drei Schritte: Zuerst sollen Muster erkannt und zum aktuellen Systemzustand passende Produktionsregeln gefunden werden (''Abgleich''). Danach werden ggf. Konflikte erkannt und aufgelöst (''Selektion''). Schließlich folgt die kontrollierte Ausführung der geplanten Aktionen (''Ausführung''). Eine wichtige Funktion der Produktionsregeln liegt in der Aktualisierung der Zwischenspeicher für deren weitere, mit neuem Inhalt versehene Nutzung im nächsten Verarbeitungszyklus. Der Ablauf eines ACT-R Modells verläuft in solchen Zyklen, welche auf 50 ms festgelegt sind. Diese Zahl hat sich auch in anderen Architekturen wie SOAR oder EPIC durchgesetzt.

Die einzelnen Bestandteile der Architektur sind bestimmten '''Hirnregionen''' zugeteilt (siehe Klammern in der obigen Abbildung). Zum Beispiel wird der Ziel-Speicher, der den aktuellen Zustand für die Problemlösung aufrechterhält, mit dem Dorsolateralen Präfrontalen Cortex (DLPFC) assoziiert, dessen Funktionen u.a. die Planung und Organisation motorischer Handlungen, perzeptuelle Integration und Kontrolle des Arbeitsgedächtnisses umfassen. Das Produktionssystem von ACT-R ist eng mit den Basalganglien verknüpft, welche Regulation und Integration wichtiger Funktionen im Bereich der Motorik, Kognition und Emotion erfüllen.

== Beispiel: Deklaratives Modul ==

Die Arbeitsweise der Module soll beispielhaft anhand des deklarativen Moduls veranschaulicht werden:

Die große Menge an Informationen im deklarativen Gedächtnis macht es unmöglich, diese gleichzeitig für die Aufgabenbearbeitung heranzuziehen, zumal viele Chunks irrelevant oder in bestimmten Fällen gar störend sein können. Aus diesem Grund müssen die wichtigsten Informationen ausgewählt werden. Diese Auswahl wird in ACT-R als Chunk-Aktivierung ''Ai'' bezeichnet. Sie ist abhängig von der allgemeinen Nützlichkeit des Chunks für vergangene Problemlösungen Bi und der Relevanz eines Items j im aktuellen Kontext. Letzteres wird beeinflusst durch die Aufmerksamkeitsgewichtung ''wj'' und der Assoziationsstärke des Elements mit dem Chunk ''sij'':

[[File:ACT-R F1.png|center|600px]]

[[File:ACT-R F2.png|center|600px]]

[[File:ACT-R F3.png|center|600px]]

Wobei ''fanj'' die Anzahl der mit dem Element j assoziierten Fakten ist und ''S'' ein in der Regel auf ungefähr 2 festgelegter Parameter.

Die Größe von ''Bi'' richtet sich nach dem Potenzgesetz des Vergessens: Je weiter die letzte Aktivierung ''k'' in der Vergangenheit liegt (tk), desto irrelevanter ein Chunk für die Problemlösung. Dabei ist ''d'' ein Parameter für die Vergessensrate.

[[File:ACT-R F4.png|center|600px]]

Alles in allem ergibt sich also die Aktivierung eines Chunks aus folgender Formel:

[[File:ACT-R F5.png|center|600px]]

Die Chunk-Aktivierung beeinflusst wiederrum die Abrufwahrscheinlichkeit und -verzögerung für diesen Chunk, sofern die Aktivierung eine bestimmte Schwelle überschritten hat.

== Software ==

ACT-R liegt aktuell in der Version 7 vor und kann für Windows und Mac OS als [http://act-r.psy.cmu.edu/software/ Standalone-Anwendung] direkt verwendet werden. Die Oberfläche von ACT-R 7 besteht aus mehreren getrennten Fenstern, von denen in der unteren Abbildung links das ''Control Panel'' (Zugang zu ACT-R Funktionen), rechts oben der ''Stepper'' (Schritt-für-Schritt Ausführung eines Modells) und rechts unten der ''Listener'' (Konsole für Ausgabe von Statusinformationen und Eingabe von Befehlen) für das Modell „addition“ aufgeführt werden.

[[File:ACT-R Software.png|center|600px]]

== Zusammenfassung ==

Kognitive Architekturen wie ACT-R zeigen, wie man unterschiedliche Aspekte der Informationsverarbeitung in ein globaleres Modell integrieren und durch Simulationen quantitative Werte daraus gewinnen kann, die sich direkt mit den Messungen aus empirischen Studienvergleichen lassen. Auch lässt sich dieser Ansatz innerhalb eines großen Spektrums von Problemen einsetzen, allerdings mit den derzeitigen Versionen allerdings nur für relativ einfache Mechanismen, wie die Buchstabenerkennung.

ACT-R

2018-10-08T17:42:26Z

Schäfer: /* Aufbau und Bestandteile */

{{Nav|Navigation|Kognitive Architekturen|Kognitive Modellierung|Hauptseite}}

„''All that there is to intelligence is the simple accrual and tuning of many small units of knowledge that in total produce complex cognition. The whole is no more than the sum of its parts, but it has a lot of parts.''” (John R. Anderson, 1996)

Unter diesem Prinzip erschuf der Psychologe John R. Anderson Mitte der neunziger Jahre die '''Adaptive Control of Thought – Rational''' (ACT-R), eine [[Kognitive Architekturen|kognitive Architektur]], deren Anspruch die Beschreibung und Integration zentraler Grundmechanismen menschlicher Kognition ist. Wie andere kognitive Architekturen funktioniert sie ähnlich einer Programmiersprache, über die wissenschaftliche Hypothesen durch Modellierung von kognitiven Aufgaben, Simulation von Verhaltensdaten und empirischem Abgleich getestet werden können.

== Aufbau und Bestandteile ==

Eine Veranschaulichung der groben Zusammensetzung von ACT-R sowie der neuronalen Implementierung ihrer Bestandteile ist in der folgenden Abbildung zu sehen:

[[File:ACT-R Structure.png|center|550px]]

Wie das Zitat am Anfang nahelegt, löst ACT-R das Problem komplexer Informationsverarbeitung über die Zusammenarbeit mehrerer Einheiten oder '''Module''', jedes dazu bestimmt, eine andere Form von Information zu verarbeiten. Folgende Module sind Teil dieser Architektur (es sind aber auch weitere definiert):
* ''Visuelles Modul'': Identifiziert Objekte im visuellen Feld
* ''Manuelles Modul'': Kontrolliert die Bewegung der Hände
* ''Deklaratives Modul'': Ruft Informationen aus dem Gedächtnis ab
* ''Ziel Modul'': Überwacht und zeichnet momentane Ziele und Intentionen auf

Diese Module werden in ihrer Ausführung durch ein '''Zentrales Produktionssystem''' kontrolliert, welches anschließend ein bestimmtes Verhalten erzeugt. Es kann jedoch auf den Großteil der Modul-Aktivität nicht reagieren. Stattdessen greift das Produktionssystem nur auf eine begrenzte Menge an Informationseinheiten (''Chunks'') aus den Modulen zurück, die in deren '''Zwischenspeichern''' (''Buffer'') gelagert ist. Dieses Prinzip soll menschliche Informationsverarbeitung nachahmen, bei der auch nicht alle Informationen des Langzeitgedächtnisses oder des visuellen Feldes direkt ins Bewusstsein gelangen sondern nur ein kleiner relevanter Teil. Aus den Speichern kann das Produktionssystem Informationsmuster erkennen und ggf. Veränderungen in ihnen hervorrufen. Dabei greift es auf sog. '''Produktionsregeln''' zurück, WENN-DANN Anweisungen, deren Bedingungskomponente (WENN) die aktuelle Belegung bestimmter Speicher ist (z.B. enthält der visuelle Speicher einen Chunk einer gewissen Objektkategorie) und die Aktionskomponente (DANN) Änderungen an den Speichern durchführt (z.B. einen Chunk einfordern, verändern oder löschen), sobald die Bedingung erfüllt ist. Die Veränderungen können anschließend an die Module weitergeleitet werden. Die Speicher jedes Moduls schicken die Informationen also zum Produktionssystem und bekommen Informationen von diesem zurück. So können auch die Module nur über die Informationen kommunizieren, die sie ihren Speichern zur Verfügung stellen.

Das Produktionssystem funktioniert durch drei Schritte: Zuerst sollen Muster erkannt und zum aktuellen Systemzustand passende Produktionsregeln gefunden werden (''Abgleich''). Danach werden ggf. Konflikte erkannt und aufgelöst (''Selektion''). Schließlich folgt die kontrollierte Ausführung der geplanten Aktionen (''Ausführung''). Eine wichtige Funktion der Produktionsregeln liegt in der Aktualisierung der Zwischenspeicher für deren weitere, mit neuem Inhalt versehene Nutzung im nächsten Verarbeitungszyklus. Der Ablauf eines ACT-R Modells verläuft in solchen Zyklen, welche auf 50 ms festgelegt sind. Diese Zahl hat sich auch in anderen Architekturen wie SOAR oder EPIC durchgesetzt.

Die einzelnen Bestandteile der Architektur sind bestimmten '''Hirnregionen''' zugeteilt (siehe Klammern in der obigen Abbildung). Zum Beispiel wird der Ziel-Speicher, der den aktuellen Zustand für die Problemlösung aufrechterhält, mit dem Dorsolateralen Präfrontalen Cortex (DLPFC) assoziiert, dessen Funktionen u.a. die Planung und Organisation motorischer Handlungen, perzeptuelle Integration und Kontrolle des Arbeitsgedächtnisses umfassen. Das Produktionssystem von ACT-R ist eng mit den Basalganglien verknüpft, welche Regulation und Integration wichtiger Funktionen im Bereich der Motorik, Kognition und Emotion erfüllen.

== Beispiel: Deklaratives Modul ==

Die Arbeitsweise der Module soll beispielhaft anhand des deklarativen Moduls veranschaulicht werden:

Die große Menge an Informationen im deklarativen Gedächtnis macht es unmöglich, diese gleichzeitig für die Aufgabenbearbeitung heranzuziehen, zumal viele Chunks irrelevant oder in bestimmten Fällen gar störend sein können. Aus diesem Grund müssen die wichtigsten Informationen ausgewählt werden. Diese Auswahl wird in ACT-R als Chunk-Aktivierung ''Ai'' bezeichnet. Sie ist abhängig von der allgemeinen Nützlichkeit des Chunks für vergangene Problemlösungen Bi und der Relevanz eines Items j im aktuellen Kontext. Letzteres wird beeinflusst durch die Aufmerksamkeitsgewichtung ''wj'' und der Assoziationsstärke des Elements mit dem Chunk ''sij'':

[[File:ACT-R F1.png|center|600px]]

[[File:ACT-R F2.png|center|600px]]

[[File:ACT-R F3.png|center|600px]]

Wobei ''fanj'' die Anzahl der mit dem Element j assoziierten Fakten ist und ''S'' ein in der Regel auf ungefähr 2 festgelegter Parameter.

Die Größe von ''Bi'' richtet sich nach dem Potenzgesetz des Vergessens: Je weiter die letzte Aktivierung ''k'' in der Vergangenheit liegt (tk), desto irrelevanter ein Chunk für die Problemlösung. Dabei ist ''d'' ein Parameter für die Vergessensrate.

[[File:ACT-R F4.png|center|600px]]

Alles in allem ergibt sich also die Aktivierung eines Chunks aus folgender Formel:

[[File:ACT-R F5.png|center|600px]]

Die Chunk-Aktivierung beeinflusst wiederrum die Abrufwahrscheinlichkeit und -verzögerung für diesen Chunk, sofern die Aktivierung eine bestimmte Schwelle überschritten hat.

== Software ==

ACT-R liegt aktuell in der Version 7 vor und kann für Windows und Mac OS als [http://act-r.psy.cmu.edu/software/ Standalone-Anwendung] direkt verwendet werden. Die Oberfläche von ACT-R 7 besteht aus mehreren getrennten Fenstern, von denen in der unteren Abbildung links das ''Control Panel'' (Zugang zu ACT-R Funktionen), rechts oben der ''Stepper'' (Schritt-für-Schritt Ausführung eines Modells) und rechts unten der ''Listener'' (Konsole für Ausgabe von Statusinformationen und Eingabe von Befehlen) für das Modell „addition“ aufgeführt werden.

[[File:ACT-R Software.png||600px]]

== Zusammenfassung ==

Kognitive Architekturen wie ACT-R zeigen, wie man unterschiedliche Aspekte der Informationsverarbeitung in ein globaleres Modell integrieren und durch Simulationen quantitative Werte daraus gewinnen kann, die sich direkt mit den Messungen aus empirischen Studienvergleichen lassen. Auch lässt sich dieser Ansatz innerhalb eines großen Spektrums von Problemen einsetzen, allerdings mit den derzeitigen Versionen allerdings nur für relativ einfache Mechanismen, wie die Buchstabenerkennung.

ACT-R

2018-10-08T17:42:05Z

Schäfer: /* Aufbau und Bestandteile */

{{Nav|Navigation|Kognitive Architekturen|Kognitive Modellierung|Hauptseite}}

„''All that there is to intelligence is the simple accrual and tuning of many small units of knowledge that in total produce complex cognition. The whole is no more than the sum of its parts, but it has a lot of parts.''” (John R. Anderson, 1996)

Unter diesem Prinzip erschuf der Psychologe John R. Anderson Mitte der neunziger Jahre die '''Adaptive Control of Thought – Rational''' (ACT-R), eine [[Kognitive Architekturen|kognitive Architektur]], deren Anspruch die Beschreibung und Integration zentraler Grundmechanismen menschlicher Kognition ist. Wie andere kognitive Architekturen funktioniert sie ähnlich einer Programmiersprache, über die wissenschaftliche Hypothesen durch Modellierung von kognitiven Aufgaben, Simulation von Verhaltensdaten und empirischem Abgleich getestet werden können.

== Aufbau und Bestandteile ==

Eine Veranschaulichung der groben Zusammensetzung von ACT-R sowie der neuronalen Implementierung ihrer Bestandteile ist in der folgenden Abbildung zu sehen:

[[File:ACT-R Structure.png|center|500px]]

Wie das Zitat am Anfang nahelegt, löst ACT-R das Problem komplexer Informationsverarbeitung über die Zusammenarbeit mehrerer Einheiten oder '''Module''', jedes dazu bestimmt, eine andere Form von Information zu verarbeiten. Folgende Module sind Teil dieser Architektur (es sind aber auch weitere definiert):
* ''Visuelles Modul'': Identifiziert Objekte im visuellen Feld
* ''Manuelles Modul'': Kontrolliert die Bewegung der Hände
* ''Deklaratives Modul'': Ruft Informationen aus dem Gedächtnis ab
* ''Ziel Modul'': Überwacht und zeichnet momentane Ziele und Intentionen auf

Diese Module werden in ihrer Ausführung durch ein '''Zentrales Produktionssystem''' kontrolliert, welches anschließend ein bestimmtes Verhalten erzeugt. Es kann jedoch auf den Großteil der Modul-Aktivität nicht reagieren. Stattdessen greift das Produktionssystem nur auf eine begrenzte Menge an Informationseinheiten (''Chunks'') aus den Modulen zurück, die in deren '''Zwischenspeichern''' (''Buffer'') gelagert ist. Dieses Prinzip soll menschliche Informationsverarbeitung nachahmen, bei der auch nicht alle Informationen des Langzeitgedächtnisses oder des visuellen Feldes direkt ins Bewusstsein gelangen sondern nur ein kleiner relevanter Teil. Aus den Speichern kann das Produktionssystem Informationsmuster erkennen und ggf. Veränderungen in ihnen hervorrufen. Dabei greift es auf sog. '''Produktionsregeln''' zurück, WENN-DANN Anweisungen, deren Bedingungskomponente (WENN) die aktuelle Belegung bestimmter Speicher ist (z.B. enthält der visuelle Speicher einen Chunk einer gewissen Objektkategorie) und die Aktionskomponente (DANN) Änderungen an den Speichern durchführt (z.B. einen Chunk einfordern, verändern oder löschen), sobald die Bedingung erfüllt ist. Die Veränderungen können anschließend an die Module weitergeleitet werden. Die Speicher jedes Moduls schicken die Informationen also zum Produktionssystem und bekommen Informationen von diesem zurück. So können auch die Module nur über die Informationen kommunizieren, die sie ihren Speichern zur Verfügung stellen.

Das Produktionssystem funktioniert durch drei Schritte: Zuerst sollen Muster erkannt und zum aktuellen Systemzustand passende Produktionsregeln gefunden werden (''Abgleich''). Danach werden ggf. Konflikte erkannt und aufgelöst (''Selektion''). Schließlich folgt die kontrollierte Ausführung der geplanten Aktionen (''Ausführung''). Eine wichtige Funktion der Produktionsregeln liegt in der Aktualisierung der Zwischenspeicher für deren weitere, mit neuem Inhalt versehene Nutzung im nächsten Verarbeitungszyklus. Der Ablauf eines ACT-R Modells verläuft in solchen Zyklen, welche auf 50 ms festgelegt sind. Diese Zahl hat sich auch in anderen Architekturen wie SOAR oder EPIC durchgesetzt.

Die einzelnen Bestandteile der Architektur sind bestimmten '''Hirnregionen''' zugeteilt (siehe Klammern in der obigen Abbildung). Zum Beispiel wird der Ziel-Speicher, der den aktuellen Zustand für die Problemlösung aufrechterhält, mit dem Dorsolateralen Präfrontalen Cortex (DLPFC) assoziiert, dessen Funktionen u.a. die Planung und Organisation motorischer Handlungen, perzeptuelle Integration und Kontrolle des Arbeitsgedächtnisses umfassen. Das Produktionssystem von ACT-R ist eng mit den Basalganglien verknüpft, welche Regulation und Integration wichtiger Funktionen im Bereich der Motorik, Kognition und Emotion erfüllen.

== Beispiel: Deklaratives Modul ==

Die Arbeitsweise der Module soll beispielhaft anhand des deklarativen Moduls veranschaulicht werden:

Die große Menge an Informationen im deklarativen Gedächtnis macht es unmöglich, diese gleichzeitig für die Aufgabenbearbeitung heranzuziehen, zumal viele Chunks irrelevant oder in bestimmten Fällen gar störend sein können. Aus diesem Grund müssen die wichtigsten Informationen ausgewählt werden. Diese Auswahl wird in ACT-R als Chunk-Aktivierung ''Ai'' bezeichnet. Sie ist abhängig von der allgemeinen Nützlichkeit des Chunks für vergangene Problemlösungen Bi und der Relevanz eines Items j im aktuellen Kontext. Letzteres wird beeinflusst durch die Aufmerksamkeitsgewichtung ''wj'' und der Assoziationsstärke des Elements mit dem Chunk ''sij'':

[[File:ACT-R F1.png|center|600px]]

[[File:ACT-R F2.png|center|600px]]

[[File:ACT-R F3.png|center|600px]]

Wobei ''fanj'' die Anzahl der mit dem Element j assoziierten Fakten ist und ''S'' ein in der Regel auf ungefähr 2 festgelegter Parameter.

Die Größe von ''Bi'' richtet sich nach dem Potenzgesetz des Vergessens: Je weiter die letzte Aktivierung ''k'' in der Vergangenheit liegt (tk), desto irrelevanter ein Chunk für die Problemlösung. Dabei ist ''d'' ein Parameter für die Vergessensrate.

[[File:ACT-R F4.png|center|600px]]

Alles in allem ergibt sich also die Aktivierung eines Chunks aus folgender Formel:

[[File:ACT-R F5.png|center|600px]]

Die Chunk-Aktivierung beeinflusst wiederrum die Abrufwahrscheinlichkeit und -verzögerung für diesen Chunk, sofern die Aktivierung eine bestimmte Schwelle überschritten hat.

== Software ==

ACT-R liegt aktuell in der Version 7 vor und kann für Windows und Mac OS als [http://act-r.psy.cmu.edu/software/ Standalone-Anwendung] direkt verwendet werden. Die Oberfläche von ACT-R 7 besteht aus mehreren getrennten Fenstern, von denen in der unteren Abbildung links das ''Control Panel'' (Zugang zu ACT-R Funktionen), rechts oben der ''Stepper'' (Schritt-für-Schritt Ausführung eines Modells) und rechts unten der ''Listener'' (Konsole für Ausgabe von Statusinformationen und Eingabe von Befehlen) für das Modell „addition“ aufgeführt werden.

[[File:ACT-R Software.png||600px]]

== Zusammenfassung ==

Kognitive Architekturen wie ACT-R zeigen, wie man unterschiedliche Aspekte der Informationsverarbeitung in ein globaleres Modell integrieren und durch Simulationen quantitative Werte daraus gewinnen kann, die sich direkt mit den Messungen aus empirischen Studienvergleichen lassen. Auch lässt sich dieser Ansatz innerhalb eines großen Spektrums von Problemen einsetzen, allerdings mit den derzeitigen Versionen allerdings nur für relativ einfache Mechanismen, wie die Buchstabenerkennung.

ACT-R

2018-10-08T17:40:44Z

Schäfer:

{{Nav|Navigation|Kognitive Architekturen|Kognitive Modellierung|Hauptseite}}

„''All that there is to intelligence is the simple accrual and tuning of many small units of knowledge that in total produce complex cognition. The whole is no more than the sum of its parts, but it has a lot of parts.''” (John R. Anderson, 1996)

Unter diesem Prinzip erschuf der Psychologe John R. Anderson Mitte der neunziger Jahre die '''Adaptive Control of Thought – Rational''' (ACT-R), eine [[Kognitive Architekturen|kognitive Architektur]], deren Anspruch die Beschreibung und Integration zentraler Grundmechanismen menschlicher Kognition ist. Wie andere kognitive Architekturen funktioniert sie ähnlich einer Programmiersprache, über die wissenschaftliche Hypothesen durch Modellierung von kognitiven Aufgaben, Simulation von Verhaltensdaten und empirischem Abgleich getestet werden können.

== Aufbau und Bestandteile ==

Eine Veranschaulichung der groben Zusammensetzung von ACT-R sowie der neuronalen Implementierung ihrer Bestandteile ist in der folgenden Abbildung zu sehen:

[[File:ACT-R Structure.png||600px]]

Wie das Zitat am Anfang nahelegt, löst ACT-R das Problem komplexer Informationsverarbeitung über die Zusammenarbeit mehrerer Einheiten oder '''Module''', jedes dazu bestimmt, eine andere Form von Information zu verarbeiten. Folgende Module sind Teil dieser Architektur (es sind aber auch weitere definiert):
* ''Visuelles Modul'': Identifiziert Objekte im visuellen Feld
* ''Manuelles Modul'': Kontrolliert die Bewegung der Hände
* ''Deklaratives Modul'': Ruft Informationen aus dem Gedächtnis ab
* ''Ziel Modul'': Überwacht und zeichnet momentane Ziele und Intentionen auf

Diese Module werden in ihrer Ausführung durch ein '''Zentrales Produktionssystem''' kontrolliert, welches anschließend ein bestimmtes Verhalten erzeugt. Es kann jedoch auf den Großteil der Modul-Aktivität nicht reagieren. Stattdessen greift das Produktionssystem nur auf eine begrenzte Menge an Informationseinheiten (''Chunks'') aus den Modulen zurück, die in deren '''Zwischenspeichern''' (''Buffer'') gelagert ist. Dieses Prinzip soll menschliche Informationsverarbeitung nachahmen, bei der auch nicht alle Informationen des Langzeitgedächtnisses oder des visuellen Feldes direkt ins Bewusstsein gelangen sondern nur ein kleiner relevanter Teil. Aus den Speichern kann das Produktionssystem Informationsmuster erkennen und ggf. Veränderungen in ihnen hervorrufen. Dabei greift es auf sog. '''Produktionsregeln''' zurück, WENN-DANN Anweisungen, deren Bedingungskomponente (WENN) die aktuelle Belegung bestimmter Speicher ist (z.B. enthält der visuelle Speicher einen Chunk einer gewissen Objektkategorie) und die Aktionskomponente (DANN) Änderungen an den Speichern durchführt (z.B. einen Chunk einfordern, verändern oder löschen), sobald die Bedingung erfüllt ist. Die Veränderungen können anschließend an die Module weitergeleitet werden. Die Speicher jedes Moduls schicken die Informationen also zum Produktionssystem und bekommen Informationen von diesem zurück. So können auch die Module nur über die Informationen kommunizieren, die sie ihren Speichern zur Verfügung stellen.

Das Produktionssystem funktioniert durch drei Schritte: Zuerst sollen Muster erkannt und zum aktuellen Systemzustand passende Produktionsregeln gefunden werden (''Abgleich''). Danach werden ggf. Konflikte erkannt und aufgelöst (''Selektion''). Schließlich folgt die kontrollierte Ausführung der geplanten Aktionen (''Ausführung''). Eine wichtige Funktion der Produktionsregeln liegt in der Aktualisierung der Zwischenspeicher für deren weitere, mit neuem Inhalt versehene Nutzung im nächsten Verarbeitungszyklus. Der Ablauf eines ACT-R Modells verläuft in solchen Zyklen, welche auf 50 ms festgelegt sind. Diese Zahl hat sich auch in anderen Architekturen wie SOAR oder EPIC durchgesetzt.

Die einzelnen Bestandteile der Architektur sind bestimmten '''Hirnregionen''' zugeteilt (siehe Klammern in der obigen Abbildung). Zum Beispiel wird der Ziel-Speicher, der den aktuellen Zustand für die Problemlösung aufrechterhält, mit dem Dorsolateralen Präfrontalen Cortex (DLPFC) assoziiert, dessen Funktionen u.a. die Planung und Organisation motorischer Handlungen, perzeptuelle Integration und Kontrolle des Arbeitsgedächtnisses umfassen. Das Produktionssystem von ACT-R ist eng mit den Basalganglien verknüpft, welche Regulation und Integration wichtiger Funktionen im Bereich der Motorik, Kognition und Emotion erfüllen.

== Beispiel: Deklaratives Modul ==

Die Arbeitsweise der Module soll beispielhaft anhand des deklarativen Moduls veranschaulicht werden:

Die große Menge an Informationen im deklarativen Gedächtnis macht es unmöglich, diese gleichzeitig für die Aufgabenbearbeitung heranzuziehen, zumal viele Chunks irrelevant oder in bestimmten Fällen gar störend sein können. Aus diesem Grund müssen die wichtigsten Informationen ausgewählt werden. Diese Auswahl wird in ACT-R als Chunk-Aktivierung ''Ai'' bezeichnet. Sie ist abhängig von der allgemeinen Nützlichkeit des Chunks für vergangene Problemlösungen Bi und der Relevanz eines Items j im aktuellen Kontext. Letzteres wird beeinflusst durch die Aufmerksamkeitsgewichtung ''wj'' und der Assoziationsstärke des Elements mit dem Chunk ''sij'':

[[File:ACT-R F1.png|center|600px]]

[[File:ACT-R F2.png|center|600px]]

[[File:ACT-R F3.png|center|600px]]

Wobei ''fanj'' die Anzahl der mit dem Element j assoziierten Fakten ist und ''S'' ein in der Regel auf ungefähr 2 festgelegter Parameter.

Die Größe von ''Bi'' richtet sich nach dem Potenzgesetz des Vergessens: Je weiter die letzte Aktivierung ''k'' in der Vergangenheit liegt (tk), desto irrelevanter ein Chunk für die Problemlösung. Dabei ist ''d'' ein Parameter für die Vergessensrate.

[[File:ACT-R F4.png|center|600px]]

Alles in allem ergibt sich also die Aktivierung eines Chunks aus folgender Formel:

[[File:ACT-R F5.png|center|600px]]

Die Chunk-Aktivierung beeinflusst wiederrum die Abrufwahrscheinlichkeit und -verzögerung für diesen Chunk, sofern die Aktivierung eine bestimmte Schwelle überschritten hat.

== Software ==

ACT-R liegt aktuell in der Version 7 vor und kann für Windows und Mac OS als [http://act-r.psy.cmu.edu/software/ Standalone-Anwendung] direkt verwendet werden. Die Oberfläche von ACT-R 7 besteht aus mehreren getrennten Fenstern, von denen in der unteren Abbildung links das ''Control Panel'' (Zugang zu ACT-R Funktionen), rechts oben der ''Stepper'' (Schritt-für-Schritt Ausführung eines Modells) und rechts unten der ''Listener'' (Konsole für Ausgabe von Statusinformationen und Eingabe von Befehlen) für das Modell „addition“ aufgeführt werden.

[[File:ACT-R Software.png||600px]]

== Zusammenfassung ==

Kognitive Architekturen wie ACT-R zeigen, wie man unterschiedliche Aspekte der Informationsverarbeitung in ein globaleres Modell integrieren und durch Simulationen quantitative Werte daraus gewinnen kann, die sich direkt mit den Messungen aus empirischen Studienvergleichen lassen. Auch lässt sich dieser Ansatz innerhalb eines großen Spektrums von Problemen einsetzen, allerdings mit den derzeitigen Versionen allerdings nur für relativ einfache Mechanismen, wie die Buchstabenerkennung.

Rescorla Wagner

2018-10-08T17:38:00Z

Schäfer:

{{Nav|Navigation|Mathematische Modelle|Kognitive Modellierung|Hauptseite}}

Das Rescorla-Wagner (RW) Modell von Robert Rescorla und Allan Wagner ist ein mathematisches Modell der [https://de.wikipedia.org/wiki/Klassische_Konditionierung Klassischen Konditionierung]. Bereits 1905 konnte Iwan Pawlow beobachten, dass ein Hund, der auf die Präsentation von Futter jedes Mal mit Speichelfluss reagierte, nach ein paar Durchgängen auch auf die alleinige Präsentation eines Glockentons speichelte, wenn der Ton in den vorherigen Durchgängen dem Futter vorausging. In der Methode der '''Klassischen Konditionierung''' wird für gewöhnlich ein neutraler Stimulus (z.B. ein Ton), der sog. konditionierte Stimulus (CS), in mehreren Durchgängen kurz vor einem reaktionsauslösenden (= unkonditionierten) Stimulus (US, z.B. Futter) präsentiert, bis nach einiger Zeit auch der neutrale Reiz allein die entsprechende Reaktion (Speichelfluss) auslöst. Als zugrundliegenden Prozess vermutet man eine sich kontinuierlich verstärkende Verknüpfung bzw. Assoziation zwischen CS und US. Das RW-Modell beschreibt die durch einen Konditionierungsdurchgang erfolgenden '''Veränderungen in der Assoziationsstärke''' zwischen dem CS und dem darauffolgenden US durch folgende Formel:

[[File:Rescorla-Wagner F1.png|center|600px]]

'''V''' = Assoziationsstärke der Reize (CS+US)

'''α''' = Lernrate

'''λ''' = Stärke des präsentierten US (z.B. λ=1, wenn US; λ=0, wenn kein US)

'''t''' = Lerndurchgänge / Trial Nummer

Zentrales Prinzip des Modells ist, dass '''Lernen durch Vorhersagefehler''' bzw. Überraschung entsteht. Überraschung oder Vorhersagefehler ist im Modell repräsentiert als (λ - Vt-1) oder δ, also die Differenz zwischen Realität (Präsenz / Stärke des US) und Vorhersage/Erwartung (über die Durchgänge akkumulierte Assoziationsstärke).

Der Vorhersagefehler wird dann auf das bisherige V addiert, sodass sich die Assoziationsstärke des folgenden Durchgangs entsprechend verändert. Während des Lernvorgangs wird die Differenz zwischen Erwartungen und Realität immer geringer, sodass sich der Vorhersagefehler und damit auch der Lernzuwachs pro Durchgang vermindern.

In der Beispielgrafik unten führen wir ein Konditionierungsexperiment mit zwei Versuchspersonen durch, die eine unterschiedliche '''Lernrate''' aufweisen. Nach einem Ton (CS) wird jedes Mal ein Luftstoß ins Auge gepustet (US), auf den die Personen mit einem Blinzeln reagieren. Die Versuchspersonen wissen am Anfang des Experimentes noch nicht, dass der Ton und der Luftstoß zusammenhängen, haben also eine Assoziationsstärke V=0; sie können den Luftstoß nicht vorhersagen. Dessen überraschendes Eintreten führt somit zu einem Lerneffekt, einer Erhöhung von V. Je stärker der CS und US assoziiert werden, desto besser können die Teilnehmenden den Luftstoß anhand des Tons vorhersagen. Das Lernen durch den US nimmt also stetig ab und stagniert irgendwann. Vor allem bei der Person mit hoher Lernrate (rot), zeigt sich ein schnelles Plateau bereits vor der Hälfte des Experimentes.

[[File:Rescorla-Wagner Lernrate.png||500px]]

Verschiedene Effekte aus der Lernpsychologie konnten mit Hilfe des RW-Modells erklärt werden, z.B. der [https://portal.hogrefe.com/dorsch/blockierung/ Blocking-Effekt] oder die [http://lexikon.stangl.eu/15343/inhibitorische-konditionierung/ inhibitorische Konditionierung].

Auch werden Abwandlungen des RW-Modells für Algorithmen [[Neuronale Netze|Neuronaler Netze] oder dem [[Reinforcement Learning|Reinforcement Learning]] genutzt. In diesem Zusammenhang wird dann von überwachtem Lernen (supervised learning) mit einer [[Deltaregel|Delta-Regel]] gesprochen.

Rescorla Wagner

2018-10-08T17:37:38Z

Schäfer:

{{Nav|Navigation|Mathematische Modelle|Kognitive Modellierung|Hauptseite}}

Das Rescorla-Wagner (RW) Modell von Robert Rescorla und Allan Wagner ist ein mathematisches Modell der [https://de.wikipedia.org/wiki/Klassische_Konditionierung Klassischen Konditionierung]. Bereits 1905 konnte Iwan Pawlow beobachten, dass ein Hund, der auf die Präsentation von Futter jedes Mal mit Speichelfluss reagierte, nach ein paar Durchgängen auch auf die alleinige Präsentation eines Glockentons speichelte, wenn der Ton in den vorherigen Durchgängen dem Futter vorausging. In der Methode der '''Klassischen Konditionierung''' wird für gewöhnlich ein neutraler Stimulus (z.B. ein Ton), der sog. konditionierte Stimulus (CS), in mehreren Durchgängen kurz vor einem reaktionsauslösenden (= unkonditionierten) Stimulus (US, z.B. Futter) präsentiert, bis nach einiger Zeit auch der neutrale Reiz allein die entsprechende Reaktion (Speichelfluss) auslöst. Als zugrundliegenden Prozess vermutet man eine sich kontinuierlich verstärkende Verknüpfung bzw. Assoziation zwischen CS und US. Das RW-Modell beschreibt die durch einen Konditionierungsdurchgang erfolgenden '''Veränderungen in der Assoziationsstärke''' zwischen dem CS und dem darauffolgenden US durch folgende Formel:

[[File:Rescorla-Wagner F1.png|center|600px]]

'''V''' = Assoziationsstärke der Reize (CS+US)
'''α''' = Lernrate
'''λ''' = Stärke des präsentierten US (z.B. λ=1, wenn US; λ=0, wenn kein US)
'''t''' = Lerndurchgänge / Trial Nummer

Zentrales Prinzip des Modells ist, dass '''Lernen durch Vorhersagefehler''' bzw. Überraschung entsteht. Überraschung oder Vorhersagefehler ist im Modell repräsentiert als (λ - Vt-1) oder δ, also die Differenz zwischen Realität (Präsenz / Stärke des US) und Vorhersage/Erwartung (über die Durchgänge akkumulierte Assoziationsstärke).

Der Vorhersagefehler wird dann auf das bisherige V addiert, sodass sich die Assoziationsstärke des folgenden Durchgangs entsprechend verändert. Während des Lernvorgangs wird die Differenz zwischen Erwartungen und Realität immer geringer, sodass sich der Vorhersagefehler und damit auch der Lernzuwachs pro Durchgang vermindern.

In der Beispielgrafik unten führen wir ein Konditionierungsexperiment mit zwei Versuchspersonen durch, die eine unterschiedliche '''Lernrate''' aufweisen. Nach einem Ton (CS) wird jedes Mal ein Luftstoß ins Auge gepustet (US), auf den die Personen mit einem Blinzeln reagieren. Die Versuchspersonen wissen am Anfang des Experimentes noch nicht, dass der Ton und der Luftstoß zusammenhängen, haben also eine Assoziationsstärke V=0; sie können den Luftstoß nicht vorhersagen. Dessen überraschendes Eintreten führt somit zu einem Lerneffekt, einer Erhöhung von V. Je stärker der CS und US assoziiert werden, desto besser können die Teilnehmenden den Luftstoß anhand des Tons vorhersagen. Das Lernen durch den US nimmt also stetig ab und stagniert irgendwann. Vor allem bei der Person mit hoher Lernrate (rot), zeigt sich ein schnelles Plateau bereits vor der Hälfte des Experimentes.

[[File:Rescorla-Wagner Lernrate.png||500px]]

Verschiedene Effekte aus der Lernpsychologie konnten mit Hilfe des RW-Modells erklärt werden, z.B. der [https://portal.hogrefe.com/dorsch/blockierung/ Blocking-Effekt] oder die [http://lexikon.stangl.eu/15343/inhibitorische-konditionierung/ inhibitorische Konditionierung].

Auch werden Abwandlungen des RW-Modells für Algorithmen [[Neuronale Netze|Neuronaler Netze] oder dem [[Reinforcement Learning|Reinforcement Learning]] genutzt. In diesem Zusammenhang wird dann von überwachtem Lernen (supervised learning) mit einer [[Deltaregel|Delta-Regel]] gesprochen.

Reinforcement Learning

2018-10-08T17:34:39Z

Schäfer:

{{Nav|Navigation|Mathematische Modelle|Kognitive Modellierung|Hauptseite}}

''„Of several responses made to the same situation, those which are accompanied or closely followed by satisfaction to the animal will…be more likely to recur.“''

Dieses von Thorndike bereits im Jahre 1911 postulierte Effekt-Gesetz („Law of Effect“) und die darauf aufbauenden Prinzipien der instrumentellen Konditionierung besitzen noch heute beträchtliche Erklärungskraft und sind aktuell in Form von sog. Reinforcement Learning Models (Modelle verstärkenden Lernens) in der kognitiven und komputationalen Modellierung zu finden. Beim Reinforcement Learning (RL) geht es darum, dass ein Agent (z.B. eine simulierte Versuchsperson) nicht über konkrete Hinweise oder Richtigstellungen lernt, sondern über die Konsequenzen seiner Handlungen. Konsequenzen, sog. Verstärkersignale, sind numerische Belohnungen (oder Bestrafungen), welche den Erfolg eines Handlungsausgangs repräsentieren. Der Agent versucht dabei kontinuierlich zu lernen, welche Handlungen er auswählen muss, um die gesammelte Belohnung über die Zeit zu maximieren.

Die Interaktion des lernenden Agenten mit seiner Umwelt wird dabei als sog. '''Markov-Entscheidungsproblem''' (Markov Decision Problem, MDP) beschrieben:

[[File:RL Schema.png|center|500px]]

Der Agent kann eine endliche Anzahl an '''Zuständen''' einnehmen. Durch '''Aktionen''' in seiner Umwelt kann er von einem Zustand in nachfolgende Zustände gelangen und dort eine numerische '''Belohnung''' erhalten. Anhand der Belohnungen, die der Agent durch seine Handlungen – also die Wahl von verschiedenen Zuständen ausgehend von dem momentanen Zustand – erhält, bemisst sich für jeden Zustand der Belohnungswert. Die Auswahl von Aktionen erfolgt anhand von sogenannten '''Strategien''' (Policies). Diese Strategien werden zur Maximierung der erwarteten akkumulierten Belohnung (dem '''Gesamtertrag''') kontinuierlich verbessert.

RL versucht eine optimale Strategie zu finden, welche die Gesamtbelohnung über die Zustände hinweg maximiert. Dazu wird eine '''Wertfunktion''' für die jeweilige Strategie erlernt. Diese Funktion beschreibt für jeden eingenommenen Zustand dessen Wert, also wie viel zukünftige Belohnung man erwarten kann, wenn man von diesem Zustand ausgehend verschiedene Aktionen durchführt. Dabei gibt es verschiedene Methoden und Algorithmen, die optimale Wertfunktion und Strategie zu bestimmen z.B. ''„Temporal Difference Learning“'' oder ''„Q-Learning“''.

== RL-Algorithmen ==

'''Temporal Difference (TD) Learning''' eignet sich dafür, die optimale Wertfunktion eines bestimmten Zustands zu bestimmen:

Basierend auf einer Sequenz von Zuständen ''s'' zu den Zeitschritten ''t'' (bis ''T'' ), denen jeweils bestimmte Belohnungen ''r'' folgen:

''st, rt+1, st+1, rt+2, …, rT, sT''

berechnet man die Wertfunktion ''V(s)'' des Zustands ''s'':

''V(s)'' = ''Eπ'' (''Rt'' | ''st'')

''π''(''a'' | ''s'') = ''P'' (''at = a'' | ''st = s'')

Wobei ''π'' die eingesetzte Strategie und ''E'' den Erwartungswert für den in Zukunft erwarteten Gesamtertrag ''Rt'', der von dem Zustand ''st'' ausgeht, darstellen.

Soll die zunehmende Abwertung zeitlich entfernterer Belohnungen berücksichtigt werden, kann dies durch eine sogenannte Discountrate ''γ'' (< 1) repräsentiert werden:
''Rt'' = ''rt+1 + γ1 rt+2 + … + γT-t-1 rT''

RL nimmt an, dass der Wert eines Zustands ''V(s)'' äquivalent zu dem erwarteten Gesamtertrag ''Rt'' ist. Die Aktualisierung der Wertfunktion - das Lernen - erfolgt also durch den Abgleich von ''V(s)'' mit ''Rt'' :

''V(st)neu'' = ''V(st)alt'' + ''α'' [ ''Rt'' – ''V(st)alt'' ]

Die Schrittgröße (oder Lernrate) wird dabei durch ''α'' (oft ''α'' = 1) repräsentiert. Wenn ''V(st)'' den erwarteten Gesamtertrag ''Rt'' korrekt vorhersagt, wird die Aktualisierung der Wertfunktion im Mittel Null betragen und der finale Wert gefunden sein.

Im '''Q-Learning''' wird ergänzend zu den Belohnungs- und Zustandsparametern der Handlungsparameter ''a'' eingeführt, der beim TD Learning nicht spezifiziert war:
''Q''(''s'', ''a'') = ''Eπ'' (''Rt'' | ''st'' , ''at'')

Über ein ähnliches Vorgehen wie beim TD Learning wird ''Q'' approximiert:

''Q(st, at)neu'' = ''Q(st, at)alt'' + ''α'' [ ''rt+1 + γ Q(st+1, at+1) – Q(st, at)'' ]

Über diese Approximation kann zusätzlich zur Wertfunktion der Zustände die optimale Strategie oder Policy für den Zustandsraum ermittelt werden.

== Probleme und Einschränkungen ==

Der RL Ansatz hat trotz seines großen Nutzens für viele Fragestellungen mit mehreren Problemen zu kämpfen, von denen einige hier vorgestellt werden:

* '''Dimensionalität''': Bei der vergleichsweise realistischen Nachstellung realer RL Probleme kann es zu einer großen Anzahl von möglichen Zuständen und Handlungen kommen, die in einer explosionsartigen Menge von Zustands-Handlungs-Kombinationen resultieren.
** Mit Funktionsapproximationen bzw. Interpolationen des Werteraums sowie einer Generalisierung der Wertefunktion wird dieses Problem zu lösen versucht.
* '''Verspätete Belohnungen''': In manchen Zustands-Handlungs-Räumen trifft die Belohnung erst sehr spät ein, d.h., es werden viele Aktionen durchgeführt und Zustände eingenommen, bis die Belohnung erscheint. Dies kann dazu führen, dass nur die Zustände, die der Belohnung zeitlich nahe vorausgehen, in ihrer Wertfunktion beeinflusst werden. Es braucht deshalb viele Schritte bis sich eine verspätete Belohnung auf alle Zustände und Aktionen auswirkt.
** Das Problem wird auf ähnliche Weise wie das Dimensionalitätsproblem gelöst.
* '''Unvollständige Beobachtbarkeit''': In realen Situationen weiß ein Agent oft nicht, in welchem Zustand er sich nach einer bestimmten Handlung exakt befinden wird. Einfache RL-Algorithmen setzen jedoch volle Beobachtbarkeit voraus.
** Dieses Problem wird durch „Partial observable Markov Decision Problems“ (POMDP) Methoden gelöst.
* '''Nicht-stationäre Umwelten''': RL-Algorithmen brauchen etwas Zeit für den Optimierungsprozess. Wenn die Umwelt sich dabei zu schnell verändert, ist das Lernen quasi unmöglich und die Annäherungsmethode schlägt fehl.

== Anwendungen des Reinforcement Learning ==

RL-Algorithmen wie TD Learning werden u.a. als Modelle für dopaminerges Lernen in den Basalganglien verwendet. So kodieren bestimmte dopaminerge Projektionen aus dem Mittelhirn einen Belohnungsvorhersagefehler. Auch das Erlernen von Fähig- und Fertigkeiten bei Menschen wird häufig mit Hilfe von RL modelliert, besonders im Kontext von implizitem Lernen.

So lässt sich mit Hilfe von RL-Modellen auch der Effekt der emotionalen Valenz von Bildern (also ob sie als positiv, neutral oder negativ wahrgenommen werden) auf nachfolgende Entscheidungen überprüfen, wie es [https://www.frontiersin.org/articles/10.3389/fpsyg.2011.00311/full Katahira und Kollegen (2011)] untersucht haben. In ihrer Studie wurden die Versuchspersonen instruiert, in 600 Durchgängen per Knopfdruck einen von zwei Zielreizen (blaues oder grünes Quadrat in der Abbildung unten) zu wählen. Die Entscheidung führte dann je nach ausgewähltem Zielreiz mit einer gewissen Wahrscheinlichkeit (grüne und blaue Pfeile) zu Bild-Outcomes unterschiedlicher Valenz (Neutral, Positiv, Negativ), also ''p''(Valenz|Entscheidung). Zum Beispiel war der grüne Reiz häufiger mit positiven Bildern und der blaue häufiger mit negativen Bildern assoziiert. Diese bedingten Wahrscheinlichkeiten wurden dann aber über die Blöcke hinweg immer wieder verändert. Nach dem Experiment wurde jedes Bild separat auf seine Valenz von den Versuchspersonen eingeschätzt.

[[File:RL Schema2.png||600px]]

Aus Sicht eine Reinforcement Modells stellen in dieser künstlichen Umwelt (dem Experiment) die Bilder die Zustände da, in die der Agent (Versuchsperson) mittels Wahl der blauen oder grünen Quadrate wechseln kann. Die Valenz der Bilder spiegelt den Belohnungs-Outcome wider.

Indem man nun das Verhalten eines solchen Modells an das Verhalten jeder Versuchperson [[Fitting & Parameter Estimation|fitted]], kann man untersuchen wie bestimmte Parameter das Entscheidungsverhalten beeinflussen, wie es sich über die Zeit verändert, je nachdem welche Entscheidung zu welchen Bildern führen. Finden die anfangs naiven Versuchspersonen eine Regel heraus bzw. bleiben sie bei positiven Erfahrungen mit einem Zielreiz konsistent bei dieser Entscheidung? Spiegelt das Entscheidungsverhalten die Valenz der Bilder wieder? Tatsächlich konnte man über das Entscheidungsverhalten mittels des RL-Modells einen Wert für die Bilder bestimmen, der den späteren Valenz-Ratings sehr ähnlich war. (Positive) emotionale Bilder stellen also auch für sich belohnende Reize dar.

Dynamische Attraktormodelle

2018-10-08T17:33:57Z

Schäfer:

Dynamische Attraktormodelle

2018-10-08T17:32:35Z

Schäfer:

Literatur

2018-10-08T17:30:44Z

Schäfer:

'''Einführung in die Methoden & Versuchsplanung'''

* Bortz, J., Döring, N. (2006) Forschungsmethoden und Evaluation. Berlin: Springer
* Goodwin, C. J. (2009) Research in Psychology. Hoboken NJ: Wiley
* Hecht, H., Desnizza, W. (2012) Psychologie als empirische Wissenschaft. Berlin: Springer
* Herzog, W. (2012) Wissenschafts-theoretische Grundlagen der Psychologie. Berlin: Springer
* Hussy, W., & Jain, A. (2002). Experimentelle Hypothesenprüfung in der Psychologie. Göttingen: Hogrefe
* Hussy, W., Schreier, M., Echterhoff, G. (2010) Forschungsmethoden in Psychologie und Sozialwissenschaften für Bachelor. Berlin: Springer
* Kukla, A., & Walmsley, J. (2006). Mind: A Historical and Philosophical Introduction to the Major Theories. Indianapolis: Hackett Publishing
* Sarris, V. (1992) Methodologische Grundlagen der Experimentalpsychologie, Bd.2, Versuchsplanung und Stadien des psychologischen Experiments. München: UTB
* Schnell, R., Hill, P.B., Esser, E. (2011) Methoden der empirischen Sozialforschung. München: Oldenbourg
* Whitley, B.E., Kite, M.E. (2013) Principles of Research in Behavioral Science. New York: Routledge
* Walach, H. (2013) Psychologie: Wissenschaftstheorie, philosophische Grundlagen und Geschichte. Stuttgart: Kohlhammer

''' Kognitive Modellierung'''

* Anders, R., Alario, F., & Van Maanen, L. (2016). The shifted Wald distribution for response time data analysis. ''Psychological methods, 21''(3), 309.
* Anderson, B. (2014). ''Computational neuroscience and cognitive modelling: a student's introduction to methods and procedures''. Sage.
* Anderson, J. R., Bothell, D., Byrne, M. D., Douglass, S., Lebiere, C., & Qin, Y. (2004). An integrated theory of the mind. ''Psychological review, 111''(4), 1036.
* Anderson, J. R. (1996). ACT: A simple theory of complex cognition. ''American Psychologist, 51''(4), 355.
* Andres, J.: Das allgemeine lineare Modell. In Edgar Erdfelder, Rainer Mausfeld, Thorsten Meiser & Georg Rudinger (Hrsg.), Handbuch quantitative Methoden, 1996 (S.185-200); Weinheim: Belz.
* Balota, D. A., & Yap, M. J. (2011). Moving beyond the mean in studies of mental chronometry: The power of response time distributional analyses. ''Current Directions in Psychological Science, 20''(3), 160-166.
* Bundesen, C., & Habekost, T. (2007). Models of attention.
* Busemeyer, J. R., & Diederich, A. (2010). ''Cognitive modeling''. Sage.
* Domjan, M. (2014). ''The principles of learning and behavior''. Nelson Education.
* Forstmann, B. U., Ratcliff, R., & Wagenmakers, E. J. (2016). Sequential sampling models in cognitive neuroscience: Advantages, applications, and extensions. ''Annual review of psychology, 67.''
* Gaschler, R. (2014). Kognitive Architektur. In M. A. Wirtz (Hrsg.), ''Dorsch – Lexikon der Psychologie'' (18. Aufl., S. 839). Bern: Verlag Hogrefe Verlag.
* Goldstone, R. L., & Janssen, M. A. (2005). Computational models of collective behavior. ''Trends in cognitive sciences, 9''(9), 424-430.
* Grimm, V., Revilla, E., Berger, U., Jeltsch, F., Mooij, W. M., Railsback, S. F., ... & DeAngelis, D. L. (2005). Pattern-oriented modeling of agent-based complex systems: lessons from ecology. ''Science, 310''(5750), 987-991.
* Heathcote, A., Brown, S. D., & Wagenmakers, E. J. (2015). An introduction to good practices in cognitive modeling. In ''An introduction to model-based cognitive neuroscience'' (pp. 25-48). Springer, New York, NY.
* Honing, H. (2006). The role of surprise in theory testing: Some preliminary observations. In ''Proceedings of the international conference on music perception and cognition'' (pp. 38-42).
* Izhikevich, E. M. (2007). Solving the distal reward problem through linkage of STDP and dopamine signaling. ''Cerebral cortex, 17''(10), 2443-2452.
* Kelso, J. S. (1997). ''Dynamic patterns: The self-organization of brain and behavior.'' MIT press.
* Laird, J. E., Newell, A., & Rosenbloom, P. S. (1987). Soar: An architecture for general intelligence. ''Artificial intelligence, 33''(1), 1-64.
* Lins, J., & Schöner, G. (2014). A neural approach to cognition based on dynamic field theory. In ''Neural Fields'' (pp. 319-339). Springer, Berlin, Heidelberg.
* Macho, S. (2002). Cognitive modeling with spreadsheets. ''Behavior Research Methods, Instruments, & Computers, 34''(1), 19-36.
* Matzke, D., & Wagenmakers, E. J. (2009). Psychological interpretation of the ex-Gaussian and shifted Wald parameters: A diffusion model analysis. ''Psychonomic bulletin & review, 16''(5), 798-817.
* McClelland, J. L. (2009). The place of modeling in cognitive science. ''Topics in Cognitive Science, 1''(1), 11-38.
* McKerchar, T. L., Green, L., Myerson, J., Pickford, T. S., Hill, J. C., & Stout, S. C. (2009). A comparison of four models of delay discounting in humans. ''Behavioural processes, 81''(2), 256-259.
* Miller, R., Scherbaum, S., Heck, D. W., Goschke, T., & Enge, S. (2018). On the relation between the (censored) shifted Wald and the Wiener distribution as measurement models for choice response times. ''Applied psychological measurement, 42''(2), 116-135.
* Portenier, C., & Gromes, W. (2005). ''Mathematik für Humanbiologen und Biologen''. Fachbereich Mathematik und Informatik Philipps-Universität Marburg.
* Ratcliff, R., Smith, P. L., Brown, S. D., & McKoon, G. (2016). Diffusion decision model: current issues and history. ''Trends in cognitive sciences, 20''(4), 260-281.
* Ratcliff, R., Spieler, D., & Mckoon, G. (2000). Explicitly modeling the effects of aging on response time. ''Psychonomic Bulletin & Review, 7''(1), 1-25.
* Rey, G. D., & Wender, K. F. (2008). Neuronale Netze. ''Eine Einführung in die Grundlagen, Anwendungen und Datenauswertung.'' Huber, Bern.
* Rescorla, R. A. (2008) Rescorla-Wagner model. ''Scholarpedia, 3''(3):2237.
* Rescorla, R. A., & Wagner, A. R. (1972). A theory of Pavlovian conditioning: Variations in the effectiveness of reinforcement and nonreinforcement. ''Classical conditioning II: Current research and theory, 2'', 64-99.
* Rudolf, M., & Müller, J. (2012). ''Multivariate Verfahren: eine praxisorientierte Einführung mit Anwendungsbeispielen in SPSS.'' Hogrefe Verlag.
* Sandamirskaya, Y., Zibner, S. K., Schneegans, S., & Schöner, G. (2013). Using dynamic field theory to extend the embodiment stance toward higher cognition. ''New Ideas in Psychology, 31''(3), 322-339.
* Siegfried, R. (2009). Agent-based modeling and simulation. In Modeling and Simulation of Complex Systems (pp. 86–98).
* Schoner, G., & Kelso, J. A. (1988). Dynamic pattern generation in behavioral and neural systems. Science, 239(4847), 1513-1520.
* Sun, R. (2008). Introduction to computational cognitive modeling. ''Cambridge handbook of computational psychology'', 3-19.
* Tuller, B., Case, P., Ding, M., & Kelso, J. A. (1994). The nonlinear dynamics of speech categorization. ''Journal of Experimental Psychology: Human perception and performance, 20''(1), 3.
* Stephan, A., & Walter, S. (Eds.). (2013). ''Handbuch Kognitionswissenschaft.'' Springer-Verlag.
* Voss, A., Rothermund, K., Gast, A., & Wentura, D. (2013). Cognitive processes in associative and categorical priming: A diffusion model analysis. ''Journal of Experimental Psychology: General, 142''(2), 536.
* Wilensky, U., & Resnick, M. (1999). Thinking in levels: A dynamic systems approach to making sense of the world. ''Journal of Science Education and technology, 8''(1), 3-19.
* Woergoetter, F. & Porr, B. (2008) Reinforcement Learning. ''Scholarpedia, 3''(3):1448.

Literatur

2018-10-08T17:29:06Z

Schäfer:

Literatur

2018-10-08T17:23:00Z

Schäfer:

'''Einführung in die Methoden & Versuchsplanung'''

* Bortz, J., Döring, N. (2006) Forschungsmethoden und Evaluation. Berlin: Springer
* Goodwin, C. J. (2009) Research in Psychology. Hoboken NJ: Wiley
* Hecht, H., Desnizza, W. (2012) Psychologie als empirische Wissenschaft. Berlin: Springer
* Herzog, W. (2012) Wissenschafts-theoretische Grundlagen der Psychologie. Berlin: Springer
* Hussy, W., & Jain, A. (2002). Experimentelle Hypothesenprüfung in der Psychologie. Göttingen: Hogrefe
* Hussy, W., Schreier, M., Echterhoff, G. (2010) Forschungsmethoden in Psychologie und Sozialwissenschaften für Bachelor. Berlin: Springer
* Kukla, A., & Walmsley, J. (2006). Mind: A Historical and Philosophical Introduction to the Major Theories. Indianapolis: Hackett Publishing
* Sarris, V. (1992) Methodologische Grundlagen der Experimentalpsychologie, Bd.2, Versuchsplanung und Stadien des psychologischen Experiments. München: UTB
* Schnell, R., Hill, P.B., Esser, E. (2011) Methoden der empirischen Sozialforschung. München: Oldenbourg
* Whitley, B.E., Kite, M.E. (2013) Principles of Research in Behavioral Science. New York: Routledge
* Walach, H. (2013) Psychologie: Wissenschaftstheorie, philosophische Grundlagen und Geschichte. Stuttgart: Kohlhammer

''' Kognitive Modellierung'''

* Anders, R., Alario, F., & Van Maanen, L. (2016). The shifted Wald distribution for response time data analysis. ''Psychological methods, 21''(3), 309.
* Anderson, B. (2014). ''Computational neuroscience and cognitive modelling: a student's introduction to methods and procedures''. Sage.
* Anderson, J. R., Bothell, D., Byrne, M. D., Douglass, S., Lebiere, C., & Qin, Y. (2004). An integrated theory of the mind. ''Psychological review, 111''(4), 1036.
* Anderson, J. R. (1996). ACT: A simple theory of complex cognition. ''American Psychologist, 51''(4), 355.
* Andres, J.: Das allgemeine lineare Modell. In Edgar Erdfelder, Rainer Mausfeld, Thorsten Meiser & Georg Rudinger (Hrsg.), Handbuch quantitative Methoden, 1996 (S.185-200); Weinheim: Belz.
* Balota, D. A., & Yap, M. J. (2011). Moving beyond the mean in studies of mental chronometry: The power of response time distributional analyses. ''Current Directions in Psychological Science, 20''(3), 160-166.
* Bundesen, C., & Habekost, T. (2007). Models of attention.
* Busemeyer, J. R., & Diederich, A. (2010). ''Cognitive modeling''. Sage.
* Domjan, M. (2014). ''The principles of learning and behavior''. Nelson Education.
* Forstmann, B. U., Ratcliff, R., & Wagenmakers, E. J. (2016). Sequential sampling models in cognitive neuroscience: Advantages, applications, and extensions. ''Annual review of psychology, 67.''
* Gaschler, R. (2014). Kognitive Architektur. In M. A. Wirtz (Hrsg.), ''Dorsch – Lexikon der Psychologie'' (18. Aufl., S. 839). Bern: Verlag Hogrefe Verlag.
* Goldstone, R. L., & Janssen, M. A. (2005). Computational models of collective behavior. ''Trends in cognitive sciences, 9''(9), 424-430.
* Grimm, V., Revilla, E., Berger, U., Jeltsch, F., Mooij, W. M., Railsback, S. F., ... & DeAngelis, D. L. (2005). Pattern-oriented modeling of agent-based complex systems: lessons from ecology. ''Science, 310''(5750), 987-991.
* Heathcote, A., Brown, S. D., & Wagenmakers, E. J. (2015). An introduction to good practices in cognitive modeling. In ''An introduction to model-based cognitive neuroscience'' (pp. 25-48). Springer, New York, NY.
* Honing, H. (2006). The role of surprise in theory testing: Some preliminary observations. In ''Proceedings of the international conference on music perception and cognition'' (pp. 38-42).
* Izhikevich, E. M. (2007). Solving the distal reward problem through linkage of STDP and dopamine signaling. ''Cerebral cortex, 17''(10), 2443-2452.
* Kelso, J. S. (1997). ''Dynamic patterns: The self-organization of brain and behavior.'' MIT press.
* Lins, J., & Schöner, G. (2014). A neural approach to cognition based on dynamic field theory. In ''Neural Fields'' (pp. 319-339). Springer, Berlin, Heidelberg.
* Macho, S. (2002). Cognitive modeling with spreadsheets. ''Behavior Research Methods, Instruments, & Computers, 34''(1), 19-36.
* Matzke, D., & Wagenmakers, E. J. (2009). Psychological interpretation of the ex-Gaussian and shifted Wald parameters: A diffusion model analysis. ''Psychonomic bulletin & review, 16''(5), 798-817.
* McClelland, J. L. (2009). The place of modeling in cognitive science. ''Topics in Cognitive Science, 1''(1), 11-38.
* McKerchar, T. L., Green, L., Myerson, J., Pickford, T. S., Hill, J. C., & Stout, S. C. (2009). A comparison of four models of delay discounting in humans. ''Behavioural processes, 81''(2), 256-259.
* Miller, R., Scherbaum, S., Heck, D. W., Goschke, T., & Enge, S. (2018). On the relation between the (censored) shifted Wald and the Wiener distribution as measurement models for choice response times. ''Applied psychological measurement, 42''(2), 116-135.
* Ratcliff, R., Smith, P. L., Brown, S. D., & McKoon, G. (2016). Diffusion decision model: current issues and history. ''Trends in cognitive sciences, 20''(4), 260-281.
* Ratcliff, R., Spieler, D., & Mckoon, G. (2000). Explicitly modeling the effects of aging on response time. ''Psychonomic Bulletin & Review, 7''(1), 1-25.
* Rey, G. D., & Wender, K. F. (2008). Neuronale Netze. ''Eine Einführung in die Grundlagen, Anwendungen und Datenauswertung.'' Huber, Bern.
* Rescorla, R. A. (2008) Rescorla-Wagner model. ''Scholarpedia, 3''(3):2237.
* Rescorla, R. A., & Wagner, A. R. (1972). A theory of Pavlovian conditioning: Variations in the effectiveness of reinforcement and nonreinforcement. ''Classical conditioning II: Current research and theory, 2'', 64-99.
* Rudolf, M., & Müller, J. (2012). ''Multivariate Verfahren: eine praxisorientierte Einführung mit Anwendungsbeispielen in SPSS.'' Hogrefe Verlag.
* Sandamirskaya, Y., Zibner, S. K., Schneegans, S., & Schöner, G. (2013). Using dynamic field theory to extend the embodiment stance toward higher cognition. ''New Ideas in Psychology, 31''(3), 322-339.
* Siegfried, R. (2009). Agent-based modeling and simulation. In Modeling and Simulation of Complex Systems (pp. 86–98).
* Schoner, G., & Kelso, J. A. (1988). Dynamic pattern generation in behavioral and neural systems. Science, 239(4847), 1513-1520.
* Sun, R. (2008). Introduction to computational cognitive modeling. ''Cambridge handbook of computational psychology'', 3-19.
* Tuller, B., Case, P., Ding, M., & Kelso, J. A. (1994). The nonlinear dynamics of speech categorization. ''Journal of Experimental Psychology: Human perception and performance, 20''(1), 3.
* Stephan, A., & Walter, S. (Eds.). (2013). ''Handbuch Kognitionswissenschaft.'' Springer-Verlag.
* Voss, A., Rothermund, K., Gast, A., & Wentura, D. (2013). Cognitive processes in associative and categorical priming: A diffusion model analysis. ''Journal of Experimental Psychology: General, 142''(2), 536.
* Wilensky, U., & Resnick, M. (1999). Thinking in levels: A dynamic systems approach to making sense of the world. ''Journal of Science Education and technology, 8''(1), 3-19.
* Woergoetter, F. & Porr, B. (2008), ''Scholarpedia, 3''(3):1448.

Literatur

2018-10-08T17:16:46Z

Schäfer:

'''Einführung in die Methoden & Versuchsplanung'''

* Bortz, J., Döring, N. (2006) Forschungsmethoden und Evaluation. Berlin: Springer
* Goodwin, C. J. (2009) Research in Psychology. Hoboken NJ: Wiley
* Hecht, H., Desnizza, W. (2012) Psychologie als empirische Wissenschaft. Berlin: Springer
* Herzog, W. (2012) Wissenschafts-theoretische Grundlagen der Psychologie. Berlin: Springer
* Hussy, W., & Jain, A. (2002). Experimentelle Hypothesenprüfung in der Psychologie. Göttingen: Hogrefe
* Hussy, W., Schreier, M., Echterhoff, G. (2010) Forschungsmethoden in Psychologie und Sozialwissenschaften für Bachelor. Berlin: Springer
* Kukla, A., & Walmsley, J. (2006). Mind: A Historical and Philosophical Introduction to the Major Theories. Indianapolis: Hackett Publishing
* Sarris, V. (1992) Methodologische Grundlagen der Experimentalpsychologie, Bd.2, Versuchsplanung und Stadien des psychologischen Experiments. München: UTB
* Schnell, R., Hill, P.B., Esser, E. (2011) Methoden der empirischen Sozialforschung. München: Oldenbourg
* Whitley, B.E., Kite, M.E. (2013) Principles of Research in Behavioral Science. New York: Routledge
* Walach, H. (2013) Psychologie: Wissenschaftstheorie, philosophische Grundlagen und Geschichte. Stuttgart: Kohlhammer

''' Kognitive Modellierung'''

* Anders, R., Alario, F., & Van Maanen, L. (2016). The shifted Wald distribution for response time data analysis. ''Psychological methods, 21''(3), 309.
* Anderson, B. (2014). ''Computational neuroscience and cognitive modelling: a student's introduction to methods and procedures''. Sage.
* Anderson, J. R., Bothell, D., Byrne, M. D., Douglass, S., Lebiere, C., & Qin, Y. (2004). An integrated theory of the mind. ''Psychological review, 111''(4), 1036.
* Anderson, J. R. (1996). ACT: A simple theory of complex cognition. ''American Psychologist, 51''(4), 355.
* Andres, J.: Das allgemeine lineare Modell. In Edgar Erdfelder, Rainer Mausfeld, Thorsten Meiser & Georg Rudinger (Hrsg.), Handbuch quantitative Methoden, 1996 (S.185-200); Weinheim: Belz.
* Balota, D. A., & Yap, M. J. (2011). Moving beyond the mean in studies of mental chronometry: The power of response time distributional analyses. ''Current Directions in Psychological Science, 20''(3), 160-166.
* Bundesen, C., & Habekost, T. (2007). Models of attention.
* Busemeyer, J. R., & Diederich, A. (2010). ''Cognitive modeling''. Sage.
* Domjan, M. (2014). ''The principles of learning and behavior''. Nelson Education.
* Forstmann, B. U., Ratcliff, R., & Wagenmakers, E. J. (2016). Sequential sampling models in cognitive neuroscience: Advantages, applications, and extensions. ''Annual review of psychology, 67.''
* Gaschler, R. (2014). Kognitive Architektur. In M. A. Wirtz (Hrsg.), ''Dorsch – Lexikon der Psychologie'' (18. Aufl., S. 839). Bern: Verlag Hogrefe Verlag.
* Goldstone, R. L., & Janssen, M. A. (2005). Computational models of collective behavior. ''Trends in cognitive sciences, 9''(9), 424-430.
* Grimm, V., Revilla, E., Berger, U., Jeltsch, F., Mooij, W. M., Railsback, S. F., ... & DeAngelis, D. L. (2005). Pattern-oriented modeling of agent-based complex systems: lessons from ecology. ''Science, 310''(5750), 987-991.
* Heathcote, A., Brown, S. D., & Wagenmakers, E. J. (2015). An introduction to good practices in cognitive modeling. In ''An introduction to model-based cognitive neuroscience'' (pp. 25-48). Springer, New York, NY.
* Honing, H. (2006). The role of surprise in theory testing: Some preliminary observations. In ''Proceedings of the international conference on music perception and cognition'' (pp. 38-42).
* Izhikevich, E. M. (2007). Solving the distal reward problem through linkage of STDP and dopamine signaling. ''Cerebral cortex, 17''(10), 2443-2452.
* Kelso, J. S. (1997). ''Dynamic patterns: The self-organization of brain and behavior.'' MIT press.
* Lins, J., & Schöner, G. (2014). A neural approach to cognition based on dynamic field theory. In ''Neural Fields'' (pp. 319-339). Springer, Berlin, Heidelberg.
* Macho, S. (2002). Cognitive modeling with spreadsheets. ''Behavior Research Methods, Instruments, & Computers, 34''(1), 19-36.
* Matzke, D., & Wagenmakers, E. J. (2009). Psychological interpretation of the ex-Gaussian and shifted Wald parameters: A diffusion model analysis. ''Psychonomic bulletin & review, 16''(5), 798-817.
* McClelland, J. L. (2009). The place of modeling in cognitive science. ''Topics in Cognitive Science, 1''(1), 11-38.
* McKerchar, T. L., Green, L., Myerson, J., Pickford, T. S., Hill, J. C., & Stout, S. C. (2009). A comparison of four models of delay discounting in humans. ''Behavioural processes, 81''(2), 256-259.
* Miller, R., Scherbaum, S., Heck, D. W., Goschke, T., & Enge, S. (2018). On the relation between the (censored) shifted Wald and the Wiener distribution as measurement models for choice response times. ''Applied psychological measurement, 42''(2), 116-135.
* Ratcliff, R., Smith, P. L., Brown, S. D., & McKoon, G. (2016). Diffusion decision model: current issues and history. ''Trends in cognitive sciences, 20''(4), 260-281.
* Ratcliff, R., Spieler, D., & Mckoon, G. (2000). Explicitly modeling the effects of aging on response time. ''Psychonomic Bulletin & Review, 7''(1), 1-25.
* Rey, G. D., & Wender, K. F. (2008). Neuronale Netze. ''Eine Einführung in die Grundlagen, Anwendungen und Datenauswertung.'' Huber, Bern.
* Rescorla, R. A. (2008) Rescorla-Wagner model. ''Scholarpedia, 3''(3):2237.
* Rescorla, R. A., & Wagner, A. R. (1972). A theory of Pavlovian conditioning: Variations in the effectiveness of reinforcement and nonreinforcement. ''Classical conditioning II: Current research and theory, 2'', 64-99.
* Rudolf, M., & Müller, J. (2012). ''Multivariate Verfahren: eine praxisorientierte Einführung mit Anwendungsbeispielen in SPSS.'' Hogrefe Verlag.
* Sandamirskaya, Y., Zibner, S. K., Schneegans, S., & Schöner, G. (2013). Using dynamic field theory to extend the embodiment stance toward higher cognition. ''New Ideas in Psychology, 31''(3), 322-339.
* Siegfried, R. (2009). Agent-based modeling and simulation. In Modeling and Simulation of Complex Systems (pp. 86–98).
* Schoner, G., & Kelso, J. A. (1988). Dynamic pattern generation in behavioral and neural systems. Science, 239(4847), 1513-1520.
* Tuller, B., Case, P., Ding, M., & Kelso, J. A. (1994). The nonlinear dynamics of speech categorization. ''Journal of Experimental Psychology: Human perception and performance, 20''(1), 3.
* Stephan, A., & Walter, S. (Eds.). (2013). ''Handbuch Kognitionswissenschaft.'' Springer-Verlag.
* Voss, A., Rothermund, K., Gast, A., & Wentura, D. (2013). Cognitive processes in associative and categorical priming: A diffusion model analysis. ''Journal of Experimental Psychology: General, 142''(2), 536.
* Wilensky, U., & Resnick, M. (1999). Thinking in levels: A dynamic systems approach to making sense of the world. ''Journal of Science Education and technology, 8''(1), 3-19.
* Woergoetter, F. & Porr, B. (2008), ''Scholarpedia, 3''(3):1448.

Probabilistische Modelle

2018-10-03T14:35:39Z

Schäfer:

{{Nav|Navigation|Mathematische Modelle|Kognitive Modellierung|Hauptseite}}

Kognitive Prozesse, wie zum Beispiel Wahrnehmungsurteile, beruhen auf unsicheren Schlussfolgerungen und müssen daher die '''Unsicherheit''' der Informationen berücksichtigen. Wenn man in der Dunkelheit die Umrisse einer bekannten Person erkennt, dann ist es wichtig, die Unsicherheit dieser Einschätzung im Kopf zu haben um sein Verhalten entsprechend anzupassen (und keinem ggf. gefährlichen Unbekannten unvorsichtig in die Arme zu rennen).

Im Gegensatz zu deterministischen Modellen berücksichtigen probabilistische Modelle explizit diese Unsicherheit in den Inputs und Outputs eines Verarbeitungsprozesses. Durch Quantifizierung der Unsicherheit (Zuverlässigkeit / Risiko) in den Messungen, den Modellparametern und der Passung des Modells an die Daten geben probabilistische Vorhersagen eine Reihe oder Verteilung an möglichen Outcomes vor statt einer Einzeleinschätzung. Dies wird einer komplexen und verrauschten Realität in der Regel besser gerecht. Doch wie repräsentiert man Unsicherheit?

== Wahrscheinlichkeitstheoretische Grundlagen ==

Probabilistische Modelle sind mathematische Modelle, die Zufallsvariablen und Wahrscheinlichkeitsverteilungen miteinschließen. '''Zufallsvariablen''' stellen das potentielle Ergebnis eines unsicheren Ereignisses dar (z.B. die Augenzahl eines Würfelwurfs); sie bilden Ereignisse als Zahlen ab. '''Wahrscheinlichkeitsverteilungen''' weisen den verschiedenen potentiellen Ergebnissen Wahrscheinlichkeitswerte zu (z.B. 1/6 für jede der sechs Augenzahlen).

Wenn wir X als unsere Zufallsvariable über eine Menge von messbaren Ereignissen definieren, dann gibt uns ''P(X = x)'' die Wahrscheinlichkeit, dass ''X'' den spezifischen Wert ''x'' annimmt (kurz geschrieben: ''p(x)''). Alle diese Wahrscheinlichkeiten sind positiv und sie summieren sich über die Ausprägungen der Zufallsvariable zu 1 auf.

Wichtige Begriffe aus der probabilistischen Theorie zum Auftreten von Merkmalskombinationen lassen sich durch eine '''Kontingenztafel''' veranschaulichen, die in ihren Zellen die Häufigkeiten nij für die Ereigniskombinationen der Zufallsvariablen ''X'' und ''Y'' enthält. Diese Ereignishäufigkeiten ''nij'' ergeben über alle Kombinationen summiert die Gesamthäufigkeit ''N'' und addieren sich an den Seiten zu den Randhäufigkeiten auf, jeweils über die Zeilen (''rj'' ) und Spalten (''ci'' ) der Kontingenztafel:

[[File:ProbMod_01.PNG|center|400px]]

Die '''Verbundwahrscheinlichkeit''' der Ereignisse ''xi'' und ''yj'', d.h. die Wahrscheinlichkeit ihres gleichzeitigen Eintretens ist:

[[File:ProbMod_02.png|center|600px]]

Also die Häufigkeit mit der diese Ereignisse gemeinsam auftreten ''nij'' durch die Häufigkeit aller Ereigniskombinationen ''N''.

Die '''Randwahrscheinlichkeit''' bezeichnet die Wahrscheinlichkeit für die Ausprägung einer Zufallsvariable über die Ausprägungen der anderen Zufallsvariablen hinweg, also die relative Wahrscheinlichkeit für die Ereignisse einer bestimmten Reihe oder Spalte der Kontingenztafel bzw. die jeweilige Randhäufigkeit durch die Gesamthäufigkeit N. Für eine bestimmte Reihe lautet die Formel:

[[File:ProbMod_03.png|center|600px]]

Die '''bedingte Wahrscheinlichkeit''' ''P(Y | X)'' ist die Wahrscheinlichkeit des Eintretens eines Ereignisses aus ''Y'' unter der Bedingung, dass das Eintreten eines Ereignisses aus ''X'' bereits bekannt ist. Sie berechnet sich aus der Häufigkeit des Eintretens beider Ereignisse und der Randhäufigkeit des bedingenden Ereignisses:

[[File:ProbMod_04.png|center|600px]]

Über die Produktregel kann man die Verbundwahrscheinlichkeit zweier Ereignisse über die bedingte Wahrscheinlichkeit und die Randwahrscheinlichkeit berechnen:

[[File:ProbMod_05.png|center|600px]]

Wenn wir die Produktregel nun umstellen erhalten wir:

[[File:ProbMod_06.png|center|600px]]

Diese Formel geht auf den Satz des englischen Mathematikers [https://de.wikipedia.org/wiki/Thomas_Bayes Thomas Bayes] zurück, laut dem sich für zwei Ereignisse ''X'' und ''Y'' die Wahrscheinlichkeit von ''Y'', unter der Bedingung, dass ''X'' eingetreten ist, durch die Wahrscheinlichkeit von ''X'', unter der Bedingung, dass ''Y'' eingetreten ist, errechnen lässt. Der [https://de.wikipedia.org/wiki/Satz_von_Bayes Satz von Bayes] erlaubt es, Schlussfolgerungen umzukehren, d.h. ausgehend von einem bekannten Wert ''P(X|Y)'' den eigentlich interessierenden Wert ''P(Y|X)'' zu bestimmen.

== Bayesianische Inferenz ==

Die Bayes’sche Regel ist die Basis für probabilistische Schlussfolgerung (Inferenz) und Lernen. Nehmen wir an, wir haben ein lineares (Regressions-)Modell mit den Parametern '''''β''''':

[[File:ProbMod_07.png|center|600px]]

Unser Ziel ist es, die '''''β'''''-Parameter herauszufinden, gegeben den Daten D (y- und x-Werte). Konkret wollen wir also wissen, wie wahrscheinlich ein bestimmter Wert eines '''''β'''''-Parameters (z.B. des Intercept β0) ist, wenn wir die Daten D vorliegen haben. Um diese Wahrscheinlichkeit zu bestimmen bzw. eine bedingte Wahrscheinlichkeitsverteilung für den '''''β'''''-Parameter zu erhalten, greifen wir dabei auf die obige Formel von Bayes zurück (''β0'' und ''β1'' sind hier zusammengefasst, werden aber separat bestimmt):

[[File:ProbMod_08.PNG|center|200px]]

In der Terminologie der bayesianischen Inferenz beinhaltet diese Formel einen '''Posterior''' (blau), der sich aus der '''Likelihood''' (grün) und dem '''Prior''' (gelb) berechnet.

Der Posterior bzw. die posteriore Wahrscheinlichkeit, ist die Wahrscheinlichkeit, die Parameter '''''β''''' mit den vorliegenden Daten zu finden. Sie errechnet sich laut der Formel aus der bedingten Wahrscheinlichkeit für die Daten, gegeben die Parameter (Likelihood) und der a-priori Wahrscheinlichkeit für die Parameter (relativiert an der Randwahrscheinlichkeit für die Daten).

Der a-priori Wahrscheinlichkeit für den Parameter bzw. der Prior repräsentiert die Vorerfahrungen (Welche Informationen habe ich über den Parameter aus der Empirie oder vorherigen Berechnungsdurchgängen?). Die angenommen möglichen Ausprägungen des Parameters und ihre Wahrscheinlichkeit werden durch eine [[Verteilungsmodelle|Wahrscheinlichkeitsverteilung]] (Normal-, Bernoulli-, Gleichverteilung oder andere) modelliert. Stellen wir uns vor, wir haben aus vorherigen Studien oder Meta-Analysen eine gewisse Vorstellung darüber, wo der Slope unseres Regressionsmodells liegen könnte. Dieser konkrete Wert würde bei einer a-priori Normalverteilung den Mittelwert darstellen. Die Unsicherheit über unsere Annahme berücksichtigen wir dadurch, dass wir gleichzeitig auch die Streuung/Varianz unserer Normalverteilung für den Parameter festlegen. Bei maximaler Unsicherheit über den Prior, d.h. wenn wir keine Ahnung haben, wo der Parameterwert liegen könnte bzw. uns nicht festlegen wollen, werden die Wahrscheinlichkeiten für die Parameterausprägungen in Form einer Gleichverteilung bestimmt (d.h., alle Ausprägungen sind gleich wahrscheinlich).

Die Likelihood gibt uns die Wahrscheinlichkeit der Daten gegeben unsere Parameter. Wie wahrscheinlich ist die Verteilung unserer y- und x-Werte, wenn die Parameter bestimmte Werte annehmen? Wie kommen die Daten überhaupt zustande? (=> hier steckt das eigentliche Modell) Diese Wahrscheinlichkeit wird über ein [[MLE|Maximum-Likelihood Schätzungsverfahren]] berechnet. Über die Kombination der Likelihood für die Daten und der a-priori Wahrscheinlichkeit für die Parameter kann anschließend die posteriore Wahrscheinlichkeit für die Parameter, gegeben die Daten, bestimmt werden.

Der Posterior enthält eine von den (neuen) Daten informierte Schätzung für den Parameter (z.B. den Mittelwert oder Modalwert der Verteilung) sowie deren Unsicherheit (Streuung der Verteilung). Je mehr Daten in die Berechnung miteinbezogen werden, desto sicherer wird dabei die Schätzung (d.h., die Streuung des Posteriors nimmt ab).

Der Vorteil zu konventionellen (frequentistischen) statistischen Ansätzen liegt darin, dass wir nicht nur eine Schätzung, sondern immer gleich eine ganze Verteilung der gesuchten Parameter erhalten. Weiterhin ist es hier möglich, eigene Vorannahmen bzw. ältere Berechnungen über die Festlegung des Priors in die Analyse miteinzubeziehen.

== Anwendung in der Forschung ==

Viele Modelle aus der Entscheidungsforschung oder den kognitiven Neurowissenschaften versuchen Informationsverarbeitungsprozesse als eine Form von bayesianischer Inferenz zu betrachten. Diesen Ansätzen nach haben Menschen (und andere Informationsverarbeitungssysteme) keinen direkten Zugang zur Realität, sondern müssen die wahren, jedoch versteckten Ursachen ihrer Wahrnehmungen und Empfindungen (hidden causes) über ihren Input (z.B. elektrische Signale von den sensorischen Organen) über ein Modell schlussfolgern/inferieren. Da das Inputmuster i.d.R. verrauscht ist und es auch mit einer gewissen Wahrscheinlichkeit mit alternativen Modellen erklärt werden könnte, erfolgt diese Inferenz jedes Mal mit einer gewissen Unsicherheit. Agenten modellieren also ihre Umgebung und sich selbst, indem sie die versteckten Ursachen mit deren Wahrscheinlichkeit a-priori auf Grundlage ihrer Vorerfahrungen annehmen (Was habe ich bisher gelernt und was erwarte ich in meiner Umwelt?) und gegeben dieser angenommen Ursachen die Wahrscheinlichkeit für den Dateninput vorausberechnen (Likelihood, häufig auch „Generatives Modell“ genannt). Wenn nun die Daten schrittweise ins System gelangen, können Agenten ihr Modell je nach Passung auf die Daten immer weiter aktualisieren (über Berechnung der posterioren Wahrscheinlichkeit für die hidden causes / Parameter). Bei diesem '''bayesianischen Lernen''' wird der durch den Dateninput aktualisierte Posterior zum Prior für den nächsten Durchgang u.s.w. Somit wird das Modell über die Zeit immer präziser, sofern die Umwelt konstant bleibt.

Beispiele für Probabilistische Modelle aus der Kognitions- und Neurowissenschaft sind die [https://en.wikipedia.org/wiki/Helmholtz_machine Helmholtz-Maschine], das [[Hierarchical Gaussian Filter|Hierachical Gaussian Filtering]], [https://en.wikipedia.org/wiki/Predictive_coding Predictive Coding] oder das [https://www.youtube.com/watch?v=NIu_dJGyIQI&t=800s Freie Energie Prinzip].

Probabilistische Modelle

2018-10-03T14:34:47Z

Schäfer: /* Bayesianische Inferenz */

Probabilistische Modelle

2018-10-03T14:34:30Z

Schäfer: /* Bayesianische Inferenz */

{{Nav|Navigation|Mathematische Modelle|Kognitive Modellierung|Hauptseite}}

Kognitive Prozesse, wie zum Beispiel Wahrnehmungsurteile, beruhen auf unsicheren Schlussfolgerungen und müssen daher die '''Unsicherheit''' der Informationen berücksichtigen. Wenn man in der Dunkelheit die Umrisse einer bekannten Person erkennt, dann ist es wichtig, die Unsicherheit dieser Einschätzung im Kopf zu haben um sein Verhalten entsprechend anzupassen (und keinem ggf. gefährlichen Unbekannten unvorsichtig in die Arme zu rennen).

Im Gegensatz zu deterministischen Modellen berücksichtigen probabilistische Modelle explizit diese Unsicherheit in den Inputs und Outputs eines Verarbeitungsprozesses. Durch Quantifizierung der Unsicherheit (Zuverlässigkeit / Risiko) in den Messungen, den Modellparametern und der Passung des Modells an die Daten geben probabilistische Vorhersagen eine Reihe oder Verteilung an möglichen Outcomes vor statt einer Einzeleinschätzung. Dies wird einer komplexen und verrauschten Realität in der Regel besser gerecht. Doch wie repräsentiert man Unsicherheit?

== Wahrscheinlichkeitstheoretische Grundlagen ==

Probabilistische Modelle sind mathematische Modelle, die Zufallsvariablen und Wahrscheinlichkeitsverteilungen miteinschließen. '''Zufallsvariablen''' stellen das potentielle Ergebnis eines unsicheren Ereignisses dar (z.B. die Augenzahl eines Würfelwurfs); sie bilden Ereignisse als Zahlen ab. '''Wahrscheinlichkeitsverteilungen''' weisen den verschiedenen potentiellen Ergebnissen Wahrscheinlichkeitswerte zu (z.B. 1/6 für jede der sechs Augenzahlen).

Wenn wir X als unsere Zufallsvariable über eine Menge von messbaren Ereignissen definieren, dann gibt uns ''P(X = x)'' die Wahrscheinlichkeit, dass ''X'' den spezifischen Wert ''x'' annimmt (kurz geschrieben: ''p(x)''). Alle diese Wahrscheinlichkeiten sind positiv und sie summieren sich über die Ausprägungen der Zufallsvariable zu 1 auf.

Wichtige Begriffe aus der probabilistischen Theorie zum Auftreten von Merkmalskombinationen lassen sich durch eine '''Kontingenztafel''' veranschaulichen, die in ihren Zellen die Häufigkeiten nij für die Ereigniskombinationen der Zufallsvariablen ''X'' und ''Y'' enthält. Diese Ereignishäufigkeiten ''nij'' ergeben über alle Kombinationen summiert die Gesamthäufigkeit ''N'' und addieren sich an den Seiten zu den Randhäufigkeiten auf, jeweils über die Zeilen (''rj'' ) und Spalten (''ci'' ) der Kontingenztafel:

[[File:ProbMod_01.PNG|center|400px]]

Die '''Verbundwahrscheinlichkeit''' der Ereignisse ''xi'' und ''yj'', d.h. die Wahrscheinlichkeit ihres gleichzeitigen Eintretens ist:

[[File:ProbMod_02.png|center|600px]]

Also die Häufigkeit mit der diese Ereignisse gemeinsam auftreten ''nij'' durch die Häufigkeit aller Ereigniskombinationen ''N''.

Die '''Randwahrscheinlichkeit''' bezeichnet die Wahrscheinlichkeit für die Ausprägung einer Zufallsvariable über die Ausprägungen der anderen Zufallsvariablen hinweg, also die relative Wahrscheinlichkeit für die Ereignisse einer bestimmten Reihe oder Spalte der Kontingenztafel bzw. die jeweilige Randhäufigkeit durch die Gesamthäufigkeit N. Für eine bestimmte Reihe lautet die Formel:

[[File:ProbMod_03.png|center|600px]]

Die '''bedingte Wahrscheinlichkeit''' ''P(Y | X)'' ist die Wahrscheinlichkeit des Eintretens eines Ereignisses aus ''Y'' unter der Bedingung, dass das Eintreten eines Ereignisses aus ''X'' bereits bekannt ist. Sie berechnet sich aus der Häufigkeit des Eintretens beider Ereignisse und der Randhäufigkeit des bedingenden Ereignisses:

[[File:ProbMod_04.png|center|600px]]

Über die Produktregel kann man die Verbundwahrscheinlichkeit zweier Ereignisse über die bedingte Wahrscheinlichkeit und die Randwahrscheinlichkeit berechnen:

[[File:ProbMod_05.png|center|600px]]

Wenn wir die Produktregel nun umstellen erhalten wir:

[[File:ProbMod_06.png|center|600px]]

Diese Formel geht auf den Satz des englischen Mathematikers [https://de.wikipedia.org/wiki/Thomas_Bayes Thomas Bayes] zurück, laut dem sich für zwei Ereignisse ''X'' und ''Y'' die Wahrscheinlichkeit von ''Y'', unter der Bedingung, dass ''X'' eingetreten ist, durch die Wahrscheinlichkeit von ''X'', unter der Bedingung, dass ''Y'' eingetreten ist, errechnen lässt. Der [https://de.wikipedia.org/wiki/Satz_von_Bayes Satz von Bayes] erlaubt es, Schlussfolgerungen umzukehren, d.h. ausgehend von einem bekannten Wert ''P(X|Y)'' den eigentlich interessierenden Wert ''P(Y|X)'' zu bestimmen.

== Bayesianische Inferenz ==

Die Bayes’sche Regel ist die Basis für probabilistische Schlussfolgerung (Inferenz) und Lernen. Nehmen wir an, wir haben ein lineares (Regressions-)Modell mit den Parametern '''''β''''':

[[File:ProbMod_07.png|center|600px]]

Unser Ziel ist es, die '''''β'''''-Parameter herauszufinden, gegeben den Daten D (y- und x-Werte). Konkret wollen wir also wissen, wie wahrscheinlich ein bestimmter Wert eines '''''β'''''-Parameters (z.B. des Intercept β0) ist, wenn wir die Daten D vorliegen haben. Um diese Wahrscheinlichkeit zu bestimmen bzw. eine bedingte Wahrscheinlichkeitsverteilung für den '''''β'''''-Parameter zu erhalten, greifen wir dabei auf die obige Formel von Bayes zurück (''β0'' und ''β1'' sind hier zusammengefasst, werden aber separat bestimmt):

[[File:ProbMod_08.PNG|center|200px]]

In der Terminologie der bayesianischen Inferenz beinhaltet diese Formel einen Posterior (blau), der sich aus der Likelihood (grün) und dem Prior (gelb) berechnet.

Der Posterior bzw. die posteriore Wahrscheinlichkeit, ist die Wahrscheinlichkeit, die Parameter '''''β''''' mit den vorliegenden Daten zu finden. Sie errechnet sich laut der Formel aus der bedingten Wahrscheinlichkeit für die Daten, gegeben die Parameter (Likelihood) und der a-priori Wahrscheinlichkeit für die Parameter (relativiert an der Randwahrscheinlichkeit für die Daten).

Der a-priori Wahrscheinlichkeit für den Parameter bzw. der Prior repräsentiert die Vorerfahrungen (Welche Informationen habe ich über den Parameter aus der Empirie oder vorherigen Berechnungsdurchgängen?). Die angenommen möglichen Ausprägungen des Parameters und ihre Wahrscheinlichkeit werden durch eine [[Verteilungsmodelle|Wahrscheinlichkeitsverteilung]] (Normal-, Bernoulli-, Gleichverteilung oder andere) modelliert. Stellen wir uns vor, wir haben aus vorherigen Studien oder Meta-Analysen eine gewisse Vorstellung darüber, wo der Slope unseres Regressionsmodells liegen könnte. Dieser konkrete Wert würde bei einer a-priori Normalverteilung den Mittelwert darstellen. Die Unsicherheit über unsere Annahme berücksichtigen wir dadurch, dass wir gleichzeitig auch die Streuung/Varianz unserer Normalverteilung für den Parameter festlegen. Bei maximaler Unsicherheit über den Prior, d.h. wenn wir keine Ahnung haben, wo der Parameterwert liegen könnte bzw. uns nicht festlegen wollen, werden die Wahrscheinlichkeiten für die Parameterausprägungen in Form einer Gleichverteilung bestimmt (d.h., alle Ausprägungen sind gleich wahrscheinlich).

Die Likelihood gibt uns die Wahrscheinlichkeit der Daten gegeben unsere Parameter. Wie wahrscheinlich ist die Verteilung unserer y- und x-Werte, wenn die Parameter bestimmte Werte annehmen? Wie kommen die Daten überhaupt zustande? (=> hier steckt das eigentliche Modell) Diese Wahrscheinlichkeit wird über ein [[MLE|Maximum-Likelihood Schätzungsverfahren]] berechnet. Über die Kombination der Likelihood für die Daten und der a-priori Wahrscheinlichkeit für die Parameter kann anschließend die posteriore Wahrscheinlichkeit für die Parameter, gegeben die Daten, bestimmt werden.

Der Posterior enthält eine von den (neuen) Daten informierte Schätzung für den Parameter (z.B. den Mittelwert oder Modalwert der Verteilung) sowie deren Unsicherheit (Streuung der Verteilung). Je mehr Daten in die Berechnung miteinbezogen werden, desto sicherer wird dabei die Schätzung (d.h., die Streuung des Posteriors nimmt ab).

Der Vorteil zu konventionellen (frequentistischen) statistischen Ansätzen liegt darin, dass wir nicht nur eine Schätzung, sondern immer gleich eine ganze Verteilung der gesuchten Parameter erhalten. Weiterhin ist es hier möglich, eigene Vorannahmen bzw. ältere Berechnungen über die Festlegung des Priors in die Analyse miteinzubeziehen.

== Anwendung in der Forschung ==

Viele Modelle aus der Entscheidungsforschung oder den kognitiven Neurowissenschaften versuchen Informationsverarbeitungsprozesse als eine Form von bayesianischer Inferenz zu betrachten. Diesen Ansätzen nach haben Menschen (und andere Informationsverarbeitungssysteme) keinen direkten Zugang zur Realität, sondern müssen die wahren, jedoch versteckten Ursachen ihrer Wahrnehmungen und Empfindungen (hidden causes) über ihren Input (z.B. elektrische Signale von den sensorischen Organen) über ein Modell schlussfolgern/inferieren. Da das Inputmuster i.d.R. verrauscht ist und es auch mit einer gewissen Wahrscheinlichkeit mit alternativen Modellen erklärt werden könnte, erfolgt diese Inferenz jedes Mal mit einer gewissen Unsicherheit. Agenten modellieren also ihre Umgebung und sich selbst, indem sie die versteckten Ursachen mit deren Wahrscheinlichkeit a-priori auf Grundlage ihrer Vorerfahrungen annehmen (Was habe ich bisher gelernt und was erwarte ich in meiner Umwelt?) und gegeben dieser angenommen Ursachen die Wahrscheinlichkeit für den Dateninput vorausberechnen (Likelihood, häufig auch „Generatives Modell“ genannt). Wenn nun die Daten schrittweise ins System gelangen, können Agenten ihr Modell je nach Passung auf die Daten immer weiter aktualisieren (über Berechnung der posterioren Wahrscheinlichkeit für die hidden causes / Parameter). Bei diesem '''bayesianischen Lernen''' wird der durch den Dateninput aktualisierte Posterior zum Prior für den nächsten Durchgang u.s.w. Somit wird das Modell über die Zeit immer präziser, sofern die Umwelt konstant bleibt.

Beispiele für Probabilistische Modelle aus der Kognitions- und Neurowissenschaft sind die [https://en.wikipedia.org/wiki/Helmholtz_machine Helmholtz-Maschine], das [[Hierarchical Gaussian Filter|Hierachical Gaussian Filtering]], [https://en.wikipedia.org/wiki/Predictive_coding Predictive Coding] oder das [https://www.youtube.com/watch?v=NIu_dJGyIQI&t=800s Freie Energie Prinzip].

Probabilistische Modelle

2018-10-03T14:34:18Z

Schäfer: /* Bayesianische Inferenz */

{{Nav|Navigation|Mathematische Modelle|Kognitive Modellierung|Hauptseite}}

Kognitive Prozesse, wie zum Beispiel Wahrnehmungsurteile, beruhen auf unsicheren Schlussfolgerungen und müssen daher die '''Unsicherheit''' der Informationen berücksichtigen. Wenn man in der Dunkelheit die Umrisse einer bekannten Person erkennt, dann ist es wichtig, die Unsicherheit dieser Einschätzung im Kopf zu haben um sein Verhalten entsprechend anzupassen (und keinem ggf. gefährlichen Unbekannten unvorsichtig in die Arme zu rennen).

Im Gegensatz zu deterministischen Modellen berücksichtigen probabilistische Modelle explizit diese Unsicherheit in den Inputs und Outputs eines Verarbeitungsprozesses. Durch Quantifizierung der Unsicherheit (Zuverlässigkeit / Risiko) in den Messungen, den Modellparametern und der Passung des Modells an die Daten geben probabilistische Vorhersagen eine Reihe oder Verteilung an möglichen Outcomes vor statt einer Einzeleinschätzung. Dies wird einer komplexen und verrauschten Realität in der Regel besser gerecht. Doch wie repräsentiert man Unsicherheit?

== Wahrscheinlichkeitstheoretische Grundlagen ==

Probabilistische Modelle sind mathematische Modelle, die Zufallsvariablen und Wahrscheinlichkeitsverteilungen miteinschließen. '''Zufallsvariablen''' stellen das potentielle Ergebnis eines unsicheren Ereignisses dar (z.B. die Augenzahl eines Würfelwurfs); sie bilden Ereignisse als Zahlen ab. '''Wahrscheinlichkeitsverteilungen''' weisen den verschiedenen potentiellen Ergebnissen Wahrscheinlichkeitswerte zu (z.B. 1/6 für jede der sechs Augenzahlen).

Wenn wir X als unsere Zufallsvariable über eine Menge von messbaren Ereignissen definieren, dann gibt uns ''P(X = x)'' die Wahrscheinlichkeit, dass ''X'' den spezifischen Wert ''x'' annimmt (kurz geschrieben: ''p(x)''). Alle diese Wahrscheinlichkeiten sind positiv und sie summieren sich über die Ausprägungen der Zufallsvariable zu 1 auf.

Wichtige Begriffe aus der probabilistischen Theorie zum Auftreten von Merkmalskombinationen lassen sich durch eine '''Kontingenztafel''' veranschaulichen, die in ihren Zellen die Häufigkeiten nij für die Ereigniskombinationen der Zufallsvariablen ''X'' und ''Y'' enthält. Diese Ereignishäufigkeiten ''nij'' ergeben über alle Kombinationen summiert die Gesamthäufigkeit ''N'' und addieren sich an den Seiten zu den Randhäufigkeiten auf, jeweils über die Zeilen (''rj'' ) und Spalten (''ci'' ) der Kontingenztafel:

[[File:ProbMod_01.PNG|center|400px]]

Die '''Verbundwahrscheinlichkeit''' der Ereignisse ''xi'' und ''yj'', d.h. die Wahrscheinlichkeit ihres gleichzeitigen Eintretens ist:

[[File:ProbMod_02.png|center|600px]]

Also die Häufigkeit mit der diese Ereignisse gemeinsam auftreten ''nij'' durch die Häufigkeit aller Ereigniskombinationen ''N''.

Die '''Randwahrscheinlichkeit''' bezeichnet die Wahrscheinlichkeit für die Ausprägung einer Zufallsvariable über die Ausprägungen der anderen Zufallsvariablen hinweg, also die relative Wahrscheinlichkeit für die Ereignisse einer bestimmten Reihe oder Spalte der Kontingenztafel bzw. die jeweilige Randhäufigkeit durch die Gesamthäufigkeit N. Für eine bestimmte Reihe lautet die Formel:

[[File:ProbMod_03.png|center|600px]]

Die '''bedingte Wahrscheinlichkeit''' ''P(Y | X)'' ist die Wahrscheinlichkeit des Eintretens eines Ereignisses aus ''Y'' unter der Bedingung, dass das Eintreten eines Ereignisses aus ''X'' bereits bekannt ist. Sie berechnet sich aus der Häufigkeit des Eintretens beider Ereignisse und der Randhäufigkeit des bedingenden Ereignisses:

[[File:ProbMod_04.png|center|600px]]

Über die Produktregel kann man die Verbundwahrscheinlichkeit zweier Ereignisse über die bedingte Wahrscheinlichkeit und die Randwahrscheinlichkeit berechnen:

[[File:ProbMod_05.png|center|600px]]

Wenn wir die Produktregel nun umstellen erhalten wir:

[[File:ProbMod_06.png|center|600px]]

Diese Formel geht auf den Satz des englischen Mathematikers [https://de.wikipedia.org/wiki/Thomas_Bayes Thomas Bayes] zurück, laut dem sich für zwei Ereignisse ''X'' und ''Y'' die Wahrscheinlichkeit von ''Y'', unter der Bedingung, dass ''X'' eingetreten ist, durch die Wahrscheinlichkeit von ''X'', unter der Bedingung, dass ''Y'' eingetreten ist, errechnen lässt. Der [https://de.wikipedia.org/wiki/Satz_von_Bayes Satz von Bayes] erlaubt es, Schlussfolgerungen umzukehren, d.h. ausgehend von einem bekannten Wert ''P(X|Y)'' den eigentlich interessierenden Wert ''P(Y|X)'' zu bestimmen.

== Bayesianische Inferenz ==

Die Bayes’sche Regel ist die Basis für probabilistische Schlussfolgerung (Inferenz) und Lernen. Nehmen wir an, wir haben ein lineares (Regressions-)Modell mit den Parametern '''''β''''':

[[File:ProbMod_07.png|center|600px]]

Unser Ziel ist es, die '''''β'''''-Parameter herauszufinden, gegeben den Daten D (y- und x-Werte). Konkret wollen wir also wissen, wie wahrscheinlich ein bestimmter Wert eines '''''β'''''-Parameters (z.B. des Intercept β0) ist, wenn wir die Daten D vorliegen haben. Um diese Wahrscheinlichkeit zu bestimmen bzw. eine bedingte Wahrscheinlichkeitsverteilung für den '''''β'''''-Parameter zu erhalten, greifen wir dabei auf die obige Formel von Bayes zurück (''β0'' und ''β1'' sind hier zusammengefasst, werden aber separat bestimmt):

[[File:ProbMod_08.PNG|center|200px]]

In der Terminologie der bayesianischen Inferenz beinhaltet diese Formel einen Posterior (blau), der sich aus der Likelihood (grün) und dem Prior (gelb) berechnet.

Der Posterior bzw. die posteriore Wahrscheinlichkeit, ist die Wahrscheinlichkeit, die Parameter '''''β''''' mit den vorliegenden Daten zu finden. Sie errechnet sich laut der Formel aus der bedingten Wahrscheinlichkeit für die Daten, gegeben die Parameter (Likelihood) und der a-priori Wahrscheinlichkeit für die Parameter (relativiert an der Randwahrscheinlichkeit für die Daten).

Der a-priori Wahrscheinlichkeit für den Parameter bzw. der Prior repräsentiert die Vorerfahrungen (Welche Informationen habe ich über den Parameter aus der Empirie oder vorherigen Berechnungsdurchgängen?). Die angenommen möglichen Ausprägungen des Parameters und ihre Wahrscheinlichkeit werden durch eine [[Verteilungsmodelle|Wahrscheinlichkeitsverteilung]] (Normal-, Bernoulli-, Gleichverteilung oder andere) modelliert. Stellen wir uns vor, wir haben aus vorherigen Studien oder Meta-Analysen eine gewisse Vorstellung darüber, wo der Slope unseres Regressionsmodells liegen könnte. Dieser konkrete Wert würde bei einer a-priori Normalverteilung den Mittelwert darstellen. Die Unsicherheit über unsere Annahme berücksichtigen wir dadurch, dass wir gleichzeitig auch die Streuung/Varianz unserer Normalverteilung für den Parameter festlegen. Bei maximaler Unsicherheit über den Prior, d.h. wenn wir keine Ahnung haben, wo der Parameterwert liegen könnte bzw. uns nicht festlegen wollen, werden die Wahrscheinlichkeiten für die Parameterausprägungen in Form einer Gleichverteilung bestimmt (d.h., alle Ausprägungen sind gleich wahrscheinlich).

Die Likelihood gibt uns die Wahrscheinlichkeit der Daten gegeben unsere Parameter. Wie wahrscheinlich ist die Verteilung unserer y- und x-Werte, wenn die Parameter bestimmte Werte annehmen? Wie kommen die Daten überhaupt zustande? (=> hier steckt das eigentliche Modell) Diese Wahrscheinlichkeit wird über ein [[MLE|Maximum-Likelihood Schätzungsverfahren]] berechnet. Über die Kombination der Likelihood für die Daten und der a-priori Wahrscheinlichkeit für die Parameter kann anschließend die posteriore Wahrscheinlichkeit für die Parameter, gegeben die Daten, bestimmt werden.

Der Posterior enthält eine von den (neuen) Daten informierte Schätzung für den Parameter (z.B. den Mittelwert oder Modalwert der Verteilung) sowie deren Unsicherheit (Streuung der Verteilung). Je mehr Daten in die Berechnung miteinbezogen werden, desto sicherer wird dabei die Schätzung (d.h., die Streuung des Posteriors nimmt ab).

Der Vorteil zu konventionellen (frequentistischen) statistischen Ansätzen liegt darin, dass wir nicht nur eine Schätzung, sondern immer gleich eine ganze Verteilung der gesuchten Parameter erhalten. Weiterhin ist es hier möglich, eigene Vorannahmen bzw. ältere Berechnungen über die Festlegung des Priors in die Analyse miteinzubeziehen.

== Anwendung in der Forschung ==

Viele Modelle aus der Entscheidungsforschung oder den kognitiven Neurowissenschaften versuchen Informationsverarbeitungsprozesse als eine Form von bayesianischer Inferenz zu betrachten. Diesen Ansätzen nach haben Menschen (und andere Informationsverarbeitungssysteme) keinen direkten Zugang zur Realität, sondern müssen die wahren, jedoch versteckten Ursachen ihrer Wahrnehmungen und Empfindungen (hidden causes) über ihren Input (z.B. elektrische Signale von den sensorischen Organen) über ein Modell schlussfolgern/inferieren. Da das Inputmuster i.d.R. verrauscht ist und es auch mit einer gewissen Wahrscheinlichkeit mit alternativen Modellen erklärt werden könnte, erfolgt diese Inferenz jedes Mal mit einer gewissen Unsicherheit. Agenten modellieren also ihre Umgebung und sich selbst, indem sie die versteckten Ursachen mit deren Wahrscheinlichkeit a-priori auf Grundlage ihrer Vorerfahrungen annehmen (Was habe ich bisher gelernt und was erwarte ich in meiner Umwelt?) und gegeben dieser angenommen Ursachen die Wahrscheinlichkeit für den Dateninput vorausberechnen (Likelihood, häufig auch „Generatives Modell“ genannt). Wenn nun die Daten schrittweise ins System gelangen, können Agenten ihr Modell je nach Passung auf die Daten immer weiter aktualisieren (über Berechnung der posterioren Wahrscheinlichkeit für die hidden causes / Parameter). Bei diesem '''bayesianischen Lernen''' wird der durch den Dateninput aktualisierte Posterior zum Prior für den nächsten Durchgang u.s.w. Somit wird das Modell über die Zeit immer präziser, sofern die Umwelt konstant bleibt.

Beispiele für Probabilistische Modelle aus der Kognitions- und Neurowissenschaft sind die [https://en.wikipedia.org/wiki/Helmholtz_machine Helmholtz-Maschine], das [[Hierarchical Gaussian Filter|Hierachical Gaussian Filtering]], [https://en.wikipedia.org/wiki/Predictive_coding Predictive Coding] oder das [https://www.youtube.com/watch?v=NIu_dJGyIQI&t=800s Freie Energie Prinzip].

Probabilistische Modelle

2018-10-03T14:34:09Z

Schäfer: /* Bayesianische Inferenz */

{{Nav|Navigation|Mathematische Modelle|Kognitive Modellierung|Hauptseite}}

Kognitive Prozesse, wie zum Beispiel Wahrnehmungsurteile, beruhen auf unsicheren Schlussfolgerungen und müssen daher die '''Unsicherheit''' der Informationen berücksichtigen. Wenn man in der Dunkelheit die Umrisse einer bekannten Person erkennt, dann ist es wichtig, die Unsicherheit dieser Einschätzung im Kopf zu haben um sein Verhalten entsprechend anzupassen (und keinem ggf. gefährlichen Unbekannten unvorsichtig in die Arme zu rennen).

Im Gegensatz zu deterministischen Modellen berücksichtigen probabilistische Modelle explizit diese Unsicherheit in den Inputs und Outputs eines Verarbeitungsprozesses. Durch Quantifizierung der Unsicherheit (Zuverlässigkeit / Risiko) in den Messungen, den Modellparametern und der Passung des Modells an die Daten geben probabilistische Vorhersagen eine Reihe oder Verteilung an möglichen Outcomes vor statt einer Einzeleinschätzung. Dies wird einer komplexen und verrauschten Realität in der Regel besser gerecht. Doch wie repräsentiert man Unsicherheit?

== Wahrscheinlichkeitstheoretische Grundlagen ==

Probabilistische Modelle sind mathematische Modelle, die Zufallsvariablen und Wahrscheinlichkeitsverteilungen miteinschließen. '''Zufallsvariablen''' stellen das potentielle Ergebnis eines unsicheren Ereignisses dar (z.B. die Augenzahl eines Würfelwurfs); sie bilden Ereignisse als Zahlen ab. '''Wahrscheinlichkeitsverteilungen''' weisen den verschiedenen potentiellen Ergebnissen Wahrscheinlichkeitswerte zu (z.B. 1/6 für jede der sechs Augenzahlen).

Wenn wir X als unsere Zufallsvariable über eine Menge von messbaren Ereignissen definieren, dann gibt uns ''P(X = x)'' die Wahrscheinlichkeit, dass ''X'' den spezifischen Wert ''x'' annimmt (kurz geschrieben: ''p(x)''). Alle diese Wahrscheinlichkeiten sind positiv und sie summieren sich über die Ausprägungen der Zufallsvariable zu 1 auf.

Wichtige Begriffe aus der probabilistischen Theorie zum Auftreten von Merkmalskombinationen lassen sich durch eine '''Kontingenztafel''' veranschaulichen, die in ihren Zellen die Häufigkeiten nij für die Ereigniskombinationen der Zufallsvariablen ''X'' und ''Y'' enthält. Diese Ereignishäufigkeiten ''nij'' ergeben über alle Kombinationen summiert die Gesamthäufigkeit ''N'' und addieren sich an den Seiten zu den Randhäufigkeiten auf, jeweils über die Zeilen (''rj'' ) und Spalten (''ci'' ) der Kontingenztafel:

[[File:ProbMod_01.PNG|center|400px]]

Die '''Verbundwahrscheinlichkeit''' der Ereignisse ''xi'' und ''yj'', d.h. die Wahrscheinlichkeit ihres gleichzeitigen Eintretens ist:

[[File:ProbMod_02.png|center|600px]]

Also die Häufigkeit mit der diese Ereignisse gemeinsam auftreten ''nij'' durch die Häufigkeit aller Ereigniskombinationen ''N''.

Die '''Randwahrscheinlichkeit''' bezeichnet die Wahrscheinlichkeit für die Ausprägung einer Zufallsvariable über die Ausprägungen der anderen Zufallsvariablen hinweg, also die relative Wahrscheinlichkeit für die Ereignisse einer bestimmten Reihe oder Spalte der Kontingenztafel bzw. die jeweilige Randhäufigkeit durch die Gesamthäufigkeit N. Für eine bestimmte Reihe lautet die Formel:

[[File:ProbMod_03.png|center|600px]]

Die '''bedingte Wahrscheinlichkeit''' ''P(Y | X)'' ist die Wahrscheinlichkeit des Eintretens eines Ereignisses aus ''Y'' unter der Bedingung, dass das Eintreten eines Ereignisses aus ''X'' bereits bekannt ist. Sie berechnet sich aus der Häufigkeit des Eintretens beider Ereignisse und der Randhäufigkeit des bedingenden Ereignisses:

[[File:ProbMod_04.png|center|600px]]

Über die Produktregel kann man die Verbundwahrscheinlichkeit zweier Ereignisse über die bedingte Wahrscheinlichkeit und die Randwahrscheinlichkeit berechnen:

[[File:ProbMod_05.png|center|600px]]

Wenn wir die Produktregel nun umstellen erhalten wir:

[[File:ProbMod_06.png|center|600px]]

Diese Formel geht auf den Satz des englischen Mathematikers [https://de.wikipedia.org/wiki/Thomas_Bayes Thomas Bayes] zurück, laut dem sich für zwei Ereignisse ''X'' und ''Y'' die Wahrscheinlichkeit von ''Y'', unter der Bedingung, dass ''X'' eingetreten ist, durch die Wahrscheinlichkeit von ''X'', unter der Bedingung, dass ''Y'' eingetreten ist, errechnen lässt. Der [https://de.wikipedia.org/wiki/Satz_von_Bayes Satz von Bayes] erlaubt es, Schlussfolgerungen umzukehren, d.h. ausgehend von einem bekannten Wert ''P(X|Y)'' den eigentlich interessierenden Wert ''P(Y|X)'' zu bestimmen.

== Bayesianische Inferenz ==

Die Bayes’sche Regel ist die Basis für probabilistische Schlussfolgerung (Inferenz) und Lernen. Nehmen wir an, wir haben ein lineares (Regressions-)Modell mit den Parametern '''''β''''':

[[File:ProbMod_07.png|center|600px]]

Unser Ziel ist es, die '''''β'''''-Parameter herauszufinden, gegeben den Daten D (y- und x-Werte). Konkret wollen wir also wissen, wie wahrscheinlich ein bestimmter Wert eines '''''β'''''-Parameters (z.B. des Intercept β0) ist, wenn wir die Daten D vorliegen haben. Um diese Wahrscheinlichkeit zu bestimmen bzw. eine bedingte Wahrscheinlichkeitsverteilung für den '''''β'''''-Parameter zu erhalten, greifen wir dabei auf die obige Formel von Bayes zurück (''β0'' und ''β1'' sind hier zusammengefasst, werden aber separat bestimmt):

[[File:ProbMod_08.PNG|center|300px]]

In der Terminologie der bayesianischen Inferenz beinhaltet diese Formel einen Posterior (blau), der sich aus der Likelihood (grün) und dem Prior (gelb) berechnet.

Der Posterior bzw. die posteriore Wahrscheinlichkeit, ist die Wahrscheinlichkeit, die Parameter '''''β''''' mit den vorliegenden Daten zu finden. Sie errechnet sich laut der Formel aus der bedingten Wahrscheinlichkeit für die Daten, gegeben die Parameter (Likelihood) und der a-priori Wahrscheinlichkeit für die Parameter (relativiert an der Randwahrscheinlichkeit für die Daten).

Der a-priori Wahrscheinlichkeit für den Parameter bzw. der Prior repräsentiert die Vorerfahrungen (Welche Informationen habe ich über den Parameter aus der Empirie oder vorherigen Berechnungsdurchgängen?). Die angenommen möglichen Ausprägungen des Parameters und ihre Wahrscheinlichkeit werden durch eine [[Verteilungsmodelle|Wahrscheinlichkeitsverteilung]] (Normal-, Bernoulli-, Gleichverteilung oder andere) modelliert. Stellen wir uns vor, wir haben aus vorherigen Studien oder Meta-Analysen eine gewisse Vorstellung darüber, wo der Slope unseres Regressionsmodells liegen könnte. Dieser konkrete Wert würde bei einer a-priori Normalverteilung den Mittelwert darstellen. Die Unsicherheit über unsere Annahme berücksichtigen wir dadurch, dass wir gleichzeitig auch die Streuung/Varianz unserer Normalverteilung für den Parameter festlegen. Bei maximaler Unsicherheit über den Prior, d.h. wenn wir keine Ahnung haben, wo der Parameterwert liegen könnte bzw. uns nicht festlegen wollen, werden die Wahrscheinlichkeiten für die Parameterausprägungen in Form einer Gleichverteilung bestimmt (d.h., alle Ausprägungen sind gleich wahrscheinlich).

Die Likelihood gibt uns die Wahrscheinlichkeit der Daten gegeben unsere Parameter. Wie wahrscheinlich ist die Verteilung unserer y- und x-Werte, wenn die Parameter bestimmte Werte annehmen? Wie kommen die Daten überhaupt zustande? (=> hier steckt das eigentliche Modell) Diese Wahrscheinlichkeit wird über ein [[MLE|Maximum-Likelihood Schätzungsverfahren]] berechnet. Über die Kombination der Likelihood für die Daten und der a-priori Wahrscheinlichkeit für die Parameter kann anschließend die posteriore Wahrscheinlichkeit für die Parameter, gegeben die Daten, bestimmt werden.

Der Posterior enthält eine von den (neuen) Daten informierte Schätzung für den Parameter (z.B. den Mittelwert oder Modalwert der Verteilung) sowie deren Unsicherheit (Streuung der Verteilung). Je mehr Daten in die Berechnung miteinbezogen werden, desto sicherer wird dabei die Schätzung (d.h., die Streuung des Posteriors nimmt ab).

Der Vorteil zu konventionellen (frequentistischen) statistischen Ansätzen liegt darin, dass wir nicht nur eine Schätzung, sondern immer gleich eine ganze Verteilung der gesuchten Parameter erhalten. Weiterhin ist es hier möglich, eigene Vorannahmen bzw. ältere Berechnungen über die Festlegung des Priors in die Analyse miteinzubeziehen.

== Anwendung in der Forschung ==

Viele Modelle aus der Entscheidungsforschung oder den kognitiven Neurowissenschaften versuchen Informationsverarbeitungsprozesse als eine Form von bayesianischer Inferenz zu betrachten. Diesen Ansätzen nach haben Menschen (und andere Informationsverarbeitungssysteme) keinen direkten Zugang zur Realität, sondern müssen die wahren, jedoch versteckten Ursachen ihrer Wahrnehmungen und Empfindungen (hidden causes) über ihren Input (z.B. elektrische Signale von den sensorischen Organen) über ein Modell schlussfolgern/inferieren. Da das Inputmuster i.d.R. verrauscht ist und es auch mit einer gewissen Wahrscheinlichkeit mit alternativen Modellen erklärt werden könnte, erfolgt diese Inferenz jedes Mal mit einer gewissen Unsicherheit. Agenten modellieren also ihre Umgebung und sich selbst, indem sie die versteckten Ursachen mit deren Wahrscheinlichkeit a-priori auf Grundlage ihrer Vorerfahrungen annehmen (Was habe ich bisher gelernt und was erwarte ich in meiner Umwelt?) und gegeben dieser angenommen Ursachen die Wahrscheinlichkeit für den Dateninput vorausberechnen (Likelihood, häufig auch „Generatives Modell“ genannt). Wenn nun die Daten schrittweise ins System gelangen, können Agenten ihr Modell je nach Passung auf die Daten immer weiter aktualisieren (über Berechnung der posterioren Wahrscheinlichkeit für die hidden causes / Parameter). Bei diesem '''bayesianischen Lernen''' wird der durch den Dateninput aktualisierte Posterior zum Prior für den nächsten Durchgang u.s.w. Somit wird das Modell über die Zeit immer präziser, sofern die Umwelt konstant bleibt.

Beispiele für Probabilistische Modelle aus der Kognitions- und Neurowissenschaft sind die [https://en.wikipedia.org/wiki/Helmholtz_machine Helmholtz-Maschine], das [[Hierarchical Gaussian Filter|Hierachical Gaussian Filtering]], [https://en.wikipedia.org/wiki/Predictive_coding Predictive Coding] oder das [https://www.youtube.com/watch?v=NIu_dJGyIQI&t=800s Freie Energie Prinzip].

Probabilistische Modelle

2018-10-03T14:33:38Z

Schäfer:

{{Nav|Navigation|Mathematische Modelle|Kognitive Modellierung|Hauptseite}}

Kognitive Prozesse, wie zum Beispiel Wahrnehmungsurteile, beruhen auf unsicheren Schlussfolgerungen und müssen daher die '''Unsicherheit''' der Informationen berücksichtigen. Wenn man in der Dunkelheit die Umrisse einer bekannten Person erkennt, dann ist es wichtig, die Unsicherheit dieser Einschätzung im Kopf zu haben um sein Verhalten entsprechend anzupassen (und keinem ggf. gefährlichen Unbekannten unvorsichtig in die Arme zu rennen).

Im Gegensatz zu deterministischen Modellen berücksichtigen probabilistische Modelle explizit diese Unsicherheit in den Inputs und Outputs eines Verarbeitungsprozesses. Durch Quantifizierung der Unsicherheit (Zuverlässigkeit / Risiko) in den Messungen, den Modellparametern und der Passung des Modells an die Daten geben probabilistische Vorhersagen eine Reihe oder Verteilung an möglichen Outcomes vor statt einer Einzeleinschätzung. Dies wird einer komplexen und verrauschten Realität in der Regel besser gerecht. Doch wie repräsentiert man Unsicherheit?

== Wahrscheinlichkeitstheoretische Grundlagen ==

Probabilistische Modelle sind mathematische Modelle, die Zufallsvariablen und Wahrscheinlichkeitsverteilungen miteinschließen. '''Zufallsvariablen''' stellen das potentielle Ergebnis eines unsicheren Ereignisses dar (z.B. die Augenzahl eines Würfelwurfs); sie bilden Ereignisse als Zahlen ab. '''Wahrscheinlichkeitsverteilungen''' weisen den verschiedenen potentiellen Ergebnissen Wahrscheinlichkeitswerte zu (z.B. 1/6 für jede der sechs Augenzahlen).

Wenn wir X als unsere Zufallsvariable über eine Menge von messbaren Ereignissen definieren, dann gibt uns ''P(X = x)'' die Wahrscheinlichkeit, dass ''X'' den spezifischen Wert ''x'' annimmt (kurz geschrieben: ''p(x)''). Alle diese Wahrscheinlichkeiten sind positiv und sie summieren sich über die Ausprägungen der Zufallsvariable zu 1 auf.

Wichtige Begriffe aus der probabilistischen Theorie zum Auftreten von Merkmalskombinationen lassen sich durch eine '''Kontingenztafel''' veranschaulichen, die in ihren Zellen die Häufigkeiten nij für die Ereigniskombinationen der Zufallsvariablen ''X'' und ''Y'' enthält. Diese Ereignishäufigkeiten ''nij'' ergeben über alle Kombinationen summiert die Gesamthäufigkeit ''N'' und addieren sich an den Seiten zu den Randhäufigkeiten auf, jeweils über die Zeilen (''rj'' ) und Spalten (''ci'' ) der Kontingenztafel:

[[File:ProbMod_01.PNG|center|400px]]

Die '''Verbundwahrscheinlichkeit''' der Ereignisse ''xi'' und ''yj'', d.h. die Wahrscheinlichkeit ihres gleichzeitigen Eintretens ist:

[[File:ProbMod_02.png|center|600px]]

Also die Häufigkeit mit der diese Ereignisse gemeinsam auftreten ''nij'' durch die Häufigkeit aller Ereigniskombinationen ''N''.

Die '''Randwahrscheinlichkeit''' bezeichnet die Wahrscheinlichkeit für die Ausprägung einer Zufallsvariable über die Ausprägungen der anderen Zufallsvariablen hinweg, also die relative Wahrscheinlichkeit für die Ereignisse einer bestimmten Reihe oder Spalte der Kontingenztafel bzw. die jeweilige Randhäufigkeit durch die Gesamthäufigkeit N. Für eine bestimmte Reihe lautet die Formel:

[[File:ProbMod_03.png|center|600px]]

Die '''bedingte Wahrscheinlichkeit''' ''P(Y | X)'' ist die Wahrscheinlichkeit des Eintretens eines Ereignisses aus ''Y'' unter der Bedingung, dass das Eintreten eines Ereignisses aus ''X'' bereits bekannt ist. Sie berechnet sich aus der Häufigkeit des Eintretens beider Ereignisse und der Randhäufigkeit des bedingenden Ereignisses:

[[File:ProbMod_04.png|center|600px]]

Über die Produktregel kann man die Verbundwahrscheinlichkeit zweier Ereignisse über die bedingte Wahrscheinlichkeit und die Randwahrscheinlichkeit berechnen:

[[File:ProbMod_05.png|center|600px]]

Wenn wir die Produktregel nun umstellen erhalten wir:

[[File:ProbMod_06.png|center|600px]]

Diese Formel geht auf den Satz des englischen Mathematikers [https://de.wikipedia.org/wiki/Thomas_Bayes Thomas Bayes] zurück, laut dem sich für zwei Ereignisse ''X'' und ''Y'' die Wahrscheinlichkeit von ''Y'', unter der Bedingung, dass ''X'' eingetreten ist, durch die Wahrscheinlichkeit von ''X'', unter der Bedingung, dass ''Y'' eingetreten ist, errechnen lässt. Der [https://de.wikipedia.org/wiki/Satz_von_Bayes Satz von Bayes] erlaubt es, Schlussfolgerungen umzukehren, d.h. ausgehend von einem bekannten Wert ''P(X|Y)'' den eigentlich interessierenden Wert ''P(Y|X)'' zu bestimmen.

== Bayesianische Inferenz ==

Die Bayes’sche Regel ist die Basis für probabilistische Schlussfolgerung (Inferenz) und Lernen. Nehmen wir an, wir haben ein lineares (Regressions-)Modell mit den Parametern '''''β''''':

[[File:ProbMod_07.png|center|600px]]

Unser Ziel ist es, die '''''β'''''-Parameter herauszufinden, gegeben den Daten D (y- und x-Werte). Konkret wollen wir also wissen, wie wahrscheinlich ein bestimmter Wert eines '''''β'''''-Parameters (z.B. des Intercept β0) ist, wenn wir die Daten D vorliegen haben. Um diese Wahrscheinlichkeit zu bestimmen bzw. eine bedingte Wahrscheinlichkeitsverteilung für den '''''β'''''-Parameter zu erhalten, greifen wir dabei auf die obige Formel von Bayes zurück (''β0'' und ''β1'' sind hier zusammengefasst, werden aber separat bestimmt):

[[File:ProbMod_08.png|center|600px]]

In der Terminologie der bayesianischen Inferenz beinhaltet diese Formel einen Posterior (blau), der sich aus der Likelihood (grün) und dem Prior (gelb) berechnet.

Der Posterior bzw. die posteriore Wahrscheinlichkeit, ist die Wahrscheinlichkeit, die Parameter '''''β''''' mit den vorliegenden Daten zu finden. Sie errechnet sich laut der Formel aus der bedingten Wahrscheinlichkeit für die Daten, gegeben die Parameter (Likelihood) und der a-priori Wahrscheinlichkeit für die Parameter (relativiert an der Randwahrscheinlichkeit für die Daten).

Der a-priori Wahrscheinlichkeit für den Parameter bzw. der Prior repräsentiert die Vorerfahrungen (Welche Informationen habe ich über den Parameter aus der Empirie oder vorherigen Berechnungsdurchgängen?). Die angenommen möglichen Ausprägungen des Parameters und ihre Wahrscheinlichkeit werden durch eine [[Verteilungsmodelle|Wahrscheinlichkeitsverteilung]] (Normal-, Bernoulli-, Gleichverteilung oder andere) modelliert. Stellen wir uns vor, wir haben aus vorherigen Studien oder Meta-Analysen eine gewisse Vorstellung darüber, wo der Slope unseres Regressionsmodells liegen könnte. Dieser konkrete Wert würde bei einer a-priori Normalverteilung den Mittelwert darstellen. Die Unsicherheit über unsere Annahme berücksichtigen wir dadurch, dass wir gleichzeitig auch die Streuung/Varianz unserer Normalverteilung für den Parameter festlegen. Bei maximaler Unsicherheit über den Prior, d.h. wenn wir keine Ahnung haben, wo der Parameterwert liegen könnte bzw. uns nicht festlegen wollen, werden die Wahrscheinlichkeiten für die Parameterausprägungen in Form einer Gleichverteilung bestimmt (d.h., alle Ausprägungen sind gleich wahrscheinlich).

Die Likelihood gibt uns die Wahrscheinlichkeit der Daten gegeben unsere Parameter. Wie wahrscheinlich ist die Verteilung unserer y- und x-Werte, wenn die Parameter bestimmte Werte annehmen? Wie kommen die Daten überhaupt zustande? (=> hier steckt das eigentliche Modell) Diese Wahrscheinlichkeit wird über ein [[MLE|Maximum-Likelihood Schätzungsverfahren]] berechnet. Über die Kombination der Likelihood für die Daten und der a-priori Wahrscheinlichkeit für die Parameter kann anschließend die posteriore Wahrscheinlichkeit für die Parameter, gegeben die Daten, bestimmt werden.

Der Posterior enthält eine von den (neuen) Daten informierte Schätzung für den Parameter (z.B. den Mittelwert oder Modalwert der Verteilung) sowie deren Unsicherheit (Streuung der Verteilung). Je mehr Daten in die Berechnung miteinbezogen werden, desto sicherer wird dabei die Schätzung (d.h., die Streuung des Posteriors nimmt ab).

Der Vorteil zu konventionellen (frequentistischen) statistischen Ansätzen liegt darin, dass wir nicht nur eine Schätzung, sondern immer gleich eine ganze Verteilung der gesuchten Parameter erhalten. Weiterhin ist es hier möglich, eigene Vorannahmen bzw. ältere Berechnungen über die Festlegung des Priors in die Analyse miteinzubeziehen.

== Anwendung in der Forschung ==

Viele Modelle aus der Entscheidungsforschung oder den kognitiven Neurowissenschaften versuchen Informationsverarbeitungsprozesse als eine Form von bayesianischer Inferenz zu betrachten. Diesen Ansätzen nach haben Menschen (und andere Informationsverarbeitungssysteme) keinen direkten Zugang zur Realität, sondern müssen die wahren, jedoch versteckten Ursachen ihrer Wahrnehmungen und Empfindungen (hidden causes) über ihren Input (z.B. elektrische Signale von den sensorischen Organen) über ein Modell schlussfolgern/inferieren. Da das Inputmuster i.d.R. verrauscht ist und es auch mit einer gewissen Wahrscheinlichkeit mit alternativen Modellen erklärt werden könnte, erfolgt diese Inferenz jedes Mal mit einer gewissen Unsicherheit. Agenten modellieren also ihre Umgebung und sich selbst, indem sie die versteckten Ursachen mit deren Wahrscheinlichkeit a-priori auf Grundlage ihrer Vorerfahrungen annehmen (Was habe ich bisher gelernt und was erwarte ich in meiner Umwelt?) und gegeben dieser angenommen Ursachen die Wahrscheinlichkeit für den Dateninput vorausberechnen (Likelihood, häufig auch „Generatives Modell“ genannt). Wenn nun die Daten schrittweise ins System gelangen, können Agenten ihr Modell je nach Passung auf die Daten immer weiter aktualisieren (über Berechnung der posterioren Wahrscheinlichkeit für die hidden causes / Parameter). Bei diesem '''bayesianischen Lernen''' wird der durch den Dateninput aktualisierte Posterior zum Prior für den nächsten Durchgang u.s.w. Somit wird das Modell über die Zeit immer präziser, sofern die Umwelt konstant bleibt.

Beispiele für Probabilistische Modelle aus der Kognitions- und Neurowissenschaft sind die [https://en.wikipedia.org/wiki/Helmholtz_machine Helmholtz-Maschine], das [[Hierarchical Gaussian Filter|Hierachical Gaussian Filtering]], [https://en.wikipedia.org/wiki/Predictive_coding Predictive Coding] oder das [https://www.youtube.com/watch?v=NIu_dJGyIQI&t=800s Freie Energie Prinzip].

Probabilistische Modelle

2018-10-03T14:32:50Z