General Linear Model
Das General Linear Model (dt. Allgemeines Lineares Modell, ALM) ist ein grundlegendes Modell der Statistik, auf welchem eine Vielzahl häufig eingesetzter Verfahren, wie z.B. die Varianzanalyse, die Regressionsanalyse und viele weitere Verfahren basieren. Sie alle stellen Spezialfälle des GLM dar.
Es ermöglicht die Beschreibung der Ausprägungen einer oder mehrerer Kriteriumsvariablen (= abhängiger Variablen) durch eine Linearkombination (gewichtete Summe) von Prädiktorvariablen (= unabhängiger Variablen) und einer Fehlerkomponente (Residuum). Die unabhängigen Variablen bilden den Ausgangspunkt für die Vorhersage und werden daher Prädiktoren genannt. Die abhängige Variable, dessen Ausprägung man vorhersagen möchte, wird in der Psychologie als Kriteriumsvariable bezeichnet. Grundvoraussetzung für die Anwendung des Modells ist die Annahme, dass ein linearer Zusammenhang zwischen den zu erklärenden Beobachtungsdaten und den bekannten Einflussvariablen (Prädiktoren / Regressoren) besteht.
Formal lässt sich das GLM durch die folgende Gleichung beschreiben:
Y... Vektor der Kriteriumsvariablen
X... Matrix der Prädiktoren (= Designmatrix)
b... Vektor der Gewichte aller Prädiktoren
e... Vektor der Residuen
Die gleichzeitige Betrachtung der Werte mehrerer Beobachtungseinheiten (z.B. Individuen) führt zu einem linearen Gleichungssystem, welches mit Hilfe eines Minimierungsprinzips (dem Prinzip der Kleinsten Quadrate) die Schätzung der gesuchten Prädiktorgewichte b ermöglicht. Die Modellparameter werden dabei so gewählt, dass die Summe der quadrierten Fehler (= Abweichungen der beobachteten Y-Werte von den durch das Modell vorhergesagten Kriteriumswerten Xb) ein Minimum erreicht:
- n... Anzahl an Individuen
Als beste Schätzung für b erhält man durch Formelumstellung:
Sofern die Inverse von Datei:GLM 7.png existiert, kann diese Gleichung immer gelöst werden.
Ein Vergleich der beobachteten Daten und der Linearkombination aller verwendeten Prädiktoren ermöglicht die Einschätzung der Güte des linearen Zusammenhangs. Dazu verwendet man üblicherweise das Bestimmtheitsmaß R², welches den Anteil der Variabilität im Modell angibt, der durch die ausgewählten Prädiktoren erklärt werden kann. Bei mehreren Prädiktoren wird dabei oft eine korrigierte Form des Bestimmtheitsmaßes gewählt, welche die Anzahl der Prädiktoren bestrafend mit verrechnet.
Spezialfälle des Modells sind der t-Test, die Varianzanalyse, Korrelations- und Regressionsrechnungen sowie Kovarianzanalysen. Die Einteilung dieser Spezialfälle wird anhand der Anzahl von Prädiktor- und Kriteriumsvariablen und dem Skalenniveau der Variablen vorgenommen.