Standardfehler der Regressionskoeffizienten

Aus eLearning - Methoden der Psychologie - TU Dresden
Zur Navigation springen Zur Suche springen

Der Standardfehler gibt in der linearen Regression die Genauigkeit der Schätzung der Regressionskoeffizienten an und wird unter anderem für die Berechnung von Signifikanzen benötigt. Unter erfüllten Annahmen der linearen Regression ist die Stichprobenverteilung eines Regressionskoeffizienten b normalverteilt. Die Standardabweichung dieser Verteilung entspricht dem Standardfehler des Regressionskoeffizienten sb (Formeln siehe Bortz und Schuster, 2016).


Beispiel 1

Aus einer Grundgesamtheit, in der Prädiktor und Kriterium durchschnittlich mit r = 0.5 korrelieren, werden 500 Stichproben gezogen. Für jede Stichprobe werden die Parameter einer einfachen linearen Regression geschätzt. Die ermittelten Regressionskoeffizienten streuen um den Mittelwert b = 0.5. Die Standardabweichung dieser Verteilung bzw. der Standardfehler des Regressionskoeffizienten entspricht sb = 0.1. In Abbildung 1 wird der beschriebene Sachverhalt dargestellt.


Abbildung 1: Häufigkeitsverteilung des Regressionskoeffizienten einer einfachen linearen Regression

Will man den Standardfehler der Regressionskoeffizienten bei der multiplen linearen Regression schätzen, müssen Abhängigkeiten mit anderen Prädiktoren berücksichtigt werden (Formeln siehe Bortz und Schuster, 2016). Ein hoher Standardfehler kann dabei ein Hinweis für das Vorliegen von Multikollinearität sein.


Beispiel 2

Aus einer Grundgesamtheit, in der zwei Prädiktoren jeweils zu r = 0.6 mit dem Kriterium und untereinander zu r = 0.9 korrelieren, wird die Verteilung der beiden Regressionskoeffizienten simuliert. Die hohe Korrelation beider Prädiktoren führt bei der Schätzung der Regressionskoeffizienten in einigen Stichproben dazu, dass ein Prädiktor die relevanten Varianzanteile des zweiten übernimmt, sodass dessen Regressionskoeffizient – trotz hoher Korrelation mit dem Kriterium – nahe null liegt. In anderen Zufallsziehungen ist es genau andersherum. Die daraus resultierenden Verteilungen der Regressionskoeffizienten streuen bei großen Standardfehlern (sb1 = 0.23; sb2 = 0.22) um Mittelwerte, die geringer sind, als es die Korrelation von r = 0.6 vermuten lässt (Abbildung 2). Bei zwei unkorrelierten Prädiktoren ergäben sich größere Regressionskoeffizienten und schmalere Häufigkeitsverteilungen.


Abbildung 2: Häufigkeitsverteilungen zweier hochkorrelierter Regressionskoeffizienten in einer multiplen linearen Regression


Der Standardfehler wird in der Regressionsanalyse für den Signifikanztest von Regressionskoeffizienten benötigt. Die zur Bestimmung des p-Wertes relevanten t-Werte ergeben sich als Quotient aus Regressionskoeffizient und Standardfehler. Je höher der Standardfehler ist, desto niedriger ist dementsprechend der t-Wert und desto unsicherer der Einfluss des Prädiktors auf das Kriterium. So ist der Regressionskoeffizient aus Abbildung 1 signifikant von 0 verschieden, die beiden Regressionskoeffizienten aus Abbildung 2 jedoch nicht.


Videolink neu.PNG kkk Im Video wird der Standardfehler des Regressionskoeffizienten näher erläutert.

Simulationslink neu2.PNG kkk Die Entstehung des Standardfehlers der Regressionskoeffizienten lässt sich in der interaktiven Simulation grafisch nachvollziehen.


Weiterführende Literatur

Bortz, J., & Schuster, C. (2016). Statistik für Human- und Sozialwissenschaftler. Berlin: Springer.