Entstehung des Standardfehlers: Unterschied zwischen den Versionen

Aus eLearning - Methoden der Psychologie - TU Dresden
Zur Navigation springen Zur Suche springen
Keine Bearbeitungszusammenfassung
Keine Bearbeitungszusammenfassung
Zeile 1: Zeile 1:
{{Nav|Navigation|Statistik|Hauptseite}}
{{Nav|Navigation|Statistik|Hauptseite}}


Der p-Wert ist die zentrale Größe beim Testen statistischer Hypothesen. Er gibt an, wie wahrscheinlich es unter Gültigkeit der Nullhypothese ist, den in einer Stichprobe berechneten Schätzwert, oder einen der Nullhypothese noch mehr widersprechenden Wert zu erhalten.
Der Standardfehler ist eine sehr wichtige statistische Kenngröße, die die Grundlage vieler statistischer Tests darstellt, zum Beispiel in regressionsanalytischen Verfahren. In diesem Text und in der App wird exemplarisch auf den Standardfehler des Mittelwertes eingegangen.
Je geringer der p-Wert, desto eher kann die Nullhypothese für die vorliegende Population ablehnt werden. Ist der p-Wert geringer als das vorher festgelegte Signifikanzniveau α, wird das Ergebnis als signifikant bezeichnet und die Nullhypothese abgelehnt. Das Signifikanzniveau wird in der Praxis zumeist auf α = 0.05 oder α = 0.01 festgelegt.
Der Standardfehler des Mittelwertes ist ein statistisches Maß für die Genauigkeit der Schätzung des Populationsmittelwertes. Er entspricht der Standardabweichung der Verteilungen der Punktschätzungen des Populationsmittelwertes von Stichproben des Umfangs n einer Population.
Die Größe des p-Wertes ist abhängig von der Art der Fragestellung. Dabei wird zwischen gerichteten (einseitigen) und ungerichteten (zweiseitigen) Fragestellungen unterschieden. Will man z.B. nachweisen, dass sich die Werte einer Stichprobe im Persönlichkeitsmerkmal Neurotizismus von den Werten in der Grundgesamtheit unterscheiden, liegt eine zweiseitige Fragestellung vor. Die zweiseitige Fragestellung trifft keine Aussage über die Richtung des Unterschiedes. Will man jedoch nachweisen, dass die Neurotizismus-Ausprägungen in der Stichprobe höher sind als in der Grundgesamtheit, so handelt es sich um eine einseitige Fragestellung.
Der Standardfehler ist von der Standardabweichung in der Population und der Stichprobengröße abhängig und lässt sich in der Form σ_() = σ/√n darstellen. Ist die Streuung der Stichprobenmittelwerte um den Populationsmittelwert gering, kann der Populationsmittelwert genauer aus dem Mittelwert einer einzelnen Stichprobe geschätzt werden. Bei größerer Standardabweichung σ in der Population steigt demnach der Standardfehler an, wohingegen er bei größeren Stichprobenumfängen n geringer wird. Weil in der Praxis weder der Standardfehler des arithmetischen Mittelwertes noch die Standardabweichung aus der Population bekannt ist, wird der Standardfehler des Stichprobenmittelwertes s_(X̅) als Schätzwert für σ_(X̅)  verwendet. s_(X̅) wird dabei mithilfe der Standardabweichung s und dem Stichprobenumfang n aus den bekannten Daten der Stichprobe geschätzt.


'''''Beispiel'''''
In einer Grundgesamtheit aus Berufstätigen beträgt der mit dem Emotion Regulation Questionnaire (ERQ) erfasste Mittelwert im kognitiven Umdeuten von stressigen Situationen im Alltag (Reappraisal) µ = 25. Die Standardabweichung in dieser Grundgesamtheit beträgt   σ = 6. Zieht man aus dieser Grundgesamtheit 500 Zufallsstichproben der Größe n = 150, dann streuen die Mittelwerte der 500 Stichproben normalverteilt um den tatsächlichen Populationsmittelwert (vgl. Abb.1).  
 
In einem fiktiven Beispiel wurde in einer Stichprobe von Psychologiestudierenden der Größe n = 40 der Mittelwert von = 23 bei einer Standardabweichung von s = 7 in Neurotizismus erfasst. Der bekannte Mittelwert in der Grundgesamtheit der Allgemeinbevölkerung beträgt µ<sub>0</sub> = 21. Bei einer zweiseitigen Fragestellung drückt die Alternativhypothese aus, dass sich der Populationsmittelwert der Psychologiestudierenden vom Mittelwert der Allgemeinbevölkerung unterscheidet (H<sub>1</sub>: µ<sub>P</sub> ≠ µ<sub>0</sub>). Die Nullhypothese drückt komplementär dazu aus, dass sich die Mittelwerte der Grundgesamtheiten nicht voneinander unterscheiden (H<sub>0</sub>: µ<sub>P</sub> = µ<sub>0</sub>). Ein zweiseitiger t-Test ergibt einen t-Wert von t(39) = 1.807 und einen p-Wert von p = 0.078. Die Wahrscheinlichkeit, den in der Stichprobe berechneten Schätzwert x̅ = 23 oder einen betragsmäßig noch stärker von µ<sub>0</sub> = 21 abweichenden Mittelwert bei einer Standardabweichung s = 7 unter der Annahme der Nullhypothese zu erhalten, beträgt 7,8 Prozent. Bei einem Signifikanzniveau von α = 0.05 ist der gefundene Mittelwertsunterschied wegen 0.078 > 0.05 nicht signifikant. In Abbildung 1 ist dieser Sachverhalt mithilfe der interaktiven Simulation zum p-Wert grafisch veranschaulicht.


[[File:p_Wert_1.png|600px|Abbildung 1: Verteilung der t-Werte und Darstellung des p-Wertes bei zweiseitiger Fragestellung]]
[[File:p_Wert_1.png|600px|Abbildung 1: Verteilung der t-Werte und Darstellung des p-Wertes bei zweiseitiger Fragestellung]]


[[Datei:Videolink_neu.PNG|link=http://141.76.19.82:3838/mediawiki/pwertlink.html
Da in diesem fiktiven Beispiel die Standardabweichung der Grundgesamtheit bekannt ist, kann der Standardfehler direkt aus der Standardabweichung σ = 6 und der Stichprobengröße n = 150 berechnet werden. Der Standardfehler des Mittelwerts beträgt hier σ_() = 0.49. Die aus den Parametern der Stichproben ermittelte Standardabweichung der gezogenen Mittelwerte beträgt s_((X̅)) = 0.48 und weicht somit nur minimal von σ_(X̅) ab. Bei einer geringeren Anzahl an Zufallsziehungen wäre diese Schätzung ungenauer. Die Standardabweichung der gezogenen 500 Mittelwerte s_((X̅)) darf nicht mit dem Standardfehler eines einzelnen Stichprobenmittelwertes s_(X̅) verwechselt werden, welcher aus den Parametern s und n der einzelnen Stichprobe berechnet und in der Praxis für die Schätzung des Standardfehlers des arithmetischen Mittelwerts genutzt wird.
|120px]] <span style="color: white"> kkk </span>  Im [http://141.76.19.82:3838/mediawiki/pwertlink.html Video] wird der p-Wert bei zweiseitiger Fragestellung näher erläutert.
 
 
Bei einer einseitigen Fragestellung wird die Alternativhypothese untersucht, dass der Populationsmittelwert in Neurotizismus in der Grundgesamtheit der Psychologiestudierenden größer ist als der Mittelwert der Allgemeinbevölkerung (H<sub>1</sub>: µ<sub>P</sub> > µ_0). Die Nullhypothese besagt dazu komplementär, dass der Mittelwert in der Grundgesamtheit mindestens genauso hoch oder höher ist als der Mittelwert der Grundgesamtheit der Psychologiestudierenden (H<sub>0</sub>: µ<sub>P</sub>  ≤ µ<sub>0</sub>). Unter ansonsten gleichen Bedingungen ergibt sich hier der halbierte p-Wert von p = 0.039. Die Wahrscheinlichkeit, den in der Stichprobe berechneten Schätzwert x̅ = 23, oder einen noch größeren Schätzwert unter Annahme der Nullhypothese zu erhalten, liegt bei 3,9 Prozent. Bei einem Signifikanzniveau von α = 0.05 ist der gefundene Mittelwertsunterschied wegen 0.039 < 0.05 signifikant. In Abbildung 2 ist der einseitige p-Wert dieses Beispiels grafisch veranschaulicht.
 
[[File:p_Wert_2.png|600px|Abbildung 2: Verteilung der t-Werte und Darstellung des p-Wertes bei einseitiger Fragestellung]]


[[Datei:Videolink_neu.PNG|link=http://141.76.19.82:3838/mediawiki/pwertlink.html
[[Datei:Videolink_neu.PNG|link=http://141.76.19.82:3838/mediawiki/pwertlink.html
|120px]] <span style="color: white"> kkk </span>  Im [http://141.76.19.82:3838/mediawiki/pwertlink.html Video] wird der p-Wert bei einseitiger Fragestellung näher erläutert.
|120px]] <span style="color: white"> kkk </span>  Im [http://141.76.19.82:3838/mediawiki/pwertlink.html Video] wird der Standardfehler näher erläutert.


[[Datei:Simulationslink_neu2.PNG|link=http://141.76.19.82:3838/mediawiki/1_1_p-Wert/App_Version/
[[Datei:Simulationslink_neu2.PNG|link=http://141.76.19.82:3838/mediawiki/1_1_p-Wert/App_Version/
|120px]] <span style="color: white"> kkk </span>  Inwieweit der p-Wert von verschiedenen Parametern abhängig ist, lässt sich in der interaktiven Simulation zum [http://141.76.19.82:3838/mediawiki/1_1_p-Wert/App_Version/ p-Wert] nachvollziehen.
|120px]] <span style="color: white"> kkk </span>  Inwieweit der Standardfehler von verschiedenen Parametern abhängig ist, lässt sich in der interaktiven Simulation zum [http://141.76.19.82:3838/mediawiki/1_1_p-Wert/App_Version/ Standardfehler] grafisch nachvollziehen.




Zeile 29: Zeile 22:
'''''Weiterführende Literatur'''''
'''''Weiterführende Literatur'''''


Rudolf, M., & Kuhlisch, W. (2008). ''Biostatistik: Eine Einführung für Biowissenschaftler'' (Kapitel 5.3). München: Pearson Studium.
Rudolf, M., & Kuhlisch, W. (2008). ''Biostatistik: Eine Einführung für Biowissenschaftler'' (Kapitel 4.2). München: Pearson Studium.

Version vom 4. März 2020, 19:17 Uhr

Der Standardfehler ist eine sehr wichtige statistische Kenngröße, die die Grundlage vieler statistischer Tests darstellt, zum Beispiel in regressionsanalytischen Verfahren. In diesem Text und in der App wird exemplarisch auf den Standardfehler des Mittelwertes eingegangen. Der Standardfehler des Mittelwertes ist ein statistisches Maß für die Genauigkeit der Schätzung des Populationsmittelwertes. Er entspricht der Standardabweichung der Verteilungen der Punktschätzungen des Populationsmittelwertes von Stichproben des Umfangs n einer Population.

Der Standardfehler ist von der Standardabweichung in der Population und der Stichprobengröße abhängig und lässt sich in der Form σ_(X̅) = σ/√n darstellen. Ist die Streuung der Stichprobenmittelwerte um den Populationsmittelwert gering, kann der Populationsmittelwert genauer aus dem Mittelwert einer einzelnen Stichprobe geschätzt werden. Bei größerer Standardabweichung σ in der Population steigt demnach der Standardfehler an, wohingegen er bei größeren Stichprobenumfängen n geringer wird. Weil in der Praxis weder der Standardfehler des arithmetischen Mittelwertes noch die Standardabweichung aus der Population bekannt ist, wird der Standardfehler des Stichprobenmittelwertes s_(X̅) als Schätzwert für σ_(X̅) verwendet. s_(X̅) wird dabei mithilfe der Standardabweichung s und dem Stichprobenumfang n aus den bekannten Daten der Stichprobe geschätzt.

In einer Grundgesamtheit aus Berufstätigen beträgt der mit dem Emotion Regulation Questionnaire (ERQ) erfasste Mittelwert im kognitiven Umdeuten von stressigen Situationen im Alltag (Reappraisal) µ = 25. Die Standardabweichung in dieser Grundgesamtheit beträgt σ = 6. Zieht man aus dieser Grundgesamtheit 500 Zufallsstichproben der Größe n = 150, dann streuen die Mittelwerte der 500 Stichproben normalverteilt um den tatsächlichen Populationsmittelwert (vgl. Abb.1).

Abbildung 1: Verteilung der t-Werte und Darstellung des p-Wertes bei zweiseitiger Fragestellung

Da in diesem fiktiven Beispiel die Standardabweichung der Grundgesamtheit bekannt ist, kann der Standardfehler direkt aus der Standardabweichung σ = 6 und der Stichprobengröße n = 150 berechnet werden. Der Standardfehler des Mittelwerts beträgt hier σ_(X̅) = 0.49. Die aus den Parametern der Stichproben ermittelte Standardabweichung der gezogenen Mittelwerte beträgt s_((X̅)) = 0.48 und weicht somit nur minimal von σ_(X̅) ab. Bei einer geringeren Anzahl an Zufallsziehungen wäre diese Schätzung ungenauer. Die Standardabweichung der gezogenen 500 Mittelwerte s_((X̅)) darf nicht mit dem Standardfehler eines einzelnen Stichprobenmittelwertes s_(X̅) verwechselt werden, welcher aus den Parametern s und n der einzelnen Stichprobe berechnet und in der Praxis für die Schätzung des Standardfehlers des arithmetischen Mittelwerts genutzt wird.

Videolink neu.PNG kkk Im Video wird der Standardfehler näher erläutert.

Simulationslink neu2.PNG kkk Inwieweit der Standardfehler von verschiedenen Parametern abhängig ist, lässt sich in der interaktiven Simulation zum Standardfehler grafisch nachvollziehen.


Weiterführende Literatur

Rudolf, M., & Kuhlisch, W. (2008). Biostatistik: Eine Einführung für Biowissenschaftler (Kapitel 4.2). München: Pearson Studium.