Entstehung des Standardfehlers: Unterschied zwischen den Versionen

Aus eLearning - Methoden der Psychologie - TU Dresden
Zur Navigation springen Zur Suche springen
Keine Bearbeitungszusammenfassung
KKeine Bearbeitungszusammenfassung
 
(23 dazwischenliegende Versionen von 3 Benutzern werden nicht angezeigt)
Zeile 1: Zeile 1:
{{Nav|Navigation|Statistik|Hauptseite}}
{{Nav|Navigation|Statistik_Grundbegriffe|Hauptseite}}


Der p-Wert ist die zentrale Größe beim Testen statistischer Hypothesen. Er gibt an, wie wahrscheinlich es unter Gültigkeit der Nullhypothese ist, den in einer Stichprobe berechneten Schätzwert, oder einen der Nullhypothese noch mehr widersprechenden Wert zu erhalten.
Der Standardfehler ist eine sehr wichtige statistische Kenngröße, die die Grundlage vieler statistischer Tests darstellt, zum Beispiel in regressionsanalytischen Verfahren. In diesem Text und in der App wird exemplarisch auf den Standardfehler des Mittelwertes eingegangen.
Je geringer der p-Wert, desto eher kann die Nullhypothese für die vorliegende Population ablehnt werden. Ist der p-Wert geringer als das vorher festgelegte Signifikanzniveau α, wird das Ergebnis als signifikant bezeichnet und die Nullhypothese abgelehnt. Das Signifikanzniveau wird in der Praxis zumeist auf α = 0.05 oder α = 0.01 festgelegt.
Der Standardfehler des Mittelwertes ist ein statistisches Maß für die Genauigkeit der Schätzung des Populationsmittelwertes. Er entspricht der Standardabweichung der Verteilungen der Punktschätzungen des Populationsmittelwertes von Stichproben des Umfangs n einer Population.
Die Größe des p-Wertes ist abhängig von der Art der Fragestellung. Dabei wird zwischen gerichteten (einseitigen) und ungerichteten (zweiseitigen) Fragestellungen unterschieden. Will man z.B. nachweisen, dass sich die Werte einer Stichprobe im Persönlichkeitsmerkmal Neurotizismus von den Werten in der Grundgesamtheit unterscheiden, liegt eine zweiseitige Fragestellung vor. Die zweiseitige Fragestellung trifft keine Aussage über die Richtung des Unterschiedes. Will man jedoch nachweisen, dass die Neurotizismus-Ausprägungen in der Stichprobe höher sind als in der Grundgesamtheit, so handelt es sich um eine einseitige Fragestellung.
Der Standardfehler ist von der Standardabweichung in der Population und der Stichprobengröße abhängig und lässt sich mithilfe der folgenden Formel berechnen:


'''''Beispiel'''''
[[File:1_2_Standardfehler_Formel.PNG|70px|link=Ausgelagerte_Formeln#Standardfehler|Ausgelagerte Formel Standardfehler]]


In einem fiktiven Beispiel wurde in einer Stichprobe von Psychologiestudierenden der Größe n = 40 der Mittelwert von x̅ = 23 bei einer Standardabweichung von s = 7 in Neurotizismus erfasst. Der bekannte Mittelwert in der Grundgesamtheit der Allgemeinbevölkerung beträgt µ<sub>0</sub> = 21. Bei einer zweiseitigen Fragestellung drückt die Alternativhypothese aus, dass sich der Populationsmittelwert der Psychologiestudierenden vom Mittelwert der Allgemeinbevölkerung unterscheidet (H<sub>1</sub>: µ<sub>P</sub> ≠ µ<sub>0</sub>). Die Nullhypothese drückt komplementär dazu aus, dass sich die Mittelwerte der Grundgesamtheiten nicht voneinander unterscheiden (H<sub>0</sub>: µ<sub>P</sub> = µ<sub>0</sub>). Ein zweiseitiger t-Test ergibt einen t-Wert von t(39) = 1.807 und einen p-Wert von p = 0.078. Die Wahrscheinlichkeit, den in der Stichprobe berechneten Schätzwert x̅ = 23 oder einen betragsmäßig noch stärker von µ<sub>0</sub> = 21 abweichenden Mittelwert bei einer Standardabweichung s = 7 unter der Annahme der Nullhypothese zu erhalten, beträgt 7,8 Prozent. Bei einem Signifikanzniveau von α = 0.05 ist der gefundene Mittelwertsunterschied wegen 0.078 > 0.05 nicht signifikant. In Abbildung 1 ist dieser Sachverhalt mithilfe der interaktiven Simulation zum p-Wert grafisch veranschaulicht.
Ist die Streuung der Stichprobenmittelwerte um den Populationsmittelwert gering, kann der Populationsmittelwert genauer aus dem Mittelwert einer einzelnen Stichprobe geschätzt werden. Bei größerer Standardabweichung σ in der Population steigt demnach der Standardfehler an, wohingegen er bei größeren Stichprobenumfängen n geringer wird. Weil in der Praxis weder der Standardfehler des arithmetischen Mittelwertes noch die Standardabweichung aus der Population bekannt ist, wird der Standardfehler des Stichprobenmittelwertes s<sub></sub> als Schätzwert für σ<sub></sub>  verwendet. s<sub></sub> wird dabei mithilfe der Standardabweichung s und dem Stichprobenumfang n aus den bekannten Daten der Stichprobe geschätzt.


[[File:p_Wert_1.png|600px|Abbildung 1: Verteilung der t-Werte und Darstellung des p-Wertes bei zweiseitiger Fragestellung]]
In einer Grundgesamtheit aus Berufstätigen beträgt der mit dem Emotion Regulation Questionnaire (ERQ) erfasste Mittelwert im kognitiven Umdeuten von stressigen Situationen im Alltag (Reappraisal) µ = 25. Die Standardabweichung in dieser Grundgesamtheit beträgt    σ = 6. Zieht man aus dieser Grundgesamtheit 500 Zufallsstichproben der Größe n = 150, dann streuen die Mittelwerte der 500 Stichproben normalverteilt um den tatsächlichen Populationsmittelwert (vgl. Abb. 1).


[[Datei:Videolink_neu.PNG|link=http://141.76.19.82:3838/mediawiki/pwertlink.html
[[File:1_2_Standardfehler.PNG|700px|Abbildung 1: Verteilung der Stichprobenmittelwerte und Darstellung des Standardfehlers|link=Ausgelagerte_Bildbeschreibungen#Entstehung des Standardfehlers|Ausgelagerte Bildbeschreibung von Entstehung des Standardfehlers]]
|120px]] <span style="color: white"> kkk </span>  Im [http://141.76.19.82:3838/mediawiki/pwertlink.html Video] wird der p-Wert bei zweiseitiger Fragestellung näher erläutert.


Da in diesem fiktiven Beispiel die Standardabweichung der Grundgesamtheit bekannt ist, kann der Standardfehler direkt aus der Standardabweichung σ = 6 und der Stichprobengröße n = 150 berechnet werden. Der Standardfehler des Mittelwerts beträgt hier σ<sub>X̅</sub> = 0.49. Die aus den Parametern der Stichproben ermittelte Standardabweichung der gezogenen Mittelwerte beträgt s<sub>(X̅)</sub> = 0.48 und weicht somit nur minimal von σ<sub>X̅</sub> ab. Bei einer geringeren Anzahl an Zufallsziehungen wäre diese Schätzung ungenauer. Die Standardabweichung der gezogenen 500 Mittelwerte s<sub>(X̅)</sub> darf nicht mit dem Standardfehler eines einzelnen Stichprobenmittelwertes s<sub>X̅</sub> verwechselt werden, welcher aus den Parametern s und n der einzelnen Stichprobe berechnet und in der Praxis für die Schätzung des Standardfehlers des arithmetischen Mittelwerts genutzt wird.


Bei einer einseitigen Fragestellung wird die Alternativhypothese untersucht, dass der Populationsmittelwert in Neurotizismus in der Grundgesamtheit der Psychologiestudierenden größer ist als der Mittelwert der Allgemeinbevölkerung (H<sub>1</sub>: µ<sub>P</sub> > µ_0). Die Nullhypothese besagt dazu komplementär, dass der Mittelwert in der Grundgesamtheit mindestens genauso hoch oder höher ist als der Mittelwert der Grundgesamtheit der Psychologiestudierenden (H<sub>0</sub>: µ<sub>P</sub>  ≤ µ<sub>0</sub>). Unter ansonsten gleichen Bedingungen ergibt sich hier der halbierte p-Wert von p = 0.039. Die Wahrscheinlichkeit, den in der Stichprobe berechneten Schätzwert x̅ = 23, oder einen noch größeren Schätzwert unter Annahme der Nullhypothese zu erhalten, liegt bei 3,9 Prozent. Bei einem Signifikanzniveau von α = 0.05 ist der gefundene Mittelwertsunterschied wegen 0.039 < 0.05 signifikant. In Abbildung 2 ist der einseitige p-Wert dieses Beispiels grafisch veranschaulicht.


[[File:p_Wert_2.png|600px|Abbildung 2: Verteilung der t-Werte und Darstellung des p-Wertes bei einseitiger Fragestellung]]
[[Datei:Videolink_neu.PNG|link=http://141.76.19.82:3838/mediawiki/MUVE_STAT/Videolinks/1_2_Standardfehler_Link.html
|120px]] <span style="color: white"> kkk </span>  Im [http://141.76.19.82:3838/mediawiki/MUVE_STAT/Videolinks/1_2_Standardfehler_Link.html Video] wird der Standardfehler näher erläutert.


[[Datei:Videolink_neu.PNG|link=http://141.76.19.82:3838/mediawiki/pwertlink.html
[[Datei:Simulationslink_neu2.PNG|link=http://141.76.19.82:3838/mediawiki/MUVE_STAT/Apps/1_2_Standardfehler/
|120px]] <span style="color: white"> kkk </span>  Im [http://141.76.19.82:3838/mediawiki/pwertlink.html Video] wird der p-Wert bei einseitiger Fragestellung näher erläutert.
|120px]] <span style="color: white"> kkk </span>  Inwieweit der Standardfehler von verschiedenen Parametern abhängig ist, lässt sich in der [http://141.76.19.82:3838/mediawiki/MUVE_STAT/Apps/1_2_Standardfehler/ interaktiven Simulation] grafisch nachvollziehen.
 
[[Datei:Simulationslink_neu2.PNG|link=http://141.76.19.82:3838/mediawiki/1_1_p-Wert/App_Version/
|120px]] <span style="color: white"> kkk </span>  Inwieweit der p-Wert von verschiedenen Parametern abhängig ist, lässt sich in der interaktiven Simulation zum [http://141.76.19.82:3838/mediawiki/1_1_p-Wert/App_Version/ p-Wert] nachvollziehen.




Zeile 29: Zeile 27:
'''''Weiterführende Literatur'''''
'''''Weiterführende Literatur'''''


Rudolf, M., & Kuhlisch, W. (2008). ''Biostatistik: Eine Einführung für Biowissenschaftler'' (Kapitel 5.3). München: Pearson Studium.
Rudolf, M. & Kuhlisch, W. (2020). ''Biostatistik. Eine Eine Einführung für Bio- und Umweltwissenschaftler'' (2. Aufl.). München: Pearson Studium. (Kapitel 4)

Aktuelle Version vom 28. Februar 2023, 10:21 Uhr

Der Standardfehler ist eine sehr wichtige statistische Kenngröße, die die Grundlage vieler statistischer Tests darstellt, zum Beispiel in regressionsanalytischen Verfahren. In diesem Text und in der App wird exemplarisch auf den Standardfehler des Mittelwertes eingegangen. Der Standardfehler des Mittelwertes ist ein statistisches Maß für die Genauigkeit der Schätzung des Populationsmittelwertes. Er entspricht der Standardabweichung der Verteilungen der Punktschätzungen des Populationsmittelwertes von Stichproben des Umfangs n einer Population.

Der Standardfehler ist von der Standardabweichung in der Population und der Stichprobengröße abhängig und lässt sich mithilfe der folgenden Formel berechnen:

Ausgelagerte Formel Standardfehler

Ist die Streuung der Stichprobenmittelwerte um den Populationsmittelwert gering, kann der Populationsmittelwert genauer aus dem Mittelwert einer einzelnen Stichprobe geschätzt werden. Bei größerer Standardabweichung σ in der Population steigt demnach der Standardfehler an, wohingegen er bei größeren Stichprobenumfängen n geringer wird. Weil in der Praxis weder der Standardfehler des arithmetischen Mittelwertes noch die Standardabweichung aus der Population bekannt ist, wird der Standardfehler des Stichprobenmittelwertes s als Schätzwert für σ verwendet. s wird dabei mithilfe der Standardabweichung s und dem Stichprobenumfang n aus den bekannten Daten der Stichprobe geschätzt.

In einer Grundgesamtheit aus Berufstätigen beträgt der mit dem Emotion Regulation Questionnaire (ERQ) erfasste Mittelwert im kognitiven Umdeuten von stressigen Situationen im Alltag (Reappraisal) µ = 25. Die Standardabweichung in dieser Grundgesamtheit beträgt σ = 6. Zieht man aus dieser Grundgesamtheit 500 Zufallsstichproben der Größe n = 150, dann streuen die Mittelwerte der 500 Stichproben normalverteilt um den tatsächlichen Populationsmittelwert (vgl. Abb. 1).

Ausgelagerte Bildbeschreibung von Entstehung des Standardfehlers

Da in diesem fiktiven Beispiel die Standardabweichung der Grundgesamtheit bekannt ist, kann der Standardfehler direkt aus der Standardabweichung σ = 6 und der Stichprobengröße n = 150 berechnet werden. Der Standardfehler des Mittelwerts beträgt hier σ = 0.49. Die aus den Parametern der Stichproben ermittelte Standardabweichung der gezogenen Mittelwerte beträgt s(X̅) = 0.48 und weicht somit nur minimal von σ ab. Bei einer geringeren Anzahl an Zufallsziehungen wäre diese Schätzung ungenauer. Die Standardabweichung der gezogenen 500 Mittelwerte s(X̅) darf nicht mit dem Standardfehler eines einzelnen Stichprobenmittelwertes s verwechselt werden, welcher aus den Parametern s und n der einzelnen Stichprobe berechnet und in der Praxis für die Schätzung des Standardfehlers des arithmetischen Mittelwerts genutzt wird.


Videolink neu.PNG kkk Im Video wird der Standardfehler näher erläutert.

Simulationslink neu2.PNG kkk Inwieweit der Standardfehler von verschiedenen Parametern abhängig ist, lässt sich in der interaktiven Simulation grafisch nachvollziehen.


Weiterführende Literatur

Rudolf, M. & Kuhlisch, W. (2020). Biostatistik. Eine Eine Einführung für Bio- und Umweltwissenschaftler (2. Aufl.). München: Pearson Studium. (Kapitel 4)