Power-Vergleiche: Unterschied zwischen den Versionen

Aus eLearning - Methoden der Psychologie - TU Dresden
Zur Navigation springen Zur Suche springen
Keine Bearbeitungszusammenfassung
KKeine Bearbeitungszusammenfassung
 
(5 dazwischenliegende Versionen von 3 Benutzern werden nicht angezeigt)
Zeile 1: Zeile 1:
{{Nav|Navigation|Statistik|Hauptseite}}
{{Nav|Navigation|Statistik_Grundbegriffe|Hauptseite}}


Power-Untersuchungen ermöglichen auf der Basis von Simulationen Einschätzungen über die Wahrscheinlichkeit, dass bestimmte statistische Tests unter gegebenen Parametern die Null-hypothese korrekterweise ablehnen (vgl. [[Teststärke]]).
Power-Untersuchungen ermöglichen auf der Basis von Simulationen Einschätzungen über die Wahrscheinlichkeit, dass bestimmte statistische Tests unter gegebenen Parametern die Nullhypothese korrekterweise ablehnen (vgl. [[Teststärke]]).


Um die Power eines Tests zu schätzen, können z.B. Monte-Carlo Simulationen durchgeführt werden (vgl. [[Robustheitsuntersuchungen]]). Am Beispiel des Mittelwertsvergleichs von zwei Stichproben werden dafür aus zwei Grundgesamtheiten mit unterschiedlichen Mittelwerten und gleichen Standardabweichungen jeweils eine große Menge an Stichproben der Größe n gezogen. Für jedes Stichprobenpaar wird dann die Teststatistik berechnet. Der Anteil aller Vergleiche, welche die Nullhypothese bei vorher festgelegtem α signifikant ablehnen, ent-spricht in diesem Fall der Teststärke, da allen berechneten Teststatistiken ein realer Mittel-wertsunterschied der Grundgesamtheiten zugrunde liegt.
Um die Power eines Tests zu schätzen, können z.B. Monte-Carlo Simulationen durchgeführt werden (vgl. [[Robustheitsuntersuchungen]]). Am Beispiel des Mittelwertsvergleichs von zwei Stichproben werden dafür aus zwei Grundgesamtheiten mit unterschiedlichen Mittelwerten und gleichen Standardabweichungen jeweils eine große Menge an Stichproben der Größe n gezogen. Für jedes Stichprobenpaar wird dann die Teststatistik berechnet. Der Anteil aller Vergleiche, welche die Nullhypothese bei vorher festgelegtem α signifikant ablehnen, entspricht in diesem Fall der Teststärke, da allen berechneten Teststatistiken ein realer Mittelwertsunterschied der Grundgesamtheiten zugrunde liegt.


Ein Power-Vergleich vergleicht die Wahrscheinlichkeiten verschiedener statistischer Tests, unter gegebenen Parametern signifikante Ergebnisse zu erzielen. In Abbildung 1 wird z.B. der Vergleich zwischen t-Test und U-Test dargestellt. Dafür wurden aus zwei Grundgesamtheiten mit einem Mittelwertsunterschied von 1 und Standardabweichungen von σ = 1 jeweils 2000 Stichproben der Größe n = 10 gezogen. Die Voraussetzungen des t-Tests und des U-Tests seien erfüllt.  
Ein Power-Vergleich vergleicht die Wahrscheinlichkeiten verschiedener statistischer Tests, unter gegebenen Parametern signifikante Ergebnisse zu erzielen. In Abbildung 1 wird z.B. der Vergleich zwischen t-Test und U-Test dargestellt. Dafür wurden aus zwei Grundgesamtheiten mit einem Mittelwertsunterschied von 1 und Standardabweichungen von σ = 1 jeweils 2000 Stichproben der Größe n = 10 gezogen. Die Voraussetzungen des t-Tests und des U-Tests seien erfüllt.  




[[File:1_10_Power_Vergleiche.PNG|800px|Abbildung 1: Darstellung der Power anhand von Monte-Carlo Simulationen des t- und U-Tests|link=Ausgelagerte_Bildbeschreibungen#Power_Vergleiche|Ausgelagerte Bildbeschreibung von Power Vergleiche]]




[[File:1_10_Power_Vergleiche.PNG|800px|Abbildung 1: Darstellung der Power anhand von Monte-Carlo Simulationen des t- und U-Tests]]
Über jedes dieser 2000 Stichprobenpaare werden ein t-Test und ein U-Test gerechnet. Die Anteile der signifikanten Mittelwertsunterschiede (Power) werden im rechten Teil der Abbil-dung dargestellt. Bei gleichen Voraussetzungen werden beim t-Test etwa 4-5 % mehr Mittelwertsunterschiede signifikant (66.7 %) als beim U-Test (62.15 %). Bei erfüllten Voraussetzungen sollte der t-Test dem U-Test dementsprechend vorgezogen werden.




Über jedes dieser 2000 Stichprobenpaare werden ein t-Test und ein U-Test gerechnet. Die Anteile der signifikanten Mittelwertsunterschiede (Power) werden im rechten Teil der Abbil-dung dargestellt. Bei gleichen Voraussetzungen werden beim t-Test etwa 4-5 % mehr Mittel-wertsunterschiede signifikant (66.7 %) als beim U-Test (62.15 %). Bei erfüllten Voraussetzun-gen sollte der t-Test dem U-Test dementsprechend vorgezogen werden.


[[Datei:Videolink_neu.PNG|link=http://141.76.19.82:3838/mediawiki/MUVE_STAT/Videolinks/1_10_Power_Vergleiche_Link.html
|120px]] <span style="color: white"> kkk </span>  Im [http://141.76.19.82:3838/mediawiki/MUVE_STAT/Videolinks/1_10_Power_Vergleiche_Link.html Video] werden Power-Vergleiche näher erläutert.


[[Datei:Simulationslink_neu2.PNG|link=http://141.76.19.82:3838/mediawiki/MUVE_STAT/Apps/1_10_Power_Vergleiche/
|120px]] <span style="color: white"> kkk </span>  In der [http://141.76.19.82:3838/mediawiki/MUVE_STAT/Apps/1_10_Power_Vergleiche/ interaktiven Simulation] lassen sich Power-Vergleiche anhand von Monte-Carlo Simulationen für t-Tests und U-Tests bei verschiedenen Parameterwerten durchführen.


[[Datei:Videolink_neu.PNG|link=http://141.76.19.82:3838/mediawiki/konfidenzintervall_link.html
|120px]] <span style="color: white"> kkk </span>  Im [http://141.76.19.82:3838/mediawiki/pwertlink.html Video] werden Power-Vergleiche näher erläutert.


[[Datei:Simulationslink_neu2.PNG|link=http://141.76.19.82:3838/mediawiki/1_1_p-Wert/App_Version/
|120px]] <span style="color: white"> kkk </span>  In der [http://141.76.19.82:3838/mediawiki/1_1_p-Wert/App_Version/ interaktiven Simulation] lassen sich Power-Vergleiche anhand von Monte-Carlo Simulationen für t-Tests und U-Tests bei verschiedenen Parameterwerten durchführen.


'''''Weiterführende Literatur'''''


Cohen, J. (1988). ''Statistical power analysis for the behavioral sciences''. Hillsdale, NY: Erlbaum.


'''''Weiterführende Literatur'''''
Rudolf, M. & Kuhlisch, W. (2020). ''Biostatistik. Eine Eine Einführung für Bio- und Umweltwissenschaftler'' (2. Aufl.). München: Pearson Studium. (Kapitel 6.5)
 
Rudolf, M., & Kuhlisch, W. (2008). ''Biostatistik: Eine Einführung für Biowissenschaftler'' (Kapitel 5.5). München: Pearson Studium.

Aktuelle Version vom 28. Februar 2023, 10:29 Uhr

Power-Untersuchungen ermöglichen auf der Basis von Simulationen Einschätzungen über die Wahrscheinlichkeit, dass bestimmte statistische Tests unter gegebenen Parametern die Nullhypothese korrekterweise ablehnen (vgl. Teststärke).

Um die Power eines Tests zu schätzen, können z.B. Monte-Carlo Simulationen durchgeführt werden (vgl. Robustheitsuntersuchungen). Am Beispiel des Mittelwertsvergleichs von zwei Stichproben werden dafür aus zwei Grundgesamtheiten mit unterschiedlichen Mittelwerten und gleichen Standardabweichungen jeweils eine große Menge an Stichproben der Größe n gezogen. Für jedes Stichprobenpaar wird dann die Teststatistik berechnet. Der Anteil aller Vergleiche, welche die Nullhypothese bei vorher festgelegtem α signifikant ablehnen, entspricht in diesem Fall der Teststärke, da allen berechneten Teststatistiken ein realer Mittelwertsunterschied der Grundgesamtheiten zugrunde liegt.

Ein Power-Vergleich vergleicht die Wahrscheinlichkeiten verschiedener statistischer Tests, unter gegebenen Parametern signifikante Ergebnisse zu erzielen. In Abbildung 1 wird z.B. der Vergleich zwischen t-Test und U-Test dargestellt. Dafür wurden aus zwei Grundgesamtheiten mit einem Mittelwertsunterschied von 1 und Standardabweichungen von σ = 1 jeweils 2000 Stichproben der Größe n = 10 gezogen. Die Voraussetzungen des t-Tests und des U-Tests seien erfüllt.


Ausgelagerte Bildbeschreibung von Power Vergleiche


Über jedes dieser 2000 Stichprobenpaare werden ein t-Test und ein U-Test gerechnet. Die Anteile der signifikanten Mittelwertsunterschiede (Power) werden im rechten Teil der Abbil-dung dargestellt. Bei gleichen Voraussetzungen werden beim t-Test etwa 4-5 % mehr Mittelwertsunterschiede signifikant (66.7 %) als beim U-Test (62.15 %). Bei erfüllten Voraussetzungen sollte der t-Test dem U-Test dementsprechend vorgezogen werden.


Videolink neu.PNG kkk Im Video werden Power-Vergleiche näher erläutert.

Simulationslink neu2.PNG kkk In der interaktiven Simulation lassen sich Power-Vergleiche anhand von Monte-Carlo Simulationen für t-Tests und U-Tests bei verschiedenen Parameterwerten durchführen.


Weiterführende Literatur

Cohen, J. (1988). Statistical power analysis for the behavioral sciences. Hillsdale, NY: Erlbaum.

Rudolf, M. & Kuhlisch, W. (2020). Biostatistik. Eine Eine Einführung für Bio- und Umweltwissenschaftler (2. Aufl.). München: Pearson Studium. (Kapitel 6.5)