Stichprobenumfangsplanung: Unterschied zwischen den Versionen

Aus eLearning - Methoden der Psychologie - TU Dresden
Zur Navigation springen Zur Suche springen
Keine Bearbeitungszusammenfassung
Keine Bearbeitungszusammenfassung
Zeile 7: Zeile 7:
Da die Streuung, der Mittelwertsunterschied und das Signifikanzniveau nicht, bzw. nicht ohne Konsequenzen veränderbar sind, stellt die in der Praxis oftmals einzige Stellschraube zur Veränderung der Teststärke der Stichprobenumfang dar. Erhöht man den Stichprobenumfang, verkleinert sich der [[Standardfehler]] des Mittelwertes und es erhöht sich die Teststärke, da die Mittelwertsverteilungen der Alternativ- und der Nullhypothese schmaler werden und dadurch weniger überlappen, d.h. besser voneinander abzugrenzen sind.  
Da die Streuung, der Mittelwertsunterschied und das Signifikanzniveau nicht, bzw. nicht ohne Konsequenzen veränderbar sind, stellt die in der Praxis oftmals einzige Stellschraube zur Veränderung der Teststärke der Stichprobenumfang dar. Erhöht man den Stichprobenumfang, verkleinert sich der [[Standardfehler]] des Mittelwertes und es erhöht sich die Teststärke, da die Mittelwertsverteilungen der Alternativ- und der Nullhypothese schmaler werden und dadurch weniger überlappen, d.h. besser voneinander abzugrenzen sind.  


Es wird derjenige Stichprobenumfang ermittelt, der unter gegebenen Signifikanzniveau und Parameterschätzungen eine bestimmte Genauigkeit erzielt. Dieser kann im Fall des Tests auf der Basis der Standardnormalverteilung über die Formel [[File:formel_stichprobenumfangsplanung.PNG|80px]] berechnet werden. z<sub>1-β</sub> und  z<sub>1-α</sub> sind die Werte der Standardnormalverteilung für das jeweilige Quantil und lassen sich aus entsprechenden Tabellen ablesen. σ entspricht der Streuung und Δ dem Mittelwertsunterschied.
Es wird derjenige Stichprobenumfang ermittelt, der unter gegebenen Signifikanzniveau und Parameterschätzungen eine bestimmte Genauigkeit erzielt. Dieser kann im Fall des Tests auf der Basis der Standardnormalverteilung über die Formel [[File:formel_stichprobenumfangsplanung.PNG|120px]] berechnet werden. z<sub>1-β</sub> und  z<sub>1-α</sub> sind die Werte der Standardnormalverteilung für das jeweilige Quantil und lassen sich aus entsprechenden Tabellen ablesen. σ entspricht der Streuung und Δ dem Mittelwertsunterschied.





Version vom 4. März 2020, 20:45 Uhr

Die Stichprobenumfangsplanung spielt eine wichtige Rolle bei der Versuchsplanung. Bei der Auswahl des Stichprobenumfangs ist es von Interesse, eine hohe Genauigkeit der Ergebnisse zu erzielen und gleichzeitig den wirtschaftlichen und organisatorischen Aufwand so gering wie möglich zu halten. Diese beiden Ziele stehen sich entgegen und es muss ein Kompromiss zwischen beiden gefunden werden.

Die Genauigkeit der Ergebnisse wird durch die Teststärke (1-β) definiert. Wie hoch diese sein sollte, wird anhand von Vorüberlegungen durch den Anwender festgelegt. In der Praxis wird häufig eine Teststärke von 0.8 bzw. 80 % als akzeptabel vertreten. Es wird also eine Wahrscheinlichkeit von 0.2 bzw. 20 % für einen β-Fehler akzeptiert. Diese ist viermal höher als die oft maximal akzeptierte Irrtumswahrscheinlichkeit für einen α-Fehler (0.05).

Da die Streuung, der Mittelwertsunterschied und das Signifikanzniveau nicht, bzw. nicht ohne Konsequenzen veränderbar sind, stellt die in der Praxis oftmals einzige Stellschraube zur Veränderung der Teststärke der Stichprobenumfang dar. Erhöht man den Stichprobenumfang, verkleinert sich der Standardfehler des Mittelwertes und es erhöht sich die Teststärke, da die Mittelwertsverteilungen der Alternativ- und der Nullhypothese schmaler werden und dadurch weniger überlappen, d.h. besser voneinander abzugrenzen sind.

Es wird derjenige Stichprobenumfang ermittelt, der unter gegebenen Signifikanzniveau und Parameterschätzungen eine bestimmte Genauigkeit erzielt. Dieser kann im Fall des Tests auf der Basis der Standardnormalverteilung über die Formel Datei:Formel stichprobenumfangsplanung.PNG berechnet werden. z1-β und z1-α sind die Werte der Standardnormalverteilung für das jeweilige Quantil und lassen sich aus entsprechenden Tabellen ablesen. σ entspricht der Streuung und Δ dem Mittelwertsunterschied.


Beispiel

In einem großen Unternehmen soll zur Verbesserung der Arbeitszufriedenheit ein kostenloses Sport- und Entspannungsprogramm für die Mitarbeiter angeboten werden. Die mittlere Ar-beitszufriedenheit in diesem Unternehmen beträgt 25 bei einer Standardabweichung von 6. Damit sich der finanzielle Mehraufwand lohnt, sollte das Programm die Arbeitszufriedenheit um mindestens 2 erhöhen. Zur Finanzierung des Programmes ist eine langfristig geplante Umstrukturierung an mehreren Standorten des Unternehmens vorgesehen, falls sich das Pro-gramm als erfolgreich herausstellen sollte. Deswegen wird ein konservativeres Signifikanzni-veau von 0.01 festgelegt, um das Risiko von Fehlinvestitionen möglichst gering zu halten. Gleichzeitig soll die Wahrscheinlichkeit ein signifikantes Ergebnis zu finden, wenn auch tat-sächlich eine Verbesserung der Arbeitszufriedenheit um 2 Punkte vorliegt, mindestens 80 % betragen. Zur Überprüfung der Wirksamkeit soll dieses testweise für einen Teil der Mitarbeiter angeboten werden. Um bei einer Genauigkeit von mindestens 80 % den Kostenaufwand mög-lichst gering zu halten, wird eine Stichprobenumfangsplanung durchgeführt. Es wird der Stich-probenumfang gesucht, der bei einem Mittelwertsunterschied von Δ = 2 zwischen den Popula-tionen und einer Streuung von σ = 6 bei einem Signifikanztest mit α = 0.01 in 80 % der Fälle ein signifikantes Ergebnis findet. Bei dieser ergibt sich mit der oben genannten Formel, dass unter den gegebenen Parametern (Δ = 2; σ = 6) und einem Signifikanzniveau von α = 0.01 ein Stichprobenumfang von n = 90 erforderlich ist, um einen tatsächlichen Effekt des Programms mit 80 %-iger Wahrscheinlichkeit zu finden. In Abbildung 1 wird der beschriebene Sachverhalt grafisch dargestellt.


Abbildung 1: Verteilung der Stichprobenmittelwerte zweier Populationen und Darstellung der Teststärke


Videolink neu.PNG kkk Im Video wird die Stichprobenumfangsplanung näher erläutert.

Simulationslink neu2.PNG kkk Wie der Stichprobenumfang von Grundgesamtheiten mit unterschiedlichen Parameterwerten die Teststärke beeinflusst, lässt sich in der interaktiven Simulation grafisch veranschaulichen.


Weiterführende Literatur

Bock, J. (1998). Bestimmung des Stichprobenumfangs: Für biologische Experimente und kontrollierte klinische Studien. München: Oldenbourg.

Cohen, J. (2013). Statistical power analysis for the behavioral sciences. Routledge.

Rudolf, M., & Kuhlisch, W. (2008). Biostatistik: Eine Einführung für Biowissenschaftler (Kapitel 9.3). München: Pearson Studium.