Aufgaben - Grundbegriffe Statistik 2

Aus eLearning - Methoden der Psychologie - TU Dresden
Zur Navigation springen Zur Suche springen

Der folgenden Bereich enthält Fragen zu Grundbegriffen der Statistik. Alle Fragen sind Multiple Choice Fragen, d.h. es können immer mehrere Antworten richtig sein. Klicken Sie zur Beantwortung einer Frage die korrekten Antwortmöglichkeiten an. Um Ihre Ergebnisse auszuwerten, wählen Sie bitte den Button "Speichern" am unteren Ende der Seite.

Für jede vollständig richtig beantwortete Frage erhalten Sie einen Punkt. Für falsche beantwortete Fragen werden Ihnen keine Punkte abgezogen. Sie können diese Einstellung jedoch beliebig verändern. Ihre Gesamtpunktzahl finden Sie am unteren Seitenende.


  

1 Welche der folgenden Aussagen über Bootstrapping-Verfahren sind zutreffend?

Bootstrapping geht davon aus, dass eine bestimmte Stichprobe repräsentativ für die Population ist. Unter dieser Annahme werden sehr viele Stichproben mit Zurücklegen aus der vorliegenden Stichprobe gezogen.
Bootstrapping geht davon aus, dass die Varianz innerhalb einer Grundgesamtheit sehr gering ist und somit alle relevanten Populationsparameter direkt aus jeder beliebigen Stichprobe dieser Grundgesamtheit abgeleitet werden können.
Bootstrapping geht davon aus, dass eine bestimmte Stichprobe repräsentativ für die Population ist. Unter dieser Annahme werden sehr viele Stichproben ohne Zurücklegen aus der vorliegenden Stichprobe gezogen.
Bootstrapping geht davon aus, dass die Varianz innerhalb einer Grundgesamtheit sehr gering ist und somit alle relevanten Populationsparameter als Varianz der Parameterwerte einer beliebigen Stichprobe berechnet werden können.

2 Welche Voraussetzungen müssen zur Durchführung eines Bootstrap-Verfahrens erfüllt sein?

Die im Rahmen des Bootstrap-Verfahrens verwendete Stichprobe sollte nicht zu klein sein.
Vor der Durchführung des Bootstrap-Verfahrens muss eine begründete Verteilungsannahme der Werte der Grundgesamtheit getroffen werden können.
Die Werte, der im Rahmen des Bootstrap-Verfahrens verwendeten Stichprobe, müssen einer Normalverteilung folgen.
Die im Rahmen des Bootstrap-Verfahrens verwendete Stichprobe muss repräsentativ für die Grundgesamtheit sein.

3 Die moderne Statistik greift immer häufiger auf die Durchführung von Bootstrap-Verfahren zurück. Wozu können diese verwendet werden?

Ermittlung von Faktorwerten und Ladungen der Hauptkomponentenanalyse
Schätzung von Standardfehlern in multiplen linearen Regressionsanalysen
Berechnung von Konfidenzintervalle für Stichprobenkennwerte
Berechnung von Konfidenzintervallen für Regressionsparametern in multiplen linearen Regressionsanalysen
Berechnung von Konfidenzintervallen für Effektgrößen
Schätzung von Populationsparametern bei unbekannter Verteilung der Grundgesamtheit

4 Was versteht man unter einem Bootstrap-Konfidenzintervall?

Ein Bootstrap-Konfidenzintervall gibt eine exakte Schätzung für die Varianz eines Populationsparameters an und wird mithilfe eines Bootstrap-Verfahrens ermittelt.
Ein Bootstrap-Konfidenzintervall gibt an, wie wahrscheinlich ein Stichprobenergebnis oder ein noch extremeres Ergebnis für einen Stichprobenparameter ist, unter der Annahme, dass die Werte der Grundgesamtheit einer Normalverteilung folgen. Diese Wahrscheinlichkeit wird mithilfe eines Bootstrap-Verfahrens ermittelt.
Ein Bootstrap-Konfidenzintervall gibt die Wahrscheinlichkeit an, dass eine bestimmte Stichprobe repräsentativ für eine normalverteilte Grundgesamtheit ist. Diese Wahrscheinlichkeit wird mithilfe eines Bootstrap-Verfahrens ermittelt.
Ein Bootstrap-Konfidenzintervall gibt den Wertebereich an, in dem eine bestimmte Anzahl (prozentuale Häufigkeit) der Parameter liegen, die im Ergebnis eines Bootstrap-Verfahrens ermittelt wurden.

5 Welche Aussagen bezüglich eines Bootstrap-Konfidenzintervalls und dessen Größe sind zutreffend?

Die Verwendung eines 90 % Konfidenzniveaus für die Berechnung des Bootstrap-Konfidenzintervalls führt zu einem breiteren Konfidenzintervall als die Verwendung eines 95 % Konfidenzniveaus.
Der Wertebereich des Bootstrap-Konfidenzintervalls berechnet sich direkt aus den Werten einer einzelnen Stichprobe.
Zur Ermittlung der Bootstrap-Konfidenzintervalls wird in der Regel eine rechenaufwendige Computersimulation angewandt.
Ausreißerwerte innerhalb der zur Durchführung des Bootstrap-Verfahrens verwendeten Stichprobe führen zu einem breiteren Konfidenzintervall.

6 Was versteht man unter einem Permutationstest?

Ein Permutationstest ist ein parametrischer Test zur Prüfung der Frage, ob eine Stichprobe aus einer normalverteilten Grundgesamtheit stammt.
Ein Permutationstest ist ein nicht-parametrischer Test zur Prüfung der Frage, ob zwei Stichproben aus derselben Grundgesamtheit stammen.
Ein Permutationstest ist ein parametrischer Test zur Prüfung der Frage, ob zwei Stichproben aus derselben Grundgesamtheit stammen.
Ein Permutationstest ist ein nicht-parametrischer Test zur Prüfung der Frage, ob eine Stichprobe aus einer normalverteilten Grundgesamtheit stammt.

7 Welche Aussagen bezüglich des Monte-Carlo Prinzips sind zutreffend?

Das Monte-Carlo Prinzip stellt einen Algorithmus zur Berechnung der Determinanten von Matrizen dar.
Das Monte-Carlo Prinzip stellt ein universelles Verfahren zur Lösung beliebiger linearer Gleichungssysteme dar.
Das Monte-Carlo Prinzip stellt ein Rotationsverfahren der Faktorenanalyse dar, bei welchem die Faktoren in fortlaufenden Schritten so lange im Raum gedreht werden, bis die Varianz der quadrierten Ladungen pro Faktor maximal ist.
Das Monte-Carlo Prinzip stellt ein Simulationsverfahren dar.

8 Gegeben sei die folgende Ausgangssituation: Es soll ein Permutationstest durchgeführt werden, mit dem Ziel der Überprüfung, ob sich die Mittelwerte von zwei Teilpopulationen signifikant voneinander unterscheiden. Dazu steht je eine Stichprobe (n1 = 22, n2 = 17) der beiden Teilpopulationen zur Verfügung. Welche der folgenden Beschreibungen entsprechen korrekten Schritten der Durchführung eines Permutationstests?

Es erfolgt eine Simulation der Verteilung der Differenzen zwischen den Stichproben unter der Annahme, dass zwischen den Stichproben ein Größenunterschied vorliegt. Die Verteilung der Alternativhypothese wird erzeugt, indem in möglichst vielen Durchgängen mehrere Teilstichprobe aus den zur Verfügung stehenden 39 Messwerten gezogen werden und deren Gesamtmittelwert berechnet wird.
Es erfolgt eine Simulation der Verteilung der Differenzen zwischen den Stichproben unter der Annahme, dass zwischen den Stichproben ein Größenunterschied vorliegt. Die Verteilung der Alternativhypothese wird erzeugt, indem in möglichst vielen Durchgängen die zur Verfügung stehenden 39 Messwerte beider Stichproben zufällig in eine 22er und eine 17er Gruppe aufgeteilt werden und die resultierenden Mittelwertdifferenzen berechnet werden.
Es erfolgt eine Simulation der Verteilung der Differenzen zwischen den Stichproben unter der Annahme, dass es in den Stichproben keine mittleren Größenunterschiede gibt. Die interessierende Nullhypothesen-Verteilung wird erzeugt, indem in möglichst vielen Durchgängen mehrere Teilstichprobe aus den zur Verfügung stehenden 39 Messwerten gezogen werden und deren Gesamtmittelwert berechnet wird.
Es erfolgt eine Simulation der Verteilung der Differenzen zwischen den Stichproben unter der Annahme, dass es in den Stichproben keine mittleren Größenunterschiede gibt. Die interessierende Nullhypothesen-Verteilung wird erzeugt, indem in möglichst vielen Durchgängen die zur Verfügung stehenden 39 Messwerte beider Stichproben zufällig in eine 22er und eine 17er Gruppe aufgeteilt werden und die resultierenden Mittelwertdifferenzen berechnet werden.

9 In einem Permutationstest, welche den Mittelwertsunterschied zweier Teilpopulationen untersucht, wurde zunächst eine Nullhypothesenverteilung der Mittelwertdifferenzen erzeugt (H1: μ1 > μ0; Ho: μ1 ≤ μ0). Nun soll der p-Wert dieser Untersuchung ermittelt werden. Welche der folgenden Aussagen bezüglich des p-Wertes sind zutreffend?

Ein Signifikanzniveau von 1 % führt zu einem kleineren p-Wert als ein Signifikanzniveau von 5 %.
Der p-Wert entspricht dem Anteil der Mittelwertdifferenzen, die gleich oder größer sind, als die in der Stichprobe ermittelte Mittelwertdifferenz.
Beim Vorliegen eines p-Wertes, welches kleiner ist als ein vorgegebenes Signifikanzniveau α, spricht man von einem signifikanten Ergebnis, d.h. von einem signifikanten Mittelwertunterschied zwischen den beiden Teilpopulationen.
Der p-Wert entspricht dem Anteil der Mittelwertdifferenzen, die kleiner sind, als die in der Stichprobe ermittelte Mittelwertdifferenz.

10 Das Ergebnis eines Permutationstests zur Überprüfung des Vorliegens eines Mittelwertunterschiedes zwischen zwei Teilpopulationen ist von verschiedenen Parametern abhängig. Welche der folgenden Aussagen über verschiedene Einflussgrößen sind korrekt?

Bei konstanter Varianz der Ausgangsstichproben ist es umso wahrscheinlicher ein signifikantes Ergebnis zu finden, je größer der Mittelwertunterschied zwischen den Ausgangsstichproben der beiden Teilpopulationen ist.
Je höher das Signifikanzniveau α ist, desto größer ist der als Cohen’s d ermittelte Mittelwertunterschied der Ausgangsstichproben.
Je höher das Signifikanzniveau α ist, desto geringer ist der als Cohen’s d ermittelte Mittelwertunterschied der Ausgangsstichproben.
Je mehr Zufallsziehungen zur Durchführung des Permutationstests verwendet werden, desto genauer ist das ermittelte Endergebnis.

11 Was versteht man unter der „Robustheit“ eines statistischen Tests?

Ein Test A wird als robust bezeichnet, wenn die Wahrscheinlichkeit eines Fehlers 2. Art bei Test A größer ist als bei einem Test B. Das heißt also, dass bei Test A die Nullhypothese häufiger angenommen wird, obwohl sie falsch ist, als dies bei Test B der Fall ist.
Die Robustheit eines statistischen Tests wird definiert als das Verhältnis der Stichprobengröße eines Tests A mit schwächeren Voraussetzungen (z.B. beliebige Verteilungsannahme) zur Stichprobengröße eines Tests B mit stärkeren Voraussetzungen (z.B. Normalverteilung der zu untersuchenden Daten), so dass beide Tests die identische Power aufweisen.
Ein robuster Test reagiert robust auf Verletzen der Voraussetzungen. Das heißt, er liefert auch dann zuverlässige Ergebnisse, wenn die Voraussetzungen dieses Tests (z.B. Normalverteilung der zu untersuchenden Daten) nicht oder nicht vollständig erfüllt sind.
Ein Test A wird als robust bezeichnet, wenn die Wahrscheinlichkeit eines Fehlers 2. Art bei Test A kleiner ist als bei einem Test B. Das heißt also, dass bei Test A die Nullhypothese seltener angenommen wird, obwohl sie falsch ist, als dies bei Test B der Fall ist.

12 Welche der folgenden Voraussetzungen sollten für die Durchführung eines t-Tests erfüllt sein?

Normalverteilung der Daten
Ausreißer sollten in den Daten nicht vorkommen
Intervallskalierung oder Verhältnisskalierung der abhängigen Variablen
Heteroskedastizität

13 Welche der folgenden Beschreibungen ermöglicht die Untersuchung der Robustheit des t-Tests gegen eine Konstante?

Ziehung von Zufallsstichproben aus einer Grundgesamtheit mit den zu untersuchenden Verteilungseigenschaften und einer Grundgesamtheit mit Standardnormalverteilung. Die Robustheit des Tests wird anhand des Unterschieds der Varianz zwischen den Gruppen von Zufallsziehungen bewertet.
Ziehung von Zufallsstichproben aus einer Grundgesamtheit mit bestimmten Verteilungseigenschaften, für jede dieser Zufallsstichproben wird ein t-Test gegen eine Konstante, welche dem Mittelwert der jeweiligen Grundgesamtheit entspricht, gerechnet. Die Robustheit des Tests wird anhand des Anteils von Testergebnissen t > 1 bewertet.
Ziehung von Zufallsstichproben aus einer Grundgesamtheit mit den zu untersuchenden Verteilungseigenschaften und einer Grundgesamtheit mit Standardnormalverteilung. Die Robustheit des Tests wird anhand des Mittelwertunterschiedes der beiden Gruppen von Stichproben bewertet.
Ziehung von Zufallsstichproben aus einer Grundgesamtheit mit bestimmten Verteilungseigenschaften, für jede dieser Zufallsstichproben wird ein t-Test gegen eine Konstante, welche dem Mittelwert der jeweiligen Grundgesamtheit entspricht, gerechnet. Die Robustheit des Tests wird anhand des Anteils signifikanter Ergebnisse einer solchen Simulation bewertet.

14 Wie hoch sollte in einer Robustheitsuntersuchung der Anteil signifikanter Ergebnisse unter Gültigkeit aller Voraussetzungen des t-Tests sein, wenn ein t-Test mit zweiseitiger Fragestellung gegen eine Konstante (= Mittelwert der Grundgesamtheit, aus welcher die Stichproben stammen) mit einem Signifikanzniveau von 5 % durchführt wird?

10 %
5 %
95 %
2.5 %

15 Welche Aussagen über die Robustheit des t-Tests gegen eine Konstante sind zutreffend?

Die Robustheit des t-Tests nimmt, bei zugrundeliegender Normalverteilung der Grundgesamtheit, mit steigender Standardabweichung ab.
Die Robustheit des t-Tests nimmt bei Verletzung der Voraussetzung normalverteilter Daten bei steigender Stichprobengröße zu.
Die Robustheit ist unabhängig von der Verteilung der Grundgesamtheit.
Die Robustheit des t-Tests nimmt, bei zugrundeliegender Normalverteilung der Grundgesamtheit, mit steigender Stichprobengröße ab.

16 Welche der folgenden Begriffe können synonym zum Begriff „Power“ verwendet werden?

Macht eines Tests
Signifikanz eines Tests
Effizienz eines Tests
Teststärke

17 Welche der folgenden Vorgehensweisen erlauben die Bestimmung der Power eines statistischen Tests?

Durchführung einer Monte Carlo Simulation, welche die vielfache Ziehung von Zufallsstichproben aus zwei Grundgesamtheiten simuliert. Die Stichprobenmittelwerte der Stichproben aus beiden Grundgesamtheiten werden mittels eines statistischen Tests verglichen. Die Power des Tests wird anhand des Anteils signifikanter Ergebnisse der Simulation bewertet.
Ist die Wahrscheinlichkeit eines Fehlers 1. Art bekannt, kann die Power des statistischen Tests mithilfe der folgenden Formel rechnet werden: 1-α
Das Wissen über die Stichprobengröße und das Signifikanzniveau sind ausreichend, um die Power jedes statistischen Tests aus standardisierten Tabellen entnehmen zu können.
Ist die Wahrscheinlichkeit eines Fehlers 2. Art bekannt, kann die Power des statistischen Tests mithilfe der folgenden Formel berechnet werden: 1-β

18 Welche Beschreibungen der Beziehung zwischen der Power eines t-Tests und der Power eines U-Tests zum Vergleich der Mittelwerte zweier Grundgesamtheiten sind korrekt?

Bei Vorliegen von normalverteilten Grundgesamtheiten übersteigt die Power des t-Tests die Power des U-Tests.
Bei Vorliegen von normalverteilten Grundgesamtheiten unterscheidet sich die Power des t-Tests nicht von der Power des U-Tests.
Je größer der Stichprobenumfang, desto größer ist die Power des t-Tests und desto kleiner ist die Power des U-Tests.
Je größer der Stichprobenumfang, desto größer sind die Power t-Tests und des U-Tests.

19 Welche Aussagen über die Veränderung der Power eines statistischen Tests sind zutreffend?

Je größer das verwendete Signifikanzniveau α, desto größer ist die resultierende Power des statistischen Tests.
Je kleiner der tatsächlich vorliegende empirisch zu untersuchende Effekt ist, desto größer ist die resultierende Power eines statistischen Tests.
Je größer die Power eines statistischen Tests ist, desto größer ist die Wahrscheinlichkeit eines Fehlers 2. Art, also des Annehmens der Nullhypothese, obwohl die Alternativhypothese gilt.
Je größer der Stichprobenumfang ist, desto größer ist die Power eines statistischen Tests.

20 Wozu können Teststärkeanalysen verwendet werden?

Bestimmung der maximalen Effektstärke Δ, die ein statistischer Test mit a priori definiertem Signifikanzniveau α und der Wahrscheinlichkeit für einen Fehler 2. Art in einer Stichprobe mit einer bestimmten Größe finden kann
Bestimmung der minimalen Effektstärke Δ, die ein statistischer Test mit a priori definiertem Signifikanzniveau α und gegebener Wahrscheinlichkeit für einen Fehler 2. Art in einer Stichprobe eines gegebenen Umfangs finden kann
A posteriori Bestimmung der Teststärke eines statistischen Tests, bei einem gegebenem Signifikanzniveau α, einem empirisch ermittelten Effekt Δ und gegebener Größe der erhobenen Stichprobe n
Planung von minimalen Stichprobenumfängen, die ein statistischer Test benötigt, um mit a priori definiertem Signifikanzniveau α und vorgegebener Wahrscheinlichkeit für einen Fehler 2. Art einen zu erwartenden Effekt Δ (mit einer bestimmten Größe) zu finden.