Aufgaben - Multiple lineare Regression

Aus eLearning - Methoden der Psychologie - TU Dresden
Wechseln zu: Navigation, Suche

Der folgenden Bereich enthält Fragen zur multiplen linearen Regression. Alle Fragen sind Multiple Choice Fragen, d.h. es können immer mehrere Antworten richtig sein. Klicken Sie zur Beantwortung einer Frage die korrekten Antwortmöglichkeiten an. Um Ihre Ergebnisse auszuwerten, wählen Sie bitte den Button "Speichern" am unteren Ende der Seite.

Für jede vollständig richtig beantwortete Frage erhalten Sie einen Punkt. Für falsche beantwortete Fragen werden Ihnen keine Punkte abgezogen. Sie können diese Einstellung jedoch beliebig verändern. Ihre Gesamtpunktzahl finden Sie am unteren Seitenende.








  

1

Welche der folgenden Definitionen kann zur Beschreibung einer multiplen linearen Regression verwendet werden?

Die multiple lineare Regression ist ein statistisches Verfahren, mit dem versucht wird, eine beobachtete abhängige ordinale oder kategoriale Variable durch mehrere unabhängige Variablen zu erklären.
Die multiple lineare Regression ist ein statistisches Verfahren, mit dem versucht wird, mehrere beobachtete abhängige ordinale oder kategoriale Variablen durch mehrere unabhängige Variablen zu erklären.
Die multiple lineare Regression ist ein statistisches Verfahren, mit dem versucht wird, mehrere abhängige metrische Variablen durch eine oder mehrere unabhängige Variablen zu erklären.
Die multiple lineare Regression ist ein statistisches Verfahren, mit dem versucht wird, eine beobachtete abhängige metrische Variable durch mehrere unabhängige Variablen zu erklären.

2

Mithilfe welches allgemeinen Schätzprinzips können die Regressionskoeffizienten im Rahmen einer multiplen linearen Regression bestimmt werden?

Methode der multiplen Quadrate
Methode der größten Quadrate
Methode der kleinsten Quadrate
Methode der multiplen linearen Quadrate

3

Welche Voraussetzungen sollten für die Durchführung einer multiplen linearen Regressionsanalyse erfüllt sein?

Statistische Abhängigkeit der Modellfehler
Homoskedastizität
Festlegung von Prädiktoren und Kriterium
Gültigkeit des linearen Modells
Normalverteilung der Modellfehler

4

Was bedeutet Homoskedastizität?

Mittelwerte der Modellfehler sind normalverteilt
Mittelwerte der Modellfehler sind nicht normalverteilt
Varianzen der Modellfehler sind in Abhängigkeit der konkreten Werten der Prädiktoren verschieden
Varianzen der Modellfehler sind unabhängig von den konkreten Werten der Prädiktoren gleich

5

Die folgenden Abbildungen stellen eine grafische Gegenüberstellung der z-standardisierten Residuen und der z-standardisierten Schätzungen für die Kriteriumsvariablen einer multiplen linearen Regression dar. Welche der Abbildungen liefern einen Hinweis auf Heteroskedastizität?

3 3 MC 4.PNG
3 3 MC 2.PNG
3 3 MC 1.PNG
3 3 MC 3.PNG

6

Was versteht man unter dem Begriff der „Multikollinearität“?

Multikollinearität ist ein Problem der Regressionsanalyse und liegt vor, wenn keine oder nur schwache Korrelationen zwischen den abhängigen Variablen bestehen.
Multikollinearität ist ein Problem der Regressionsanalyse und liegt vor, wenn zwei oder mehr der Prädiktoren stark miteinander korrelieren.
Multikollinearität ist ein Problem der Regressionsanalyse und liegt vor, wenn keine oder nur schwache Korrelationen zwischen den Prädiktoren bestehen.
Multikollinearität ist ein Problem der Regressionsanalyse und liegt vor, wenn zwei oder mehr der abhängigen Variablen stark miteinander korrelieren

7

Welche der folgenden Begriffe stellen Folgen des Vorliegens von Multikollinearität dar?

Redundanz
Suppressionseffekte
Konversion
Introjektion

8

Welche Folgen können durch das Vorhandensein von Multikollinearität bei der Durchführung einer multiplen linearen Regression auftreten?

Ungenauigkeit von Aussagen zur Schätzung von Regressionskoeffizienten
Erhöhung der Standardfehler der Schätzungen der Regressionskoeffizienten
Eindeutigkeit der Modellinterpretation
Instabilität des Verfahrens zur Schätzung der Regressionskoeffizienten

9

Welche der folgenden Beobachtungen können Warnzeichen für das Vorliegen von Multikollinearität darstellen?

Ein Prädiktor, der sehr stark mit der Kriteriumsvariablen korreliert, besitzt im Ergebnis der Regressionsanalyse keinen signifikanten Regressionskoeffizienten.
Nach der Aufnahme eines weiteren Prädiktors in ein Regressionsmodell kommt es zu einer starken Veränderung der Regressionskoeffizienten.
Die Prädiktoren korrelieren sehr stark miteinander.
Der VIF (Varianzinflationsfaktor) des Regressionsmodells ist gering und der Wert der Toleranz des Regressionsmodells ist sehr hoch.

10

Welche Beziehungen sind Hinweise für Redundanz eines Prädiktors?

Prädiktor korreliert hoch und signifikant mit dem Kriterium und mit anderen Prädiktoren und hat keinen signifikanten Regressionskoeffizienten in der multiplen Regressionsanalyse
Prädiktor korreliert hoch und signifikant mit dem Kriterium und mit anderen Prädiktoren und hat einen signifikanten Regressionskoeffizienten in der multiplen Regressionsanalyse
Prädiktor korreliert hoch und signifikant mit anderen Prädiktoren, nicht aber mit dem Kriterium, und hat einen signifikanten Regressionskoeffizienten in der multiplen Regressionsanalyse
Prädiktor korreliert hoch und signifikant mit dem Kriterium, aber nicht mit den anderen Prädiktoren und hat einen signifikanten Regressionskoeffizienten in der multiplen Regressionsanalyse

11

Welche der folgenden Ziele werden von einem Merkmalselektionsverfahrens im Rahmen einer multiplen linearen Regression verfolgt?

Identifikation von möglichst wenigen Prädiktoren, welche eine gute Vorhersage der Kriteriumsvariable ermöglichen
Minimierung des erforderlichen ökonomischen, inhaltlichen und statistischen Aufwands
klare inhaltliche Interpretation des Regressionsmodells
Erhöhung der Fehlervarianz

12

Das Grundprinzip von Merkmalsselektionsverfahren im Rahmen einer multiplen linearen Regression besteht darin, für einzelne Prädiktorvariablen zu beurteilen, inwieweit sich durch ihre Hinzunahme zw. Entfernung aus dem Merkmalssatz das multiple Bestimmtheitsmaß signifikant verändert. Welcher Test wird zur Prüfung der Signifikanz dieser Veränderung verwendet?

Kolmogorow-Smirnow-Test
Chi-Quadrat Test
t-Test
F-Test

13

Welche Arten von Merkmalssektionsverfahren werden üblicherweise im Rahmen einer multiplen linearen Regression angewandt?

Verfahren der sofortigen Merkmalsaufnahme („Absolutverfahren“)
Verfahren der schrittweisen Merkmalsentfernung („Rückwärtsverfahren“)
Verfahren der schrittweisen Merkmalsaufnahme („Vorwärtsverfahren“)
Verfahren der schrittweisen Merkmalsentfernung bzw. Merkmalsaufnahme („schrittweises Verfahren“)

14

Welche der folgenden Aussagen über Merkmalsselektionsverfahren im Rahmen einer multiplen linearen Regression sind wahr?

Jedes Merkmalsselektionsverfahren (Vorwärtsverfahren, Rückwärtsverfahren, …) führt dazu, dass im Regressionsmodell nach Abschluss des Verfahrens die gleichen Prädiktoren enthalten sind.
Das schrittweise Verfahren kombiniert das Rückwärts- und das Vorwärtsverfahren.
Die Anwendung eines Vorwärtsverfahrens führt in jedem Fall zu einem größeren multiplen Bestimmtheitsmaß als die Anwendung eines Rückwärtsverfahrens.
Das multiple Bestimmtheitsmaß R² des mithilfe eines Merkmalsselektionsverfahrens ermittelten Regressionsmodells kann sich in Abhängigkeit des ausgewählten Verfahrens unterscheiden.

15

Die Kriteriumsvariable Y soll durch die Prädiktoren A, B, C, D und E vorhergesagt werden. Die Durchführung eines Verfahrens der schrittweisen Merkmalsaufnahme (Vorwärtsverfahren) führt zur Aufnahme der Prädiktoren A und C ins Regressionsmodell. Das multiple Bestimmtheitsmaß beträgt 0.68. Basierend auf beschriebenen Ausgangsdatensatz wird außerdem ein Verfahren der schrittweisen Merkmalsentfernung (Rückwärtsverfahren) durchgeführt. Welche der folgenden Ergebnisse könnten durch dieses Verfahren ermittelt werden?

Aufnahme der Prädiktoren A und C ins Modell ; R² = 0.68
Aufnahme der Prädiktoren A und C ins Modell ; R² = 0.72
Aufnahme der Prädiktoren B und D ins Modell ; R² = 0.69
Aufnahme der Prädiktoren B und C ins Modell ; R² = 1.08

16

Welche(s) Ziel(e) verfolgt eine hierarchische Regression?

Untersuchung des Erklärungsbeitrages inhaltlich strukturierter Merkmalsmengen
Untersuchung des Erklärungsbeitrages der Regressionskonstante
Untersuchung des Erklärungsbeitrages von Zeitreihen
Untersuchung des Erklärungsbeitrages aus dem Datensatz extrahierter Hauptkomponenten

17

Was dient als Orientierung für die Auswahl der Reihenfolge der Aufnahme von Merkmalsmengen im Rahmen einer hierarchischen Regression?

Anzahl der Prädiktoren in den Merkmalsmengen
Summe der t-Werte der Prädiktoren der Merkmalsmenge
Summe der β-Gewichte der Prädiktoren der Merkmalsmenge
inhaltliche Gesichtspunkte

18

Welche der folgenden Aussage(n) über eine hierarchische Regression sind zutreffend?

Die Reihenfolge der Aufnahme von Merkmalsmengen ist besonders dann wichtig, wenn die Merkmalsmengen stark korrelieren.
Die Bedeutsamkeit der Reihenfolge der Aufnahme von Merkmalsmengen ist unabhängig von Multikollinearität im Datensatz.
Resultieren in Abhängigkeit der Reihenfolge der Aufnahme der Merkmalsmengen unterschiedliche Regressionsmodelle, liefert dies einen Hinweis auf Multikollinearität.
Korrelieren die Merkmalsmengen kaum untereinander, dann resultieren abhängig von der Reihenfolge der Aufnahme der Merkmalsmengen oftmals sehr unterschiedliche Ergebnisse.

19

Welche der folgenden Aussage(n) über das multiple Bestimmtheitsmaß R² einer hierarchischen Regression sind wahr?

Ob eine Merkmalsmenge zu einer signifikanten Zunahme an Bestimmtheitsmaß führt, kann davon abhängen, in welchem Schritt die betreffende Merkmalsmenge aufgenommen wird.
Die Aufnahme von 50 % aller Merkmalsmengen führt in jedem Fall zu einem multiplen Bestimmtheitsmaß R² größer als 25 %.
Das multiple Bestimmtheitsmaß R² nimmt für die Aufnahme aller verfügbaren Merkmalsmengen ins Regressionsmodell den maximal möglichen Wert an.
Das multiple Bestimmtheitsmaß R² nimmt ab, je mehr Merkmalsmengen ins Regressionsmodell aufgenommen werden.

20

Die Kriteriumsvariable Y soll durch die Merkmalsmengen A (Prädiktor 1 und 3), B (Prädiktor 2 und 4) und C (Prädiktor 5, 6 und 7) vorhergesagt werden. Es wird eine hierarchische Regression angewandt. Zunächst wird die Merkmalsmenge A ins Modell einbezogen. Das ermittelte multiple Bestimmtheitsmaß R² beträgt 0.65. Im Anschluss wird die Merkmalsmenge C ins Modell ins Regressionsmodell aufgenommen. Dies führt zu einer Zunahme des multiplen Bestimmtheitsmaßes R² um 0.30. In einer zweiten Analyse basierend auf dem gleichen Datensatz wird eine andere Reihenfolge der Aufnahme der Merkmalsmengen gewählt. Welche der folgenden Ergebnisse sind in dieser zweiten Analyse möglich?

Aufnahme Merkmalsmenge B → R² = 0.40; anschließend Aufnahme Merkmalsmenge C → Anstieg R² um 0.40
Aufnahme Merkmalsmenge C → R² = 0.60; anschließend Aufnahme Merkmalsmenge A → Anstieg R² um 0.35
Aufnahme Merkmalsmenge C → R² = 0.75; anschließend Aufnahme Merkmalsmenge A → Anstieg R² um 0.15
Aufnahme Merkmalsmenge B → R² = 0.85; anschließend Aufnahme Merkmalsmenge A → Anstieg R² um 0.20

21

Was versteht man unter einem Standardfehler der Schätzung eines Regressionskoeffizienten, welcher bei der Durchführung einer einfachen oder multiplen linearen Regression berechnet wird?

Standardfehler beschreiben wie präzise der Regressionskoeffizient durch das Modell geschätzt werden kann.
Standardfehler der Regressionskoeffizienten beschreiben die Regressionskoeffizienten, welche entstehen, wenn vor der Regression alle beteiligten Prädiktoren und die Kriteriumsvariable z-standardisiert werden.
Standardfehler stellen die Koeffizienten der Regressionsfunktion, die sich als Schätzungen nach der Methode der kleinsten Quadrate ergeben, dar.
Standardfehler stellen die Abweichungen der Schätzwerte von den gemessenen Werten, also die Abweichungen der Messwerte von der Regressionsgerade, dar.

22

Welche der folgenden Größen werden direkt von der Höhe des Regressionskoeffizienten des Standardfehlers beeinflusst, da der Standardfehler in die Berechnung der entsprechenden Größe einfließt?

Regressionskoeffizient
Bestimmtheitsmaß
t-Wert
p-Wert

23

Wie verändert sich der Wert des Standardfehlers des Regressionskoeffizienten in der einfachen linearen Regression in Abhängigkeit vom Betrag der Korrelation zwischen Prädiktor und Kriterium?

Je höher der Betrag der Korrelation zwischen Prädiktor und Kriterium, desto geringer ist der Wert des Standardfehlers des Regressionskoeffizienten des Prädiktors.
Es besteht ein umgekehrt u-förmiger Zusammenhang zwischen der Höhe des Betrages der Korrelation von Prädiktor und Kriterium und der Höhe des Standardfehlers des Regressionskoeffizienten des Prädiktors.
Je höher der Betrag der Korrelation zwischen Prädiktor und Kriterium, desto höher ist der Standardfehler des Regressionskoeffizienten des Prädiktors.
Es gibt keinen Zusammenhang zwischen dem Betrag der Korrelation von Prädiktor und Kriterium und der Höhe des Standardfehlers des Regressionskoeffizienten des Prädiktors.

24

Gegeben sei die folgende Situation: Es wird eine multiple lineare Regression mit zwei Prädiktoren durchgeführt. Welchen Einfluss besitzt die Höhe des Betrages der Korrelation zwischen den beiden Prädiktoren unter diesen Bedingungen?

Je höher der Betrag der Korrelation zwischen den Prädiktoren ist, desto größer sind die Standardfehler der Regressionskoeffizienten der Prädiktoren.
Je höher der Betrag der Korrelation zwischen den Prädiktoren ist, desto höher sind die Regressionskoeffizienten der Prädiktoren.
Je höher der Betrag der Korrelation zwischen den Prädiktoren ist, desto höher ist die Wahrscheinlichkeit, dass nur einer oder keiner der beiden Prädiktoren im Ergebnis der Regressionsanalyse einen signifikanten Regressionskoeffizienten besitzt.
Je höher der Betrag der Korrelation zwischen den Prädiktoren ist, desto kleiner sind die Standardfehler der Regressionskoeffizienten der Prädiktoren.

25

Führt man eine multiple lineare Korrelation mit mehreren untereinander hoch korrelierenden Prädiktoren durch, welche ebenfalls alle hohe Korrelationen mit der Kriteriumsvariablen aufweisen, kann dies dazu führen, dass im Ergebnis der Regression nur ein einzelner dieser Prädiktoren einen signifikant hohen Regressionskoeffizienten erhält. Worauf ist dies zurückzuführen?

Introjektion
Hierarchie
Suppression
Redundanz

26

Was versteht man in der Statistik unter einer Moderatorvariable?

Eine Moderatorvariable bezeichnet eine Variable C, von deren Ausprägung abhängig ist, wie groß der Einfluss einer Variable A auf Variable B ist.
Eine Moderatorvariable bezeichnet eine Variable C, welche den Einfluss einer Variable A auf eine Variable B vermittelt.
Eine Moderatorvariable bezeichnet eine Variable A, welche einen Zusammenhang zu einer Variablen B besitzt, welche unabhängig von der Ausprägung weiterer Einflussvariablen konstant ist.
Eine Moderatorvariable bezeichnet eine Variable A, welche in Abhängigkeit der Ausprägung einer Variable C durch Variable B beeinflusst wird.

27

Im Rahmen einer multiplen linearen Regression kann die Analyse von Moderatoreffekten erfolgen. Angenommen wir möchten durch unsere Untersuchung das Kriterium Leistungsmotivation durch die Prädiktoren Intelligenz und Gewissenhaftigkeit vorhersagen und nehmen aufgrund inhaltlicher Überlegungen an, dass Gewissenhaftigkeit einen Moderator des Zusammenhangs zwischen Intelligenz und Leistungsmotivation darstellt. Wie kann eine solche Analyse erfolgen?

Bildung eines Interaktionsterms als Summe von Prädiktor Intelligenz und potenzieller Moderatorvariable Gewissenhaftigkeit und Aufnahme dieses Interaktionsterms in die multiple lineare Regression zur Vorhersage der Kriteriumsvariable Leistungsmotivation
Bildung eines Interaktionsterms als Quotient von Prädiktor Intelligenz und potenzieller Moderatorvariable Gewissenhaftigkeit und Aufnahme dieses Interaktionsterms in die multiple lineare Regression zur Vorhersage der Kriteriumsvariable Leistungsmotivation
Durchführung einer multiplen linearen Regression zur Vorhersage der Variable Gewissenhaftigkeit durch Intelligenz und Leistungsmotivation, ein hohes Bestimmtheitsmaß > 90 % liefert einen starken Hinweis auf das Vorliegen eines Moderatoreffekts
Bildung eines Interaktionsterms als Produkt von Prädiktor Intelligenz und potenzieller Moderatorvariable Gewissenhaftigkeit und Aufnahme dieses Interaktionsterms in die multiple Regression zur Vorhersage der Kriteriumsvariable Leistungsmotivation

28

Im Folgenden sehen Sie die Ergebnisausgaben verschiedener multipler linearer Regressionen zur Untersuchung von potenziellen Moderatoreffekten von Prädiktor 2 auf die Stärke des Zusammenhangs zwischen Prädiktor 1 und der Kriteriumsvariable. Der Interaktionsterm stellt dabei das Produkt von Prädiktor 1 und 2 dar. Welche Ergebnisausgaben lassen auf einen signifikanten Moderatoreffekt schließen?

3 8 MC Tab2.PNG
3 8 MC Tab3.PNG
3 8 MC Tab1.PNG
3 8 MC Tab4.PNG

29

Zur Analyse von Moderatoreffekten können zusätzlich zur Anwendung einer multiplen linearen Regression auch grafische Darstellungen verwendet werden. Eine einfache Methode dafür ist die Darstellung von bedingten Regressionsgeraden. In den folgenden Darstellungen wurde dafür ein Median-Split der Werte des Moderators verwendet (blau: Moderator < Median; grün: Moderator > Median). Welche Abbildungen geben einen deutlichen Hinweis auf das Vorliegen eines Moderatoreffekts?

3 8 MC 1.PNG
3 8 MC 3.PNG
3 8 MC 4.PNG
3 8 MC 2.PNG

30

Vor der Analyse eines Moderatoreffektes mithilfe einer multiplen linearen Regression empfehlen beispielsweise Cohen et al. (2003) die Zentrierung aller metrischen Prädiktorvariablen. Warum?

Verminderung von Interpretationsproblemen
Reduktion der Wahrscheinlichkeit der Signifikanz des Interaktionsterms
Erhöhung der Rechengeschwindigkeit
Erhöhung der Wahrscheinlichkeit der Signifikanz des Interaktionsterms