Aufgaben - Multiple lineare Regression: Unterschied zwischen den Versionen

Aus eLearning - Methoden der Psychologie - TU Dresden
Zur Navigation springen Zur Suche springen
Keine Bearbeitungszusammenfassung
Keine Bearbeitungszusammenfassung
 
Zeile 8: Zeile 8:
<quiz shuffleanswers=true>
<quiz shuffleanswers=true>


{1. Welche der folgenden Definitionen kann zur Beschreibung einer multiplen linearen Regression verwendet werden?
{Welche der folgenden Definitionen kann zur Beschreibung einer multiplen linearen Regression verwendet werden?
|type="[]"}
|type="[]"}
+ Die multiple lineare Regression ist ein statistisches Verfahren, mit dem versucht wird, eine beobachtete abhängige metrische Variable durch mehrere unabhängige Variablen zu erklären.
+ Die multiple lineare Regression ist ein statistisches Verfahren, mit dem versucht wird, eine beobachtete abhängige metrische Variable durch mehrere unabhängige Variablen zu erklären.
Zeile 15: Zeile 15:
- Die multiple lineare Regression ist ein statistisches Verfahren, mit dem versucht wird, mehrere beobachtete abhängige ordinale oder kategoriale Variablen durch mehrere unabhängige Variablen zu erklären.
- Die multiple lineare Regression ist ein statistisches Verfahren, mit dem versucht wird, mehrere beobachtete abhängige ordinale oder kategoriale Variablen durch mehrere unabhängige Variablen zu erklären.


{2. Mithilfe welches allgemeinen Schätzprinzips können die Regressionskoeffizienten im Rahmen einer multiplen linearen Regression bestimmt werden?
{Mithilfe welches allgemeinen Schätzprinzips können die Regressionskoeffizienten im Rahmen einer multiplen linearen Regression bestimmt werden?
|type="[]"}
|type="[]"}
- Methode der größten Quadrate
- Methode der größten Quadrate
Zeile 22: Zeile 22:
- Methode der multiplen linearen Quadrate
- Methode der multiplen linearen Quadrate


{3. Welche Voraussetzungen sollten für die Durchführung einer multiplen linearen Regressionsanalyse erfüllt sein?
{Welche Voraussetzungen sollten für die Durchführung einer multiplen linearen Regressionsanalyse erfüllt sein?
|type="[]"}
|type="[]"}
+ Festlegung von Prädiktoren und Kriterium
+ Festlegung von Prädiktoren und Kriterium
Zeile 30: Zeile 30:
+ Homoskedastizität
+ Homoskedastizität


{4. Was bedeutet Homoskedastizität?
{Was bedeutet Homoskedastizität?
|type="[]"}
|type="[]"}
- Mittelwerte der Modellfehler sind normalverteilt
- Mittelwerte der Modellfehler sind normalverteilt
Zeile 37: Zeile 37:
- Varianzen der Modellfehler sind in Abhängigkeit der konkreten Werten der Prädiktoren verschieden
- Varianzen der Modellfehler sind in Abhängigkeit der konkreten Werten der Prädiktoren verschieden


{5. Die folgenden Abbildungen stellen eine grafische Gegenüberstellung der z-standardisierten Residuen und der z-standardisierten Schätzungen für die Kriteriumsvariablen einer multiplen linearen Regression dar. Welche der Abbildungen liefern einen Hinweis auf Heteroskedastizität?
{Die folgenden Abbildungen stellen eine grafische Gegenüberstellung der z-standardisierten Residuen und der z-standardisierten Schätzungen für die Kriteriumsvariablen einer multiplen linearen Regression dar. Welche der Abbildungen liefern einen Hinweis auf Heteroskedastizität?
|type="[]"}
|type="[]"}
+ [[Datei:3_3_MC_1.PNG|400px]]
+ [[Datei:3_3_MC_1.PNG|400px]]
Zeile 44: Zeile 44:
+ [[Datei:3_3_MC_4.PNG|400px]]
+ [[Datei:3_3_MC_4.PNG|400px]]


{1. Was versteht man unter dem Begriff der „Multikollinearität“?
{Was versteht man unter dem Begriff der „Multikollinearität“?
|type="[]"}
|type="[]"}
+ Multikollinearität ist ein Problem der Regressionsanalyse und liegt vor, wenn zwei oder mehr der Prädiktoren stark miteinander korrelieren.
+ Multikollinearität ist ein Problem der Regressionsanalyse und liegt vor, wenn zwei oder mehr der Prädiktoren stark miteinander korrelieren.
Zeile 51: Zeile 51:
- Multikollinearität ist ein Problem der Regressionsanalyse und liegt vor, wenn keine oder nur schwache Korrelationen zwischen den abhängigen Variablen bestehen.
- Multikollinearität ist ein Problem der Regressionsanalyse und liegt vor, wenn keine oder nur schwache Korrelationen zwischen den abhängigen Variablen bestehen.


{2. Welche der folgenden Begriffe stellen Folgen des Vorliegens von Multikollinearität dar?
{Welche der folgenden Begriffe stellen Folgen des Vorliegens von Multikollinearität dar?
|type="[]"}
|type="[]"}
- Introjektion
- Introjektion
Zeile 58: Zeile 58:
+ Suppressionseffekte
+ Suppressionseffekte


{3. Welche Folgen können durch das Vorhandensein von Multikollinearität bei der Durchführung einer multiplen linearen Regression auftreten?
{Welche Folgen können durch das Vorhandensein von Multikollinearität bei der Durchführung einer multiplen linearen Regression auftreten?
|type="[]"}
|type="[]"}
+ Erhöhung der Standardfehler der Schätzungen der Regressionskoeffizienten
+ Erhöhung der Standardfehler der Schätzungen der Regressionskoeffizienten
Zeile 65: Zeile 65:
- Eindeutigkeit der Modellinterpretation
- Eindeutigkeit der Modellinterpretation


{4. Welche der folgenden Beobachtungen können Warnzeichen für das Vorliegen von Multikollinearität darstellen?
{Welche der folgenden Beobachtungen können Warnzeichen für das Vorliegen von Multikollinearität darstellen?
|type="[]"}
|type="[]"}
+ Nach der Aufnahme eines weiteren Prädiktors in ein Regressionsmodell kommt es zu einer starken Veränderung der Regressionskoeffizienten.
+ Nach der Aufnahme eines weiteren Prädiktors in ein Regressionsmodell kommt es zu einer starken Veränderung der Regressionskoeffizienten.
Zeile 72: Zeile 72:
- Der VIF (Varianzinflationsfaktor) des Regressionsmodells ist gering und der Wert der Toleranz des Regressionsmodells ist sehr hoch.
- Der VIF (Varianzinflationsfaktor) des Regressionsmodells ist gering und der Wert der Toleranz des Regressionsmodells ist sehr hoch.


{5. Welche Beziehungen sind Hinweise für Redundanz eines Prädiktors?
{Welche Beziehungen sind Hinweise für Redundanz eines Prädiktors?
|type="[]"}
|type="[]"}
- Prädiktor korreliert hoch und signifikant mit dem Kriterium und mit anderen Prädiktoren und hat einen signifikanten Regressionskoeffizienten in der multiplen Regressionsanalyse
- Prädiktor korreliert hoch und signifikant mit dem Kriterium und mit anderen Prädiktoren und hat einen signifikanten Regressionskoeffizienten in der multiplen Regressionsanalyse
Zeile 79: Zeile 79:
- Prädiktor korreliert hoch und signifikant mit anderen Prädiktoren, nicht aber mit dem Kriterium, und hat einen signifikanten Regressionskoeffizienten in der multiplen Regressionsanalyse
- Prädiktor korreliert hoch und signifikant mit anderen Prädiktoren, nicht aber mit dem Kriterium, und hat einen signifikanten Regressionskoeffizienten in der multiplen Regressionsanalyse


{1. Welche der folgenden Ziele werden von einem Merkmalselektionsverfahrens im Rahmen einer multiplen linearen Regression verfolgt?
{Welche der folgenden Ziele werden von einem Merkmalselektionsverfahrens im Rahmen einer multiplen linearen Regression verfolgt?
|type="[]"}
|type="[]"}
+ Identifikation von möglichst wenigen Prädiktoren, welche eine gute Vorhersage der Kriteriumsvariable ermöglichen
+ Identifikation von möglichst wenigen Prädiktoren, welche eine gute Vorhersage der Kriteriumsvariable ermöglichen
Zeile 86: Zeile 86:
+ Minimierung des erforderlichen ökonomischen, inhaltlichen und statistischen Aufwands
+ Minimierung des erforderlichen ökonomischen, inhaltlichen und statistischen Aufwands


{2. Das Grundprinzip von Merkmalsselektionsverfahren im Rahmen einer multiplen linearen Regression besteht darin, für einzelne Prädiktorvariablen zu beurteilen, inwieweit sich durch ihre Hinzunahme zw. Entfernung aus dem Merkmalssatz das multiple Bestimmtheitsmaß signifikant verändert. Welcher Test wird zur Prüfung der Signifikanz dieser Veränderung verwendet?
{Das Grundprinzip von Merkmalsselektionsverfahren im Rahmen einer multiplen linearen Regression besteht darin, für einzelne Prädiktorvariablen zu beurteilen, inwieweit sich durch ihre Hinzunahme zw. Entfernung aus dem Merkmalssatz das multiple Bestimmtheitsmaß signifikant verändert. Welcher Test wird zur Prüfung der Signifikanz dieser Veränderung verwendet?
|type="[]"}
|type="[]"}
- t-Test
- t-Test
Zeile 93: Zeile 93:
- Chi-Quadrat Test
- Chi-Quadrat Test


{3. Welche Arten von Merkmalssektionsverfahren werden üblicherweise im Rahmen einer multiplen linearen Regression angewandt?
{Welche Arten von Merkmalssektionsverfahren werden üblicherweise im Rahmen einer multiplen linearen Regression angewandt?
|type="[]"}
|type="[]"}
+ Verfahren der schrittweisen Merkmalsentfernung bzw. Merkmalsaufnahme („schrittweises Verfahren“)
+ Verfahren der schrittweisen Merkmalsentfernung bzw. Merkmalsaufnahme („schrittweises Verfahren“)
Zeile 100: Zeile 100:
- Verfahren der sofortigen Merkmalsaufnahme („Absolutverfahren“)
- Verfahren der sofortigen Merkmalsaufnahme („Absolutverfahren“)


{4. Welche der folgenden Aussagen über Merkmalsselektionsverfahren im Rahmen einer multiplen linearen Regression sind wahr?
{Welche der folgenden Aussagen über Merkmalsselektionsverfahren im Rahmen einer multiplen linearen Regression sind wahr?
|type="[]"}
|type="[]"}
- Jedes Merkmalsselektionsverfahren (Vorwärtsverfahren, Rückwärtsverfahren, …) führt dazu, dass im Regressionsmodell nach Abschluss des Verfahrens die gleichen Prädiktoren enthalten sind.  
- Jedes Merkmalsselektionsverfahren (Vorwärtsverfahren, Rückwärtsverfahren, …) führt dazu, dass im Regressionsmodell nach Abschluss des Verfahrens die gleichen Prädiktoren enthalten sind.  
Zeile 107: Zeile 107:
+ Das schrittweise Verfahren kombiniert das Rückwärts- und das Vorwärtsverfahren.  
+ Das schrittweise Verfahren kombiniert das Rückwärts- und das Vorwärtsverfahren.  


{5. Die Kriteriumsvariable Y soll durch die Prädiktoren A, B, C, D und E vorhergesagt werden. Die Durchführung eines Verfahrens der schrittweisen Merkmalsaufnahme (Vorwärtsverfahren) führt zur Aufnahme der Prädiktoren A und C ins Regressionsmodell. Das multiple Bestimmtheitsmaß beträgt 0.68. Basierend auf beschriebenen Ausgangsdatensatz wird außerdem ein Verfahren der schrittweisen Merkmalsentfernung (Rückwärtsverfahren) durchgeführt. Welche der folgenden Ergebnisse könnten durch dieses Verfahren ermittelt werden?
{Die Kriteriumsvariable Y soll durch die Prädiktoren A, B, C, D und E vorhergesagt werden. Die Durchführung eines Verfahrens der schrittweisen Merkmalsaufnahme (Vorwärtsverfahren) führt zur Aufnahme der Prädiktoren A und C ins Regressionsmodell. Das multiple Bestimmtheitsmaß beträgt 0.68. Basierend auf beschriebenen Ausgangsdatensatz wird außerdem ein Verfahren der schrittweisen Merkmalsentfernung (Rückwärtsverfahren) durchgeführt. Welche der folgenden Ergebnisse könnten durch dieses Verfahren ermittelt werden?
|type="[]"}
|type="[]"}
+ Aufnahme der Prädiktoren A und C ins Modell ; R² = 0.68
+ Aufnahme der Prädiktoren A und C ins Modell ; R² = 0.68
Zeile 114: Zeile 114:
- Aufnahme der Prädiktoren A und C ins Modell ; R² = 0.72
- Aufnahme der Prädiktoren A und C ins Modell ; R² = 0.72


{1. Welche(s) Ziel(e) verfolgt eine hierarchische Regression?
{Welche(s) Ziel(e) verfolgt eine hierarchische Regression?
|type="[]"}
|type="[]"}
- Untersuchung des Erklärungsbeitrages von Zeitreihen
- Untersuchung des Erklärungsbeitrages von Zeitreihen
Zeile 121: Zeile 121:
+ Untersuchung des Erklärungsbeitrages inhaltlich strukturierter Merkmalsmengen
+ Untersuchung des Erklärungsbeitrages inhaltlich strukturierter Merkmalsmengen


{2. Was dient als Orientierung für die Auswahl der Reihenfolge der Aufnahme von Merkmalsmengen im Rahmen einer hierarchischen Regression?
{Was dient als Orientierung für die Auswahl der Reihenfolge der Aufnahme von Merkmalsmengen im Rahmen einer hierarchischen Regression?
|type="[]"}
|type="[]"}
- Anzahl der Prädiktoren in den Merkmalsmengen
- Anzahl der Prädiktoren in den Merkmalsmengen
Zeile 128: Zeile 128:
- Summe der t-Werte der Prädiktoren der Merkmalsmenge
- Summe der t-Werte der Prädiktoren der Merkmalsmenge


{3. Welche der folgenden Aussage(n) über eine hierarchische Regression sind zutreffend?
{Welche der folgenden Aussage(n) über eine hierarchische Regression sind zutreffend?
|type="[]"}
|type="[]"}
+ Die Reihenfolge der Aufnahme von Merkmalsmengen ist besonders dann wichtig, wenn die Merkmalsmengen stark korrelieren.  
+ Die Reihenfolge der Aufnahme von Merkmalsmengen ist besonders dann wichtig, wenn die Merkmalsmengen stark korrelieren.  
Zeile 135: Zeile 135:
- Die Bedeutsamkeit der Reihenfolge der Aufnahme von Merkmalsmengen ist unabhängig von Multikollinearität im Datensatz.
- Die Bedeutsamkeit der Reihenfolge der Aufnahme von Merkmalsmengen ist unabhängig von Multikollinearität im Datensatz.


{4. Welche der folgenden Aussage(n) über das multiple Bestimmtheitsmaß R² einer hierarchischen Regression sind wahr?
{Welche der folgenden Aussage(n) über das multiple Bestimmtheitsmaß R² einer hierarchischen Regression sind wahr?
|type="[]"}
|type="[]"}
+ Ob eine Merkmalsmenge zu einer signifikanten Zunahme an Bestimmtheitsmaß führt, kann davon abhängen, in welchem Schritt die betreffende Merkmalsmenge aufgenommen wird.
+ Ob eine Merkmalsmenge zu einer signifikanten Zunahme an Bestimmtheitsmaß führt, kann davon abhängen, in welchem Schritt die betreffende Merkmalsmenge aufgenommen wird.
Zeile 142: Zeile 142:
+ Das multiple Bestimmtheitsmaß R² nimmt für die Aufnahme aller verfügbaren Merkmalsmengen ins Regressionsmodell den maximal möglichen Wert an.  
+ Das multiple Bestimmtheitsmaß R² nimmt für die Aufnahme aller verfügbaren Merkmalsmengen ins Regressionsmodell den maximal möglichen Wert an.  


{5. Die Kriteriumsvariable Y soll durch die Merkmalsmengen A (Prädiktor 1 und 3), B (Prädiktor 2 und 4) und C (Prädiktor 5, 6 und 7) vorhergesagt werden. Es wird eine hierarchische Regression angewandt. Zunächst wird die Merkmalsmenge A ins Modell einbezogen. Das ermittelte multiple Bestimmtheitsmaß R² beträgt 0.65. Im Anschluss wird die Merkmalsmenge C ins Modell ins Regressionsmodell aufgenommen. Dies führt zu einer Zunahme des multiplen Bestimmtheitsmaßes R² um 0.30.  
{Die Kriteriumsvariable Y soll durch die Merkmalsmengen A (Prädiktor 1 und 3), B (Prädiktor 2 und 4) und C (Prädiktor 5, 6 und 7) vorhergesagt werden. Es wird eine hierarchische Regression angewandt. Zunächst wird die Merkmalsmenge A ins Modell einbezogen. Das ermittelte multiple Bestimmtheitsmaß R² beträgt 0.65. Im Anschluss wird die Merkmalsmenge C ins Modell ins Regressionsmodell aufgenommen. Dies führt zu einer Zunahme des multiplen Bestimmtheitsmaßes R² um 0.30.  
In einer zweiten Analyse basierend auf dem gleichen Datensatz wird eine andere Reihenfolge der Aufnahme der Merkmalsmengen gewählt. Welche der folgenden Ergebnisse sind in dieser zweiten Analyse möglich?
In einer zweiten Analyse basierend auf dem gleichen Datensatz wird eine andere Reihenfolge der Aufnahme der Merkmalsmengen gewählt. Welche der folgenden Ergebnisse sind in dieser zweiten Analyse möglich?
|type="[]"}
|type="[]"}
Zeile 150: Zeile 150:
- Aufnahme Merkmalsmenge B → R² = 0.85; anschließend Aufnahme Merkmalsmenge A → Anstieg R² um 0.20
- Aufnahme Merkmalsmenge B → R² = 0.85; anschließend Aufnahme Merkmalsmenge A → Anstieg R² um 0.20


{1. Was versteht man unter einem Standardfehler der Schätzung eines Regressionskoeffizienten, welcher bei der Durchführung einer einfachen oder multiplen linearen Regression berechnet wird?
{Was versteht man unter einem Standardfehler der Schätzung eines Regressionskoeffizienten, welcher bei der Durchführung einer einfachen oder multiplen linearen Regression berechnet wird?
|type="[]"}
|type="[]"}
- Standardfehler stellen die Koeffizienten der Regressionsfunktion, die sich als Schätzungen nach der Methode der kleinsten Quadrate ergeben, dar.
- Standardfehler stellen die Koeffizienten der Regressionsfunktion, die sich als Schätzungen nach der Methode der kleinsten Quadrate ergeben, dar.
Zeile 157: Zeile 157:
+ Standardfehler beschreiben wie präzise der Regressionskoeffizient durch das Modell geschätzt werden kann.
+ Standardfehler beschreiben wie präzise der Regressionskoeffizient durch das Modell geschätzt werden kann.


{2. Welche der folgenden Größen werden direkt von der Höhe des Regressionskoeffizienten des Standardfehlers beeinflusst, da der Standardfehler in die Berechnung der entsprechenden Größe einfließt?
{Welche der folgenden Größen werden direkt von der Höhe des Regressionskoeffizienten des Standardfehlers beeinflusst, da der Standardfehler in die Berechnung der entsprechenden Größe einfließt?
|type="[]"}
|type="[]"}
- Regressionskoeffizient
- Regressionskoeffizient
Zeile 164: Zeile 164:
+ p-Wert
+ p-Wert


{3. Wie verändert sich der Wert des Standardfehlers des Regressionskoeffizienten in der einfachen linearen Regression in Abhängigkeit vom Betrag der Korrelation zwischen Prädiktor und Kriterium?
{Wie verändert sich der Wert des Standardfehlers des Regressionskoeffizienten in der einfachen linearen Regression in Abhängigkeit vom Betrag der Korrelation zwischen Prädiktor und Kriterium?
|type="[]"}
|type="[]"}
- Es gibt keinen Zusammenhang zwischen dem Betrag der Korrelation von Prädiktor und Kriterium und der Höhe des Standardfehlers des Regressionskoeffizienten des Prädiktors.
- Es gibt keinen Zusammenhang zwischen dem Betrag der Korrelation von Prädiktor und Kriterium und der Höhe des Standardfehlers des Regressionskoeffizienten des Prädiktors.
Zeile 171: Zeile 171:
- Es besteht ein umgekehrt u-förmiger Zusammenhang zwischen der Höhe des Betrages der Korrelation von Prädiktor und Kriterium und der Höhe des Standardfehlers des Regressionskoeffizienten des Prädiktors.
- Es besteht ein umgekehrt u-förmiger Zusammenhang zwischen der Höhe des Betrages der Korrelation von Prädiktor und Kriterium und der Höhe des Standardfehlers des Regressionskoeffizienten des Prädiktors.


{4. Gegeben sei die folgende Situation: Es wird eine multiple lineare Regression mit zwei Prädiktoren durchgeführt. Welchen Einfluss besitzt die Höhe des Betrages der Korrelation zwischen den beiden Prädiktoren unter diesen Bedingungen?
{Gegeben sei die folgende Situation: Es wird eine multiple lineare Regression mit zwei Prädiktoren durchgeführt. Welchen Einfluss besitzt die Höhe des Betrages der Korrelation zwischen den beiden Prädiktoren unter diesen Bedingungen?
|type="[]"}
|type="[]"}
+ Je höher der Betrag der Korrelation zwischen den Prädiktoren ist, desto größer sind die Standardfehler der Regressionskoeffizienten der Prädiktoren.
+ Je höher der Betrag der Korrelation zwischen den Prädiktoren ist, desto größer sind die Standardfehler der Regressionskoeffizienten der Prädiktoren.
Zeile 178: Zeile 178:
- Je höher der Betrag der Korrelation zwischen den Prädiktoren ist, desto höher sind die Regressionskoeffizienten der Prädiktoren.  
- Je höher der Betrag der Korrelation zwischen den Prädiktoren ist, desto höher sind die Regressionskoeffizienten der Prädiktoren.  


{5. Führt man eine multiple lineare Korrelation mit mehreren untereinander hoch korrelierenden Prädiktoren durch, welche ebenfalls alle hohe Korrelationen mit der Kriteriumsvariablen aufweisen, kann dies dazu führen, dass im Ergebnis der Regression nur ein einzelner dieser Prädiktoren einen signifikant hohen Regressionskoeffizienten erhält. Worauf ist dies zurückzuführen?  
{Führt man eine multiple lineare Korrelation mit mehreren untereinander hoch korrelierenden Prädiktoren durch, welche ebenfalls alle hohe Korrelationen mit der Kriteriumsvariablen aufweisen, kann dies dazu führen, dass im Ergebnis der Regression nur ein einzelner dieser Prädiktoren einen signifikant hohen Regressionskoeffizienten erhält. Worauf ist dies zurückzuführen?  
|type="[]"}
|type="[]"}
- Introjektion
- Introjektion
Zeile 185: Zeile 185:
- Suppression
- Suppression


{1. Was versteht man in der Statistik unter einer Moderatorvariable?  
{Was versteht man in der Statistik unter einer Moderatorvariable?  
|type="[]"}
|type="[]"}
- Eine Moderatorvariable bezeichnet eine Variable A, welche einen Zusammenhang zu einer Variablen B besitzt, welche unabhängig von der Ausprägung weiterer Einflussvariablen konstant ist.
- Eine Moderatorvariable bezeichnet eine Variable A, welche einen Zusammenhang zu einer Variablen B besitzt, welche unabhängig von der Ausprägung weiterer Einflussvariablen konstant ist.
Zeile 192: Zeile 192:
- Eine Moderatorvariable bezeichnet eine Variable C, welche den Einfluss einer Variable A auf eine Variable B vermittelt.
- Eine Moderatorvariable bezeichnet eine Variable C, welche den Einfluss einer Variable A auf eine Variable B vermittelt.


{2. Im Rahmen einer multiplen linearen Regression kann die Analyse von Moderatoreffekten erfolgen.  
{Im Rahmen einer multiplen linearen Regression kann die Analyse von Moderatoreffekten erfolgen.  
Angenommen wir möchten durch unsere Untersuchung das Kriterium Leistungsmotivation durch die Prädiktoren Intelligenz und Gewissenhaftigkeit vorhersagen und nehmen aufgrund inhaltlicher Überlegungen an, dass Gewissenhaftigkeit einen Moderator des Zusammenhangs zwischen Intelligenz und Leistungsmotivation darstellt. Wie kann eine solche Analyse erfolgen?
Angenommen wir möchten durch unsere Untersuchung das Kriterium Leistungsmotivation durch die Prädiktoren Intelligenz und Gewissenhaftigkeit vorhersagen und nehmen aufgrund inhaltlicher Überlegungen an, dass Gewissenhaftigkeit einen Moderator des Zusammenhangs zwischen Intelligenz und Leistungsmotivation darstellt. Wie kann eine solche Analyse erfolgen?
|type="[]"}
|type="[]"}
Zeile 200: Zeile 200:
- Durchführung einer multiplen linearen Regression zur Vorhersage der Variable Gewissenhaftigkeit durch Intelligenz und Leistungsmotivation, ein hohes Bestimmtheitsmaß > 90 % liefert einen starken Hinweis auf das Vorliegen eines Moderatoreffekts
- Durchführung einer multiplen linearen Regression zur Vorhersage der Variable Gewissenhaftigkeit durch Intelligenz und Leistungsmotivation, ein hohes Bestimmtheitsmaß > 90 % liefert einen starken Hinweis auf das Vorliegen eines Moderatoreffekts


{3. Im Folgenden sehen Sie die Ergebnisausgaben verschiedener multipler linearer Regressionen zur Untersuchung von potenziellen Moderatoreffekten von Prädiktor 2 auf die Stärke des Zusammenhangs zwischen Prädiktor 1 und der Kriteriumsvariable. Der Interaktionsterm stellt dabei das Produkt von Prädiktor 1 und 2 dar. Welche Ergebnisausgaben lassen auf einen signifikanten Moderatoreffekt schließen?
{Im Folgenden sehen Sie die Ergebnisausgaben verschiedener multipler linearer Regressionen zur Untersuchung von potenziellen Moderatoreffekten von Prädiktor 2 auf die Stärke des Zusammenhangs zwischen Prädiktor 1 und der Kriteriumsvariable. Der Interaktionsterm stellt dabei das Produkt von Prädiktor 1 und 2 dar. Welche Ergebnisausgaben lassen auf einen signifikanten Moderatoreffekt schließen?
|type="[]"}
|type="[]"}
- [[Datei:3_8_MC_Tab1.PNG|400px]]
- [[Datei:3_8_MC_Tab1.PNG|400px]]
Zeile 207: Zeile 207:
+ [[Datei:3_8_MC_Tab4.PNG|400px]]
+ [[Datei:3_8_MC_Tab4.PNG|400px]]


{4. Zur Analyse von Moderatoreffekten können zusätzlich zur Anwendung einer multiplen linearen Regression auch grafische Darstellungen verwendet werden. Eine einfache Methode dafür ist die Darstellung von bedingten Regressionsgeraden. In den folgenden Darstellungen wurde dafür ein Median-Split der Werte des Moderators verwendet (blau: Moderator < Median; grün: Moderator > Median). Welche Abbildungen geben einen deutlichen Hinweis auf das Vorliegen eines Moderatoreffekts?  
{Zur Analyse von Moderatoreffekten können zusätzlich zur Anwendung einer multiplen linearen Regression auch grafische Darstellungen verwendet werden. Eine einfache Methode dafür ist die Darstellung von bedingten Regressionsgeraden. In den folgenden Darstellungen wurde dafür ein Median-Split der Werte des Moderators verwendet (blau: Moderator < Median; grün: Moderator > Median). Welche Abbildungen geben einen deutlichen Hinweis auf das Vorliegen eines Moderatoreffekts?  
|type="[]"}
|type="[]"}
- [[Datei:3_8_MC_1.PNG|400px]]
- [[Datei:3_8_MC_1.PNG|400px]]
Zeile 214: Zeile 214:
- [[Datei:3_8_MC_4.PNG|400px]]
- [[Datei:3_8_MC_4.PNG|400px]]


{5. Vor der Analyse eines Moderatoreffektes mithilfe einer multiplen linearen Regression empfehlen beispielsweise Cohen et al. (2003) die Zentrierung aller metrischen Prädiktorvariablen. Warum?
{Vor der Analyse eines Moderatoreffektes mithilfe einer multiplen linearen Regression empfehlen beispielsweise Cohen et al. (2003) die Zentrierung aller metrischen Prädiktorvariablen. Warum?
|type="[]"}
|type="[]"}
- Erhöhung der Rechengeschwindigkeit
- Erhöhung der Rechengeschwindigkeit

Aktuelle Version vom 6. März 2020, 01:16 Uhr

Der folgenden Bereich enthält Fragen zur multiplen linearen Regression. Alle Fragen sind Multiple Choice Fragen, d.h. es können immer mehrere Antworten richtig sein. Klicken Sie zur Beantwortung einer Frage die korrekten Antwortmöglichkeiten an. Um Ihre Ergebnisse auszuwerten, wählen Sie bitte den Button "Speichern" am unteren Ende der Seite.

Für jede vollständig richtig beantwortete Frage erhalten Sie einen Punkt. Für falsche beantwortete Fragen werden Ihnen keine Punkte abgezogen. Sie können diese Einstellung jedoch beliebig verändern. Ihre Gesamtpunktzahl finden Sie am unteren Seitenende.


  

1 Welche der folgenden Definitionen kann zur Beschreibung einer multiplen linearen Regression verwendet werden?

Die multiple lineare Regression ist ein statistisches Verfahren, mit dem versucht wird, eine beobachtete abhängige ordinale oder kategoriale Variable durch mehrere unabhängige Variablen zu erklären.
Die multiple lineare Regression ist ein statistisches Verfahren, mit dem versucht wird, mehrere beobachtete abhängige ordinale oder kategoriale Variablen durch mehrere unabhängige Variablen zu erklären.
Die multiple lineare Regression ist ein statistisches Verfahren, mit dem versucht wird, eine beobachtete abhängige metrische Variable durch mehrere unabhängige Variablen zu erklären.
Die multiple lineare Regression ist ein statistisches Verfahren, mit dem versucht wird, mehrere abhängige metrische Variablen durch eine oder mehrere unabhängige Variablen zu erklären.

2 Mithilfe welches allgemeinen Schätzprinzips können die Regressionskoeffizienten im Rahmen einer multiplen linearen Regression bestimmt werden?

Methode der größten Quadrate
Methode der multiplen Quadrate
Methode der kleinsten Quadrate
Methode der multiplen linearen Quadrate

3 Welche Voraussetzungen sollten für die Durchführung einer multiplen linearen Regressionsanalyse erfüllt sein?

Gültigkeit des linearen Modells
Festlegung von Prädiktoren und Kriterium
Normalverteilung der Modellfehler
Homoskedastizität
Statistische Abhängigkeit der Modellfehler

4 Was bedeutet Homoskedastizität?

Varianzen der Modellfehler sind in Abhängigkeit der konkreten Werten der Prädiktoren verschieden
Varianzen der Modellfehler sind unabhängig von den konkreten Werten der Prädiktoren gleich
Mittelwerte der Modellfehler sind nicht normalverteilt
Mittelwerte der Modellfehler sind normalverteilt

5 Die folgenden Abbildungen stellen eine grafische Gegenüberstellung der z-standardisierten Residuen und der z-standardisierten Schätzungen für die Kriteriumsvariablen einer multiplen linearen Regression dar. Welche der Abbildungen liefern einen Hinweis auf Heteroskedastizität?

3 3 MC 1.PNG
3 3 MC 4.PNG
3 3 MC 2.PNG
3 3 MC 3.PNG

6 Was versteht man unter dem Begriff der „Multikollinearität“?

Multikollinearität ist ein Problem der Regressionsanalyse und liegt vor, wenn keine oder nur schwache Korrelationen zwischen den Prädiktoren bestehen.
Multikollinearität ist ein Problem der Regressionsanalyse und liegt vor, wenn zwei oder mehr der abhängigen Variablen stark miteinander korrelieren
Multikollinearität ist ein Problem der Regressionsanalyse und liegt vor, wenn keine oder nur schwache Korrelationen zwischen den abhängigen Variablen bestehen.
Multikollinearität ist ein Problem der Regressionsanalyse und liegt vor, wenn zwei oder mehr der Prädiktoren stark miteinander korrelieren.

7 Welche der folgenden Begriffe stellen Folgen des Vorliegens von Multikollinearität dar?

Redundanz
Konversion
Suppressionseffekte
Introjektion

8 Welche Folgen können durch das Vorhandensein von Multikollinearität bei der Durchführung einer multiplen linearen Regression auftreten?

Erhöhung der Standardfehler der Schätzungen der Regressionskoeffizienten
Eindeutigkeit der Modellinterpretation
Instabilität des Verfahrens zur Schätzung der Regressionskoeffizienten
Ungenauigkeit von Aussagen zur Schätzung von Regressionskoeffizienten

9 Welche der folgenden Beobachtungen können Warnzeichen für das Vorliegen von Multikollinearität darstellen?

Nach der Aufnahme eines weiteren Prädiktors in ein Regressionsmodell kommt es zu einer starken Veränderung der Regressionskoeffizienten.
Die Prädiktoren korrelieren sehr stark miteinander.
Ein Prädiktor, der sehr stark mit der Kriteriumsvariablen korreliert, besitzt im Ergebnis der Regressionsanalyse keinen signifikanten Regressionskoeffizienten.
Der VIF (Varianzinflationsfaktor) des Regressionsmodells ist gering und der Wert der Toleranz des Regressionsmodells ist sehr hoch.

10 Welche Beziehungen sind Hinweise für Redundanz eines Prädiktors?

Prädiktor korreliert hoch und signifikant mit dem Kriterium, aber nicht mit den anderen Prädiktoren und hat einen signifikanten Regressionskoeffizienten in der multiplen Regressionsanalyse
Prädiktor korreliert hoch und signifikant mit anderen Prädiktoren, nicht aber mit dem Kriterium, und hat einen signifikanten Regressionskoeffizienten in der multiplen Regressionsanalyse
Prädiktor korreliert hoch und signifikant mit dem Kriterium und mit anderen Prädiktoren und hat einen signifikanten Regressionskoeffizienten in der multiplen Regressionsanalyse
Prädiktor korreliert hoch und signifikant mit dem Kriterium und mit anderen Prädiktoren und hat keinen signifikanten Regressionskoeffizienten in der multiplen Regressionsanalyse

11 Welche der folgenden Ziele werden von einem Merkmalselektionsverfahrens im Rahmen einer multiplen linearen Regression verfolgt?

Erhöhung der Fehlervarianz
Identifikation von möglichst wenigen Prädiktoren, welche eine gute Vorhersage der Kriteriumsvariable ermöglichen
Minimierung des erforderlichen ökonomischen, inhaltlichen und statistischen Aufwands
klare inhaltliche Interpretation des Regressionsmodells

12 Das Grundprinzip von Merkmalsselektionsverfahren im Rahmen einer multiplen linearen Regression besteht darin, für einzelne Prädiktorvariablen zu beurteilen, inwieweit sich durch ihre Hinzunahme zw. Entfernung aus dem Merkmalssatz das multiple Bestimmtheitsmaß signifikant verändert. Welcher Test wird zur Prüfung der Signifikanz dieser Veränderung verwendet?

F-Test
Chi-Quadrat Test
t-Test
Kolmogorow-Smirnow-Test

13 Welche Arten von Merkmalssektionsverfahren werden üblicherweise im Rahmen einer multiplen linearen Regression angewandt?

Verfahren der sofortigen Merkmalsaufnahme („Absolutverfahren“)
Verfahren der schrittweisen Merkmalsaufnahme („Vorwärtsverfahren“)
Verfahren der schrittweisen Merkmalsentfernung bzw. Merkmalsaufnahme („schrittweises Verfahren“)
Verfahren der schrittweisen Merkmalsentfernung („Rückwärtsverfahren“)

14 Welche der folgenden Aussagen über Merkmalsselektionsverfahren im Rahmen einer multiplen linearen Regression sind wahr?

Jedes Merkmalsselektionsverfahren (Vorwärtsverfahren, Rückwärtsverfahren, …) führt dazu, dass im Regressionsmodell nach Abschluss des Verfahrens die gleichen Prädiktoren enthalten sind.
Das multiple Bestimmtheitsmaß R² des mithilfe eines Merkmalsselektionsverfahrens ermittelten Regressionsmodells kann sich in Abhängigkeit des ausgewählten Verfahrens unterscheiden.
Die Anwendung eines Vorwärtsverfahrens führt in jedem Fall zu einem größeren multiplen Bestimmtheitsmaß als die Anwendung eines Rückwärtsverfahrens.
Das schrittweise Verfahren kombiniert das Rückwärts- und das Vorwärtsverfahren.

15 Die Kriteriumsvariable Y soll durch die Prädiktoren A, B, C, D und E vorhergesagt werden. Die Durchführung eines Verfahrens der schrittweisen Merkmalsaufnahme (Vorwärtsverfahren) führt zur Aufnahme der Prädiktoren A und C ins Regressionsmodell. Das multiple Bestimmtheitsmaß beträgt 0.68. Basierend auf beschriebenen Ausgangsdatensatz wird außerdem ein Verfahren der schrittweisen Merkmalsentfernung (Rückwärtsverfahren) durchgeführt. Welche der folgenden Ergebnisse könnten durch dieses Verfahren ermittelt werden?

Aufnahme der Prädiktoren B und D ins Modell ; R² = 0.69
Aufnahme der Prädiktoren B und C ins Modell ; R² = 1.08
Aufnahme der Prädiktoren A und C ins Modell ; R² = 0.68
Aufnahme der Prädiktoren A und C ins Modell ; R² = 0.72

16 Welche(s) Ziel(e) verfolgt eine hierarchische Regression?

Untersuchung des Erklärungsbeitrages aus dem Datensatz extrahierter Hauptkomponenten
Untersuchung des Erklärungsbeitrages inhaltlich strukturierter Merkmalsmengen
Untersuchung des Erklärungsbeitrages der Regressionskonstante
Untersuchung des Erklärungsbeitrages von Zeitreihen

17 Was dient als Orientierung für die Auswahl der Reihenfolge der Aufnahme von Merkmalsmengen im Rahmen einer hierarchischen Regression?

Summe der β-Gewichte der Prädiktoren der Merkmalsmenge
Summe der t-Werte der Prädiktoren der Merkmalsmenge
inhaltliche Gesichtspunkte
Anzahl der Prädiktoren in den Merkmalsmengen

18 Welche der folgenden Aussage(n) über eine hierarchische Regression sind zutreffend?

Korrelieren die Merkmalsmengen kaum untereinander, dann resultieren abhängig von der Reihenfolge der Aufnahme der Merkmalsmengen oftmals sehr unterschiedliche Ergebnisse.
Die Reihenfolge der Aufnahme von Merkmalsmengen ist besonders dann wichtig, wenn die Merkmalsmengen stark korrelieren.
Resultieren in Abhängigkeit der Reihenfolge der Aufnahme der Merkmalsmengen unterschiedliche Regressionsmodelle, liefert dies einen Hinweis auf Multikollinearität.
Die Bedeutsamkeit der Reihenfolge der Aufnahme von Merkmalsmengen ist unabhängig von Multikollinearität im Datensatz.

19 Welche der folgenden Aussage(n) über das multiple Bestimmtheitsmaß R² einer hierarchischen Regression sind wahr?

Das multiple Bestimmtheitsmaß R² nimmt für die Aufnahme aller verfügbaren Merkmalsmengen ins Regressionsmodell den maximal möglichen Wert an.
Das multiple Bestimmtheitsmaß R² nimmt ab, je mehr Merkmalsmengen ins Regressionsmodell aufgenommen werden.
Ob eine Merkmalsmenge zu einer signifikanten Zunahme an Bestimmtheitsmaß führt, kann davon abhängen, in welchem Schritt die betreffende Merkmalsmenge aufgenommen wird.
Die Aufnahme von 50 % aller Merkmalsmengen führt in jedem Fall zu einem multiplen Bestimmtheitsmaß R² größer als 25 %.

20 Die Kriteriumsvariable Y soll durch die Merkmalsmengen A (Prädiktor 1 und 3), B (Prädiktor 2 und 4) und C (Prädiktor 5, 6 und 7) vorhergesagt werden. Es wird eine hierarchische Regression angewandt. Zunächst wird die Merkmalsmenge A ins Modell einbezogen. Das ermittelte multiple Bestimmtheitsmaß R² beträgt 0.65. Im Anschluss wird die Merkmalsmenge C ins Modell ins Regressionsmodell aufgenommen. Dies führt zu einer Zunahme des multiplen Bestimmtheitsmaßes R² um 0.30. In einer zweiten Analyse basierend auf dem gleichen Datensatz wird eine andere Reihenfolge der Aufnahme der Merkmalsmengen gewählt. Welche der folgenden Ergebnisse sind in dieser zweiten Analyse möglich?

Aufnahme Merkmalsmenge C → R² = 0.75; anschließend Aufnahme Merkmalsmenge A → Anstieg R² um 0.15
Aufnahme Merkmalsmenge B → R² = 0.85; anschließend Aufnahme Merkmalsmenge A → Anstieg R² um 0.20
Aufnahme Merkmalsmenge B → R² = 0.40; anschließend Aufnahme Merkmalsmenge C → Anstieg R² um 0.40
Aufnahme Merkmalsmenge C → R² = 0.60; anschließend Aufnahme Merkmalsmenge A → Anstieg R² um 0.35

21 Was versteht man unter einem Standardfehler der Schätzung eines Regressionskoeffizienten, welcher bei der Durchführung einer einfachen oder multiplen linearen Regression berechnet wird?

Standardfehler beschreiben wie präzise der Regressionskoeffizient durch das Modell geschätzt werden kann.
Standardfehler stellen die Koeffizienten der Regressionsfunktion, die sich als Schätzungen nach der Methode der kleinsten Quadrate ergeben, dar.
Standardfehler der Regressionskoeffizienten beschreiben die Regressionskoeffizienten, welche entstehen, wenn vor der Regression alle beteiligten Prädiktoren und die Kriteriumsvariable z-standardisiert werden.
Standardfehler stellen die Abweichungen der Schätzwerte von den gemessenen Werten, also die Abweichungen der Messwerte von der Regressionsgerade, dar.

22 Welche der folgenden Größen werden direkt von der Höhe des Regressionskoeffizienten des Standardfehlers beeinflusst, da der Standardfehler in die Berechnung der entsprechenden Größe einfließt?

t-Wert
Regressionskoeffizient
p-Wert
Bestimmtheitsmaß

23 Wie verändert sich der Wert des Standardfehlers des Regressionskoeffizienten in der einfachen linearen Regression in Abhängigkeit vom Betrag der Korrelation zwischen Prädiktor und Kriterium?

Je höher der Betrag der Korrelation zwischen Prädiktor und Kriterium, desto geringer ist der Wert des Standardfehlers des Regressionskoeffizienten des Prädiktors.
Es besteht ein umgekehrt u-förmiger Zusammenhang zwischen der Höhe des Betrages der Korrelation von Prädiktor und Kriterium und der Höhe des Standardfehlers des Regressionskoeffizienten des Prädiktors.
Es gibt keinen Zusammenhang zwischen dem Betrag der Korrelation von Prädiktor und Kriterium und der Höhe des Standardfehlers des Regressionskoeffizienten des Prädiktors.
Je höher der Betrag der Korrelation zwischen Prädiktor und Kriterium, desto höher ist der Standardfehler des Regressionskoeffizienten des Prädiktors.

24 Gegeben sei die folgende Situation: Es wird eine multiple lineare Regression mit zwei Prädiktoren durchgeführt. Welchen Einfluss besitzt die Höhe des Betrages der Korrelation zwischen den beiden Prädiktoren unter diesen Bedingungen?

Je höher der Betrag der Korrelation zwischen den Prädiktoren ist, desto höher ist die Wahrscheinlichkeit, dass nur einer oder keiner der beiden Prädiktoren im Ergebnis der Regressionsanalyse einen signifikanten Regressionskoeffizienten besitzt.
Je höher der Betrag der Korrelation zwischen den Prädiktoren ist, desto kleiner sind die Standardfehler der Regressionskoeffizienten der Prädiktoren.
Je höher der Betrag der Korrelation zwischen den Prädiktoren ist, desto höher sind die Regressionskoeffizienten der Prädiktoren.
Je höher der Betrag der Korrelation zwischen den Prädiktoren ist, desto größer sind die Standardfehler der Regressionskoeffizienten der Prädiktoren.

25 Führt man eine multiple lineare Korrelation mit mehreren untereinander hoch korrelierenden Prädiktoren durch, welche ebenfalls alle hohe Korrelationen mit der Kriteriumsvariablen aufweisen, kann dies dazu führen, dass im Ergebnis der Regression nur ein einzelner dieser Prädiktoren einen signifikant hohen Regressionskoeffizienten erhält. Worauf ist dies zurückzuführen?

Hierarchie
Redundanz
Suppression
Introjektion

26 Was versteht man in der Statistik unter einer Moderatorvariable?

Eine Moderatorvariable bezeichnet eine Variable C, von deren Ausprägung abhängig ist, wie groß der Einfluss einer Variable A auf Variable B ist.
Eine Moderatorvariable bezeichnet eine Variable C, welche den Einfluss einer Variable A auf eine Variable B vermittelt.
Eine Moderatorvariable bezeichnet eine Variable A, welche in Abhängigkeit der Ausprägung einer Variable C durch Variable B beeinflusst wird.
Eine Moderatorvariable bezeichnet eine Variable A, welche einen Zusammenhang zu einer Variablen B besitzt, welche unabhängig von der Ausprägung weiterer Einflussvariablen konstant ist.

27 Im Rahmen einer multiplen linearen Regression kann die Analyse von Moderatoreffekten erfolgen. Angenommen wir möchten durch unsere Untersuchung das Kriterium Leistungsmotivation durch die Prädiktoren Intelligenz und Gewissenhaftigkeit vorhersagen und nehmen aufgrund inhaltlicher Überlegungen an, dass Gewissenhaftigkeit einen Moderator des Zusammenhangs zwischen Intelligenz und Leistungsmotivation darstellt. Wie kann eine solche Analyse erfolgen?

Bildung eines Interaktionsterms als Produkt von Prädiktor Intelligenz und potenzieller Moderatorvariable Gewissenhaftigkeit und Aufnahme dieses Interaktionsterms in die multiple Regression zur Vorhersage der Kriteriumsvariable Leistungsmotivation
Durchführung einer multiplen linearen Regression zur Vorhersage der Variable Gewissenhaftigkeit durch Intelligenz und Leistungsmotivation, ein hohes Bestimmtheitsmaß > 90 % liefert einen starken Hinweis auf das Vorliegen eines Moderatoreffekts
Bildung eines Interaktionsterms als Quotient von Prädiktor Intelligenz und potenzieller Moderatorvariable Gewissenhaftigkeit und Aufnahme dieses Interaktionsterms in die multiple lineare Regression zur Vorhersage der Kriteriumsvariable Leistungsmotivation
Bildung eines Interaktionsterms als Summe von Prädiktor Intelligenz und potenzieller Moderatorvariable Gewissenhaftigkeit und Aufnahme dieses Interaktionsterms in die multiple lineare Regression zur Vorhersage der Kriteriumsvariable Leistungsmotivation

28 Im Folgenden sehen Sie die Ergebnisausgaben verschiedener multipler linearer Regressionen zur Untersuchung von potenziellen Moderatoreffekten von Prädiktor 2 auf die Stärke des Zusammenhangs zwischen Prädiktor 1 und der Kriteriumsvariable. Der Interaktionsterm stellt dabei das Produkt von Prädiktor 1 und 2 dar. Welche Ergebnisausgaben lassen auf einen signifikanten Moderatoreffekt schließen?

3 8 MC Tab1.PNG
3 8 MC Tab4.PNG
3 8 MC Tab2.PNG
3 8 MC Tab3.PNG

29 Zur Analyse von Moderatoreffekten können zusätzlich zur Anwendung einer multiplen linearen Regression auch grafische Darstellungen verwendet werden. Eine einfache Methode dafür ist die Darstellung von bedingten Regressionsgeraden. In den folgenden Darstellungen wurde dafür ein Median-Split der Werte des Moderators verwendet (blau: Moderator < Median; grün: Moderator > Median). Welche Abbildungen geben einen deutlichen Hinweis auf das Vorliegen eines Moderatoreffekts?

3 8 MC 4.PNG
3 8 MC 1.PNG
3 8 MC 3.PNG
3 8 MC 2.PNG

30 Vor der Analyse eines Moderatoreffektes mithilfe einer multiplen linearen Regression empfehlen beispielsweise Cohen et al. (2003) die Zentrierung aller metrischen Prädiktorvariablen. Warum?

Reduktion der Wahrscheinlichkeit der Signifikanz des Interaktionsterms
Verminderung von Interpretationsproblemen
Erhöhung der Wahrscheinlichkeit der Signifikanz des Interaktionsterms
Erhöhung der Rechengeschwindigkeit