Aufgaben - Multiple lineare Regression: Unterschied zwischen den Versionen
Zur Navigation springen
Zur Suche springen
Wehner (Diskussion | Beiträge) Keine Bearbeitungszusammenfassung |
Wehner (Diskussion | Beiträge) Keine Bearbeitungszusammenfassung |
||
Zeile 8: | Zeile 8: | ||
<quiz shuffleanswers=true> | <quiz shuffleanswers=true> | ||
{ | {Welche der folgenden Definitionen kann zur Beschreibung einer multiplen linearen Regression verwendet werden? | ||
|type="[]"} | |type="[]"} | ||
+ Die multiple lineare Regression ist ein statistisches Verfahren, mit dem versucht wird, eine beobachtete abhängige metrische Variable durch mehrere unabhängige Variablen zu erklären. | + Die multiple lineare Regression ist ein statistisches Verfahren, mit dem versucht wird, eine beobachtete abhängige metrische Variable durch mehrere unabhängige Variablen zu erklären. | ||
Zeile 15: | Zeile 15: | ||
- Die multiple lineare Regression ist ein statistisches Verfahren, mit dem versucht wird, mehrere beobachtete abhängige ordinale oder kategoriale Variablen durch mehrere unabhängige Variablen zu erklären. | - Die multiple lineare Regression ist ein statistisches Verfahren, mit dem versucht wird, mehrere beobachtete abhängige ordinale oder kategoriale Variablen durch mehrere unabhängige Variablen zu erklären. | ||
{ | {Mithilfe welches allgemeinen Schätzprinzips können die Regressionskoeffizienten im Rahmen einer multiplen linearen Regression bestimmt werden? | ||
|type="[]"} | |type="[]"} | ||
- Methode der größten Quadrate | - Methode der größten Quadrate | ||
Zeile 22: | Zeile 22: | ||
- Methode der multiplen linearen Quadrate | - Methode der multiplen linearen Quadrate | ||
{ | {Welche Voraussetzungen sollten für die Durchführung einer multiplen linearen Regressionsanalyse erfüllt sein? | ||
|type="[]"} | |type="[]"} | ||
+ Festlegung von Prädiktoren und Kriterium | + Festlegung von Prädiktoren und Kriterium | ||
Zeile 30: | Zeile 30: | ||
+ Homoskedastizität | + Homoskedastizität | ||
{ | {Was bedeutet Homoskedastizität? | ||
|type="[]"} | |type="[]"} | ||
- Mittelwerte der Modellfehler sind normalverteilt | - Mittelwerte der Modellfehler sind normalverteilt | ||
Zeile 37: | Zeile 37: | ||
- Varianzen der Modellfehler sind in Abhängigkeit der konkreten Werten der Prädiktoren verschieden | - Varianzen der Modellfehler sind in Abhängigkeit der konkreten Werten der Prädiktoren verschieden | ||
{ | {Die folgenden Abbildungen stellen eine grafische Gegenüberstellung der z-standardisierten Residuen und der z-standardisierten Schätzungen für die Kriteriumsvariablen einer multiplen linearen Regression dar. Welche der Abbildungen liefern einen Hinweis auf Heteroskedastizität? | ||
|type="[]"} | |type="[]"} | ||
+ [[Datei:3_3_MC_1.PNG|400px]] | + [[Datei:3_3_MC_1.PNG|400px]] | ||
Zeile 44: | Zeile 44: | ||
+ [[Datei:3_3_MC_4.PNG|400px]] | + [[Datei:3_3_MC_4.PNG|400px]] | ||
{ | {Was versteht man unter dem Begriff der „Multikollinearität“? | ||
|type="[]"} | |type="[]"} | ||
+ Multikollinearität ist ein Problem der Regressionsanalyse und liegt vor, wenn zwei oder mehr der Prädiktoren stark miteinander korrelieren. | + Multikollinearität ist ein Problem der Regressionsanalyse und liegt vor, wenn zwei oder mehr der Prädiktoren stark miteinander korrelieren. | ||
Zeile 51: | Zeile 51: | ||
- Multikollinearität ist ein Problem der Regressionsanalyse und liegt vor, wenn keine oder nur schwache Korrelationen zwischen den abhängigen Variablen bestehen. | - Multikollinearität ist ein Problem der Regressionsanalyse und liegt vor, wenn keine oder nur schwache Korrelationen zwischen den abhängigen Variablen bestehen. | ||
{ | {Welche der folgenden Begriffe stellen Folgen des Vorliegens von Multikollinearität dar? | ||
|type="[]"} | |type="[]"} | ||
- Introjektion | - Introjektion | ||
Zeile 58: | Zeile 58: | ||
+ Suppressionseffekte | + Suppressionseffekte | ||
{ | {Welche Folgen können durch das Vorhandensein von Multikollinearität bei der Durchführung einer multiplen linearen Regression auftreten? | ||
|type="[]"} | |type="[]"} | ||
+ Erhöhung der Standardfehler der Schätzungen der Regressionskoeffizienten | + Erhöhung der Standardfehler der Schätzungen der Regressionskoeffizienten | ||
Zeile 65: | Zeile 65: | ||
- Eindeutigkeit der Modellinterpretation | - Eindeutigkeit der Modellinterpretation | ||
{ | {Welche der folgenden Beobachtungen können Warnzeichen für das Vorliegen von Multikollinearität darstellen? | ||
|type="[]"} | |type="[]"} | ||
+ Nach der Aufnahme eines weiteren Prädiktors in ein Regressionsmodell kommt es zu einer starken Veränderung der Regressionskoeffizienten. | + Nach der Aufnahme eines weiteren Prädiktors in ein Regressionsmodell kommt es zu einer starken Veränderung der Regressionskoeffizienten. | ||
Zeile 72: | Zeile 72: | ||
- Der VIF (Varianzinflationsfaktor) des Regressionsmodells ist gering und der Wert der Toleranz des Regressionsmodells ist sehr hoch. | - Der VIF (Varianzinflationsfaktor) des Regressionsmodells ist gering und der Wert der Toleranz des Regressionsmodells ist sehr hoch. | ||
{ | {Welche Beziehungen sind Hinweise für Redundanz eines Prädiktors? | ||
|type="[]"} | |type="[]"} | ||
- Prädiktor korreliert hoch und signifikant mit dem Kriterium und mit anderen Prädiktoren und hat einen signifikanten Regressionskoeffizienten in der multiplen Regressionsanalyse | - Prädiktor korreliert hoch und signifikant mit dem Kriterium und mit anderen Prädiktoren und hat einen signifikanten Regressionskoeffizienten in der multiplen Regressionsanalyse | ||
Zeile 79: | Zeile 79: | ||
- Prädiktor korreliert hoch und signifikant mit anderen Prädiktoren, nicht aber mit dem Kriterium, und hat einen signifikanten Regressionskoeffizienten in der multiplen Regressionsanalyse | - Prädiktor korreliert hoch und signifikant mit anderen Prädiktoren, nicht aber mit dem Kriterium, und hat einen signifikanten Regressionskoeffizienten in der multiplen Regressionsanalyse | ||
{ | {Welche der folgenden Ziele werden von einem Merkmalselektionsverfahrens im Rahmen einer multiplen linearen Regression verfolgt? | ||
|type="[]"} | |type="[]"} | ||
+ Identifikation von möglichst wenigen Prädiktoren, welche eine gute Vorhersage der Kriteriumsvariable ermöglichen | + Identifikation von möglichst wenigen Prädiktoren, welche eine gute Vorhersage der Kriteriumsvariable ermöglichen | ||
Zeile 86: | Zeile 86: | ||
+ Minimierung des erforderlichen ökonomischen, inhaltlichen und statistischen Aufwands | + Minimierung des erforderlichen ökonomischen, inhaltlichen und statistischen Aufwands | ||
{ | {Das Grundprinzip von Merkmalsselektionsverfahren im Rahmen einer multiplen linearen Regression besteht darin, für einzelne Prädiktorvariablen zu beurteilen, inwieweit sich durch ihre Hinzunahme zw. Entfernung aus dem Merkmalssatz das multiple Bestimmtheitsmaß signifikant verändert. Welcher Test wird zur Prüfung der Signifikanz dieser Veränderung verwendet? | ||
|type="[]"} | |type="[]"} | ||
- t-Test | - t-Test | ||
Zeile 93: | Zeile 93: | ||
- Chi-Quadrat Test | - Chi-Quadrat Test | ||
{ | {Welche Arten von Merkmalssektionsverfahren werden üblicherweise im Rahmen einer multiplen linearen Regression angewandt? | ||
|type="[]"} | |type="[]"} | ||
+ Verfahren der schrittweisen Merkmalsentfernung bzw. Merkmalsaufnahme („schrittweises Verfahren“) | + Verfahren der schrittweisen Merkmalsentfernung bzw. Merkmalsaufnahme („schrittweises Verfahren“) | ||
Zeile 100: | Zeile 100: | ||
- Verfahren der sofortigen Merkmalsaufnahme („Absolutverfahren“) | - Verfahren der sofortigen Merkmalsaufnahme („Absolutverfahren“) | ||
{ | {Welche der folgenden Aussagen über Merkmalsselektionsverfahren im Rahmen einer multiplen linearen Regression sind wahr? | ||
|type="[]"} | |type="[]"} | ||
- Jedes Merkmalsselektionsverfahren (Vorwärtsverfahren, Rückwärtsverfahren, …) führt dazu, dass im Regressionsmodell nach Abschluss des Verfahrens die gleichen Prädiktoren enthalten sind. | - Jedes Merkmalsselektionsverfahren (Vorwärtsverfahren, Rückwärtsverfahren, …) führt dazu, dass im Regressionsmodell nach Abschluss des Verfahrens die gleichen Prädiktoren enthalten sind. | ||
Zeile 107: | Zeile 107: | ||
+ Das schrittweise Verfahren kombiniert das Rückwärts- und das Vorwärtsverfahren. | + Das schrittweise Verfahren kombiniert das Rückwärts- und das Vorwärtsverfahren. | ||
{ | {Die Kriteriumsvariable Y soll durch die Prädiktoren A, B, C, D und E vorhergesagt werden. Die Durchführung eines Verfahrens der schrittweisen Merkmalsaufnahme (Vorwärtsverfahren) führt zur Aufnahme der Prädiktoren A und C ins Regressionsmodell. Das multiple Bestimmtheitsmaß beträgt 0.68. Basierend auf beschriebenen Ausgangsdatensatz wird außerdem ein Verfahren der schrittweisen Merkmalsentfernung (Rückwärtsverfahren) durchgeführt. Welche der folgenden Ergebnisse könnten durch dieses Verfahren ermittelt werden? | ||
|type="[]"} | |type="[]"} | ||
+ Aufnahme der Prädiktoren A und C ins Modell ; R² = 0.68 | + Aufnahme der Prädiktoren A und C ins Modell ; R² = 0.68 | ||
Zeile 114: | Zeile 114: | ||
- Aufnahme der Prädiktoren A und C ins Modell ; R² = 0.72 | - Aufnahme der Prädiktoren A und C ins Modell ; R² = 0.72 | ||
{ | {Welche(s) Ziel(e) verfolgt eine hierarchische Regression? | ||
|type="[]"} | |type="[]"} | ||
- Untersuchung des Erklärungsbeitrages von Zeitreihen | - Untersuchung des Erklärungsbeitrages von Zeitreihen | ||
Zeile 121: | Zeile 121: | ||
+ Untersuchung des Erklärungsbeitrages inhaltlich strukturierter Merkmalsmengen | + Untersuchung des Erklärungsbeitrages inhaltlich strukturierter Merkmalsmengen | ||
{ | {Was dient als Orientierung für die Auswahl der Reihenfolge der Aufnahme von Merkmalsmengen im Rahmen einer hierarchischen Regression? | ||
|type="[]"} | |type="[]"} | ||
- Anzahl der Prädiktoren in den Merkmalsmengen | - Anzahl der Prädiktoren in den Merkmalsmengen | ||
Zeile 128: | Zeile 128: | ||
- Summe der t-Werte der Prädiktoren der Merkmalsmenge | - Summe der t-Werte der Prädiktoren der Merkmalsmenge | ||
{ | {Welche der folgenden Aussage(n) über eine hierarchische Regression sind zutreffend? | ||
|type="[]"} | |type="[]"} | ||
+ Die Reihenfolge der Aufnahme von Merkmalsmengen ist besonders dann wichtig, wenn die Merkmalsmengen stark korrelieren. | + Die Reihenfolge der Aufnahme von Merkmalsmengen ist besonders dann wichtig, wenn die Merkmalsmengen stark korrelieren. | ||
Zeile 135: | Zeile 135: | ||
- Die Bedeutsamkeit der Reihenfolge der Aufnahme von Merkmalsmengen ist unabhängig von Multikollinearität im Datensatz. | - Die Bedeutsamkeit der Reihenfolge der Aufnahme von Merkmalsmengen ist unabhängig von Multikollinearität im Datensatz. | ||
{ | {Welche der folgenden Aussage(n) über das multiple Bestimmtheitsmaß R² einer hierarchischen Regression sind wahr? | ||
|type="[]"} | |type="[]"} | ||
+ Ob eine Merkmalsmenge zu einer signifikanten Zunahme an Bestimmtheitsmaß führt, kann davon abhängen, in welchem Schritt die betreffende Merkmalsmenge aufgenommen wird. | + Ob eine Merkmalsmenge zu einer signifikanten Zunahme an Bestimmtheitsmaß führt, kann davon abhängen, in welchem Schritt die betreffende Merkmalsmenge aufgenommen wird. | ||
Zeile 142: | Zeile 142: | ||
+ Das multiple Bestimmtheitsmaß R² nimmt für die Aufnahme aller verfügbaren Merkmalsmengen ins Regressionsmodell den maximal möglichen Wert an. | + Das multiple Bestimmtheitsmaß R² nimmt für die Aufnahme aller verfügbaren Merkmalsmengen ins Regressionsmodell den maximal möglichen Wert an. | ||
{ | {Die Kriteriumsvariable Y soll durch die Merkmalsmengen A (Prädiktor 1 und 3), B (Prädiktor 2 und 4) und C (Prädiktor 5, 6 und 7) vorhergesagt werden. Es wird eine hierarchische Regression angewandt. Zunächst wird die Merkmalsmenge A ins Modell einbezogen. Das ermittelte multiple Bestimmtheitsmaß R² beträgt 0.65. Im Anschluss wird die Merkmalsmenge C ins Modell ins Regressionsmodell aufgenommen. Dies führt zu einer Zunahme des multiplen Bestimmtheitsmaßes R² um 0.30. | ||
In einer zweiten Analyse basierend auf dem gleichen Datensatz wird eine andere Reihenfolge der Aufnahme der Merkmalsmengen gewählt. Welche der folgenden Ergebnisse sind in dieser zweiten Analyse möglich? | In einer zweiten Analyse basierend auf dem gleichen Datensatz wird eine andere Reihenfolge der Aufnahme der Merkmalsmengen gewählt. Welche der folgenden Ergebnisse sind in dieser zweiten Analyse möglich? | ||
|type="[]"} | |type="[]"} | ||
Zeile 150: | Zeile 150: | ||
- Aufnahme Merkmalsmenge B → R² = 0.85; anschließend Aufnahme Merkmalsmenge A → Anstieg R² um 0.20 | - Aufnahme Merkmalsmenge B → R² = 0.85; anschließend Aufnahme Merkmalsmenge A → Anstieg R² um 0.20 | ||
{ | {Was versteht man unter einem Standardfehler der Schätzung eines Regressionskoeffizienten, welcher bei der Durchführung einer einfachen oder multiplen linearen Regression berechnet wird? | ||
|type="[]"} | |type="[]"} | ||
- Standardfehler stellen die Koeffizienten der Regressionsfunktion, die sich als Schätzungen nach der Methode der kleinsten Quadrate ergeben, dar. | - Standardfehler stellen die Koeffizienten der Regressionsfunktion, die sich als Schätzungen nach der Methode der kleinsten Quadrate ergeben, dar. | ||
Zeile 157: | Zeile 157: | ||
+ Standardfehler beschreiben wie präzise der Regressionskoeffizient durch das Modell geschätzt werden kann. | + Standardfehler beschreiben wie präzise der Regressionskoeffizient durch das Modell geschätzt werden kann. | ||
{ | {Welche der folgenden Größen werden direkt von der Höhe des Regressionskoeffizienten des Standardfehlers beeinflusst, da der Standardfehler in die Berechnung der entsprechenden Größe einfließt? | ||
|type="[]"} | |type="[]"} | ||
- Regressionskoeffizient | - Regressionskoeffizient | ||
Zeile 164: | Zeile 164: | ||
+ p-Wert | + p-Wert | ||
{ | {Wie verändert sich der Wert des Standardfehlers des Regressionskoeffizienten in der einfachen linearen Regression in Abhängigkeit vom Betrag der Korrelation zwischen Prädiktor und Kriterium? | ||
|type="[]"} | |type="[]"} | ||
- Es gibt keinen Zusammenhang zwischen dem Betrag der Korrelation von Prädiktor und Kriterium und der Höhe des Standardfehlers des Regressionskoeffizienten des Prädiktors. | - Es gibt keinen Zusammenhang zwischen dem Betrag der Korrelation von Prädiktor und Kriterium und der Höhe des Standardfehlers des Regressionskoeffizienten des Prädiktors. | ||
Zeile 171: | Zeile 171: | ||
- Es besteht ein umgekehrt u-förmiger Zusammenhang zwischen der Höhe des Betrages der Korrelation von Prädiktor und Kriterium und der Höhe des Standardfehlers des Regressionskoeffizienten des Prädiktors. | - Es besteht ein umgekehrt u-förmiger Zusammenhang zwischen der Höhe des Betrages der Korrelation von Prädiktor und Kriterium und der Höhe des Standardfehlers des Regressionskoeffizienten des Prädiktors. | ||
{ | {Gegeben sei die folgende Situation: Es wird eine multiple lineare Regression mit zwei Prädiktoren durchgeführt. Welchen Einfluss besitzt die Höhe des Betrages der Korrelation zwischen den beiden Prädiktoren unter diesen Bedingungen? | ||
|type="[]"} | |type="[]"} | ||
+ Je höher der Betrag der Korrelation zwischen den Prädiktoren ist, desto größer sind die Standardfehler der Regressionskoeffizienten der Prädiktoren. | + Je höher der Betrag der Korrelation zwischen den Prädiktoren ist, desto größer sind die Standardfehler der Regressionskoeffizienten der Prädiktoren. | ||
Zeile 178: | Zeile 178: | ||
- Je höher der Betrag der Korrelation zwischen den Prädiktoren ist, desto höher sind die Regressionskoeffizienten der Prädiktoren. | - Je höher der Betrag der Korrelation zwischen den Prädiktoren ist, desto höher sind die Regressionskoeffizienten der Prädiktoren. | ||
{ | {Führt man eine multiple lineare Korrelation mit mehreren untereinander hoch korrelierenden Prädiktoren durch, welche ebenfalls alle hohe Korrelationen mit der Kriteriumsvariablen aufweisen, kann dies dazu führen, dass im Ergebnis der Regression nur ein einzelner dieser Prädiktoren einen signifikant hohen Regressionskoeffizienten erhält. Worauf ist dies zurückzuführen? | ||
|type="[]"} | |type="[]"} | ||
- Introjektion | - Introjektion | ||
Zeile 185: | Zeile 185: | ||
- Suppression | - Suppression | ||
{ | {Was versteht man in der Statistik unter einer Moderatorvariable? | ||
|type="[]"} | |type="[]"} | ||
- Eine Moderatorvariable bezeichnet eine Variable A, welche einen Zusammenhang zu einer Variablen B besitzt, welche unabhängig von der Ausprägung weiterer Einflussvariablen konstant ist. | - Eine Moderatorvariable bezeichnet eine Variable A, welche einen Zusammenhang zu einer Variablen B besitzt, welche unabhängig von der Ausprägung weiterer Einflussvariablen konstant ist. | ||
Zeile 192: | Zeile 192: | ||
- Eine Moderatorvariable bezeichnet eine Variable C, welche den Einfluss einer Variable A auf eine Variable B vermittelt. | - Eine Moderatorvariable bezeichnet eine Variable C, welche den Einfluss einer Variable A auf eine Variable B vermittelt. | ||
{ | {Im Rahmen einer multiplen linearen Regression kann die Analyse von Moderatoreffekten erfolgen. | ||
Angenommen wir möchten durch unsere Untersuchung das Kriterium Leistungsmotivation durch die Prädiktoren Intelligenz und Gewissenhaftigkeit vorhersagen und nehmen aufgrund inhaltlicher Überlegungen an, dass Gewissenhaftigkeit einen Moderator des Zusammenhangs zwischen Intelligenz und Leistungsmotivation darstellt. Wie kann eine solche Analyse erfolgen? | Angenommen wir möchten durch unsere Untersuchung das Kriterium Leistungsmotivation durch die Prädiktoren Intelligenz und Gewissenhaftigkeit vorhersagen und nehmen aufgrund inhaltlicher Überlegungen an, dass Gewissenhaftigkeit einen Moderator des Zusammenhangs zwischen Intelligenz und Leistungsmotivation darstellt. Wie kann eine solche Analyse erfolgen? | ||
|type="[]"} | |type="[]"} | ||
Zeile 200: | Zeile 200: | ||
- Durchführung einer multiplen linearen Regression zur Vorhersage der Variable Gewissenhaftigkeit durch Intelligenz und Leistungsmotivation, ein hohes Bestimmtheitsmaß > 90 % liefert einen starken Hinweis auf das Vorliegen eines Moderatoreffekts | - Durchführung einer multiplen linearen Regression zur Vorhersage der Variable Gewissenhaftigkeit durch Intelligenz und Leistungsmotivation, ein hohes Bestimmtheitsmaß > 90 % liefert einen starken Hinweis auf das Vorliegen eines Moderatoreffekts | ||
{ | {Im Folgenden sehen Sie die Ergebnisausgaben verschiedener multipler linearer Regressionen zur Untersuchung von potenziellen Moderatoreffekten von Prädiktor 2 auf die Stärke des Zusammenhangs zwischen Prädiktor 1 und der Kriteriumsvariable. Der Interaktionsterm stellt dabei das Produkt von Prädiktor 1 und 2 dar. Welche Ergebnisausgaben lassen auf einen signifikanten Moderatoreffekt schließen? | ||
|type="[]"} | |type="[]"} | ||
- [[Datei:3_8_MC_Tab1.PNG|400px]] | - [[Datei:3_8_MC_Tab1.PNG|400px]] | ||
Zeile 207: | Zeile 207: | ||
+ [[Datei:3_8_MC_Tab4.PNG|400px]] | + [[Datei:3_8_MC_Tab4.PNG|400px]] | ||
{ | {Zur Analyse von Moderatoreffekten können zusätzlich zur Anwendung einer multiplen linearen Regression auch grafische Darstellungen verwendet werden. Eine einfache Methode dafür ist die Darstellung von bedingten Regressionsgeraden. In den folgenden Darstellungen wurde dafür ein Median-Split der Werte des Moderators verwendet (blau: Moderator < Median; grün: Moderator > Median). Welche Abbildungen geben einen deutlichen Hinweis auf das Vorliegen eines Moderatoreffekts? | ||
|type="[]"} | |type="[]"} | ||
- [[Datei:3_8_MC_1.PNG|400px]] | - [[Datei:3_8_MC_1.PNG|400px]] | ||
Zeile 214: | Zeile 214: | ||
- [[Datei:3_8_MC_4.PNG|400px]] | - [[Datei:3_8_MC_4.PNG|400px]] | ||
{ | {Vor der Analyse eines Moderatoreffektes mithilfe einer multiplen linearen Regression empfehlen beispielsweise Cohen et al. (2003) die Zentrierung aller metrischen Prädiktorvariablen. Warum? | ||
|type="[]"} | |type="[]"} | ||
- Erhöhung der Rechengeschwindigkeit | - Erhöhung der Rechengeschwindigkeit |
Aktuelle Version vom 6. März 2020, 01:16 Uhr
Der folgenden Bereich enthält Fragen zur multiplen linearen Regression. Alle Fragen sind Multiple Choice Fragen, d.h. es können immer mehrere Antworten richtig sein. Klicken Sie zur Beantwortung einer Frage die korrekten Antwortmöglichkeiten an. Um Ihre Ergebnisse auszuwerten, wählen Sie bitte den Button "Speichern" am unteren Ende der Seite.
Für jede vollständig richtig beantwortete Frage erhalten Sie einen Punkt. Für falsche beantwortete Fragen werden Ihnen keine Punkte abgezogen. Sie können diese Einstellung jedoch beliebig verändern. Ihre Gesamtpunktzahl finden Sie am unteren Seitenende.