Aufgaben - Multiple lineare Regression: Unterschied zwischen den Versionen

Aus eLearning - Methoden der Psychologie - TU Dresden
Zur Navigation springen Zur Suche springen
Keine Bearbeitungszusammenfassung
Keine Bearbeitungszusammenfassung
 
(6 dazwischenliegende Versionen desselben Benutzers werden nicht angezeigt)
Zeile 8: Zeile 8:
<quiz shuffleanswers=true>
<quiz shuffleanswers=true>


{1. Welche der folgenden Definitionen kann zur Beschreibung einer multiplen linearen Regression verwendet werden?
{Welche der folgenden Definitionen kann zur Beschreibung einer multiplen linearen Regression verwendet werden?
|type="[]"}
|type="[]"}
+ Die multiple lineare Regression ist ein statistisches Verfahren, mit dem versucht wird, eine beobachtete abhängige metrische Variable durch mehrere unabhängige Variablen zu erklären.
+ Die multiple lineare Regression ist ein statistisches Verfahren, mit dem versucht wird, eine beobachtete abhängige metrische Variable durch mehrere unabhängige Variablen zu erklären.
Zeile 15: Zeile 15:
- Die multiple lineare Regression ist ein statistisches Verfahren, mit dem versucht wird, mehrere beobachtete abhängige ordinale oder kategoriale Variablen durch mehrere unabhängige Variablen zu erklären.
- Die multiple lineare Regression ist ein statistisches Verfahren, mit dem versucht wird, mehrere beobachtete abhängige ordinale oder kategoriale Variablen durch mehrere unabhängige Variablen zu erklären.


{2. Mithilfe welches allgemeinen Schätzprinzips können die Regressionskoeffizienten im Rahmen einer multiplen linearen Regression bestimmt werden?
{Mithilfe welches allgemeinen Schätzprinzips können die Regressionskoeffizienten im Rahmen einer multiplen linearen Regression bestimmt werden?
|type="[]"}
|type="[]"}
- Methode der größten Quadrate
- Methode der größten Quadrate
Zeile 22: Zeile 22:
- Methode der multiplen linearen Quadrate
- Methode der multiplen linearen Quadrate


{3. Welche Voraussetzungen sollten für die Durchführung einer multiplen linearen Regressionsanalyse erfüllt sein?
{Welche Voraussetzungen sollten für die Durchführung einer multiplen linearen Regressionsanalyse erfüllt sein?
|type="[]"}
|type="[]"}
+ Festlegung von Prädiktoren und Kriterium
+ Festlegung von Prädiktoren und Kriterium
Zeile 30: Zeile 30:
+ Homoskedastizität
+ Homoskedastizität


{4. Was bedeutet Homoskedastizität?
{Was bedeutet Homoskedastizität?
|type="[]"}
|type="[]"}
- Mittelwerte der Modellfehler sind normalverteilt
- Mittelwerte der Modellfehler sind normalverteilt
Zeile 37: Zeile 37:
- Varianzen der Modellfehler sind in Abhängigkeit der konkreten Werten der Prädiktoren verschieden
- Varianzen der Modellfehler sind in Abhängigkeit der konkreten Werten der Prädiktoren verschieden


{5. Die folgenden Abbildungen stellen eine grafische Gegenüberstellung der z-standardisierten Residuen und der z-standardisierten Schätzungen für die Kriteriumsvariablen einer multiplen linearen Regression dar. Welche der Abbildungen liefern einen Hinweis auf Heteroskedastizität?
{Die folgenden Abbildungen stellen eine grafische Gegenüberstellung der z-standardisierten Residuen und der z-standardisierten Schätzungen für die Kriteriumsvariablen einer multiplen linearen Regression dar. Welche der Abbildungen liefern einen Hinweis auf Heteroskedastizität?
|type="[]"}
|type="[]"}
+ [[Datei:3_3_MC_1.PNG|400px]]
- [[Datei:3_3_MC_2.PNG|400px]]
+ [[Datei:3_3_MC_3.PNG|400px]]
+ [[Datei:3_3_MC_4.PNG|400px]]


{
{Was versteht man unter dem Begriff der „Multikollinearität“?
|type="[]"}
|type="[]"}
+ Multikollinearität ist ein Problem der Regressionsanalyse und liegt vor, wenn zwei oder mehr der Prädiktoren stark miteinander korrelieren.
- Multikollinearität ist ein Problem der Regressionsanalyse und liegt vor, wenn zwei oder mehr der abhängigen Variablen stark miteinander korrelieren
- Multikollinearität ist ein Problem der Regressionsanalyse und liegt vor, wenn keine oder nur schwache Korrelationen zwischen den Prädiktoren bestehen.
- Multikollinearität ist ein Problem der Regressionsanalyse und liegt vor, wenn keine oder nur schwache Korrelationen zwischen den abhängigen Variablen bestehen.


{
{Welche der folgenden Begriffe stellen Folgen des Vorliegens von Multikollinearität dar?
|type="[]"}
|type="[]"}
- Introjektion
- Konversion
+ Redundanz
+ Suppressionseffekte


{
{Welche Folgen können durch das Vorhandensein von Multikollinearität bei der Durchführung einer multiplen linearen Regression auftreten?
|type="[]"}
|type="[]"}
+ Erhöhung der Standardfehler der Schätzungen der Regressionskoeffizienten
+ Instabilität des Verfahrens zur Schätzung der Regressionskoeffizienten
+ Ungenauigkeit von Aussagen zur Schätzung von Regressionskoeffizienten
- Eindeutigkeit der Modellinterpretation


{
{Welche der folgenden Beobachtungen können Warnzeichen für das Vorliegen von Multikollinearität darstellen?
|type="[]"}
|type="[]"}
+ Nach der Aufnahme eines weiteren Prädiktors in ein Regressionsmodell kommt es zu einer starken Veränderung der Regressionskoeffizienten.
+ Ein Prädiktor, der sehr stark mit der Kriteriumsvariablen korreliert, besitzt im Ergebnis der Regressionsanalyse keinen signifikanten Regressionskoeffizienten.
+ Die Prädiktoren korrelieren sehr stark miteinander.
- Der VIF (Varianzinflationsfaktor) des Regressionsmodells ist gering und der Wert der Toleranz des Regressionsmodells ist sehr hoch.


{
{Welche Beziehungen sind Hinweise für Redundanz eines Prädiktors?
|type="[]"}
|type="[]"}
- Prädiktor korreliert hoch und signifikant mit dem Kriterium und mit anderen Prädiktoren und hat einen signifikanten Regressionskoeffizienten in der multiplen Regressionsanalyse
+ Prädiktor korreliert hoch und signifikant mit dem Kriterium und mit anderen Prädiktoren und hat keinen signifikanten Regressionskoeffizienten in der multiplen Regressionsanalyse
- Prädiktor korreliert hoch und signifikant mit dem Kriterium, aber nicht mit den anderen Prädiktoren und hat einen signifikanten Regressionskoeffizienten in der multiplen Regressionsanalyse
- Prädiktor korreliert hoch und signifikant mit anderen Prädiktoren, nicht aber mit dem Kriterium, und hat einen signifikanten Regressionskoeffizienten in der multiplen Regressionsanalyse


{
{Welche der folgenden Ziele werden von einem Merkmalselektionsverfahrens im Rahmen einer multiplen linearen Regression verfolgt?
|type="[]"}
|type="[]"}
+ Identifikation von möglichst wenigen Prädiktoren, welche eine gute Vorhersage der Kriteriumsvariable ermöglichen
+ klare inhaltliche Interpretation des Regressionsmodells
- Erhöhung der Fehlervarianz
+ Minimierung des erforderlichen ökonomischen, inhaltlichen und statistischen Aufwands


{
{Das Grundprinzip von Merkmalsselektionsverfahren im Rahmen einer multiplen linearen Regression besteht darin, für einzelne Prädiktorvariablen zu beurteilen, inwieweit sich durch ihre Hinzunahme zw. Entfernung aus dem Merkmalssatz das multiple Bestimmtheitsmaß signifikant verändert. Welcher Test wird zur Prüfung der Signifikanz dieser Veränderung verwendet?
|type="[]"}
|type="[]"}
- t-Test
+ F-Test
- Kolmogorow-Smirnow-Test
- Chi-Quadrat Test


{
{Welche Arten von Merkmalssektionsverfahren werden üblicherweise im Rahmen einer multiplen linearen Regression angewandt?
|type="[]"}
|type="[]"}
+ Verfahren der schrittweisen Merkmalsentfernung bzw. Merkmalsaufnahme („schrittweises Verfahren“)
+ Verfahren der schrittweisen Merkmalsentfernung („Rückwärtsverfahren“)
+ Verfahren der schrittweisen Merkmalsaufnahme („Vorwärtsverfahren“)
- Verfahren der sofortigen Merkmalsaufnahme („Absolutverfahren“)


{
{Welche der folgenden Aussagen über Merkmalsselektionsverfahren im Rahmen einer multiplen linearen Regression sind wahr?
|type="[]"}
|type="[]"}
- Jedes Merkmalsselektionsverfahren (Vorwärtsverfahren, Rückwärtsverfahren, …) führt dazu, dass im Regressionsmodell nach Abschluss des Verfahrens die gleichen Prädiktoren enthalten sind.
+ Das multiple Bestimmtheitsmaß R² des mithilfe eines Merkmalsselektionsverfahrens ermittelten Regressionsmodells kann sich in Abhängigkeit des ausgewählten Verfahrens unterscheiden.
- Die Anwendung eines Vorwärtsverfahrens führt in jedem Fall zu einem größeren multiplen Bestimmtheitsmaß als die Anwendung eines Rückwärtsverfahrens.
+ Das schrittweise Verfahren kombiniert das Rückwärts- und das Vorwärtsverfahren.


{
{Die Kriteriumsvariable Y soll durch die Prädiktoren A, B, C, D und E vorhergesagt werden. Die Durchführung eines Verfahrens der schrittweisen Merkmalsaufnahme (Vorwärtsverfahren) führt zur Aufnahme der Prädiktoren A und C ins Regressionsmodell. Das multiple Bestimmtheitsmaß beträgt 0.68. Basierend auf beschriebenen Ausgangsdatensatz wird außerdem ein Verfahren der schrittweisen Merkmalsentfernung (Rückwärtsverfahren) durchgeführt. Welche der folgenden Ergebnisse könnten durch dieses Verfahren ermittelt werden?
|type="[]"}
|type="[]"}
+ Aufnahme der Prädiktoren A und C ins Modell ; R² = 0.68
- Aufnahme der Prädiktoren B und C ins Modell ; R² = 1.08
+ Aufnahme der Prädiktoren B und D ins Modell ; R² = 0.69
- Aufnahme der Prädiktoren A und C ins Modell ; R² = 0.72


{
{Welche(s) Ziel(e) verfolgt eine hierarchische Regression?
|type="[]"}
|type="[]"}
- Untersuchung des Erklärungsbeitrages von Zeitreihen
- Untersuchung des Erklärungsbeitrages der Regressionskonstante
- Untersuchung des Erklärungsbeitrages aus dem Datensatz extrahierter Hauptkomponenten
+ Untersuchung des Erklärungsbeitrages inhaltlich strukturierter Merkmalsmengen


{
{Was dient als Orientierung für die Auswahl der Reihenfolge der Aufnahme von Merkmalsmengen im Rahmen einer hierarchischen Regression?
|type="[]"}
|type="[]"}
- Anzahl der Prädiktoren in den Merkmalsmengen
+ inhaltliche Gesichtspunkte
- Summe der β-Gewichte der Prädiktoren der Merkmalsmenge
- Summe der t-Werte der Prädiktoren der Merkmalsmenge


{
{Welche der folgenden Aussage(n) über eine hierarchische Regression sind zutreffend?
|type="[]"}
|type="[]"}
+ Die Reihenfolge der Aufnahme von Merkmalsmengen ist besonders dann wichtig, wenn die Merkmalsmengen stark korrelieren.
+ Resultieren in Abhängigkeit der Reihenfolge der Aufnahme der Merkmalsmengen unterschiedliche Regressionsmodelle, liefert dies einen Hinweis auf Multikollinearität.
- Korrelieren die Merkmalsmengen kaum untereinander, dann resultieren abhängig von der Reihenfolge der Aufnahme der Merkmalsmengen oftmals sehr unterschiedliche Ergebnisse.
- Die Bedeutsamkeit der Reihenfolge der Aufnahme von Merkmalsmengen ist unabhängig von Multikollinearität im Datensatz.


{
{Welche der folgenden Aussage(n) über das multiple Bestimmtheitsmaß R² einer hierarchischen Regression sind wahr?
|type="[]"}
|type="[]"}
+ Ob eine Merkmalsmenge zu einer signifikanten Zunahme an Bestimmtheitsmaß führt, kann davon abhängen, in welchem Schritt die betreffende Merkmalsmenge aufgenommen wird.
- Das multiple Bestimmtheitsmaß R² nimmt ab, je mehr Merkmalsmengen ins Regressionsmodell aufgenommen werden.
- Die Aufnahme von 50 % aller Merkmalsmengen führt in jedem Fall zu einem multiplen Bestimmtheitsmaß R² größer als 25 %.
+ Das multiple Bestimmtheitsmaß R² nimmt für die Aufnahme aller verfügbaren Merkmalsmengen ins Regressionsmodell den maximal möglichen Wert an.


{
{Die Kriteriumsvariable Y soll durch die Merkmalsmengen A (Prädiktor 1 und 3), B (Prädiktor 2 und 4) und C (Prädiktor 5, 6 und 7) vorhergesagt werden. Es wird eine hierarchische Regression angewandt. Zunächst wird die Merkmalsmenge A ins Modell einbezogen. Das ermittelte multiple Bestimmtheitsmaß R² beträgt 0.65. Im Anschluss wird die Merkmalsmenge C ins Modell ins Regressionsmodell aufgenommen. Dies führt zu einer Zunahme des multiplen Bestimmtheitsmaßes R² um 0.30.
In einer zweiten Analyse basierend auf dem gleichen Datensatz wird eine andere Reihenfolge der Aufnahme der Merkmalsmengen gewählt. Welche der folgenden Ergebnisse sind in dieser zweiten Analyse möglich?
|type="[]"}
|type="[]"}
+ Aufnahme Merkmalsmenge B → R² = 0.40; anschließend Aufnahme Merkmalsmenge C → Anstieg R² um 0.40
+ Aufnahme Merkmalsmenge C → R² = 0.60; anschließend Aufnahme Merkmalsmenge A → Anstieg R² um 0.35
- Aufnahme Merkmalsmenge C → R² = 0.75; anschließend Aufnahme Merkmalsmenge A → Anstieg R² um 0.15
- Aufnahme Merkmalsmenge B → R² = 0.85; anschließend Aufnahme Merkmalsmenge A → Anstieg R² um 0.20


{
{Was versteht man unter einem Standardfehler der Schätzung eines Regressionskoeffizienten, welcher bei der Durchführung einer einfachen oder multiplen linearen Regression berechnet wird?
|type="[]"}
|type="[]"}
- Standardfehler stellen die Koeffizienten der Regressionsfunktion, die sich als Schätzungen nach der Methode der kleinsten Quadrate ergeben, dar.
- Standardfehler stellen die Abweichungen der Schätzwerte von den gemessenen Werten, also die Abweichungen der Messwerte von der Regressionsgerade, dar.
- Standardfehler der Regressionskoeffizienten beschreiben die Regressionskoeffizienten, welche entstehen, wenn vor der Regression alle beteiligten Prädiktoren und die Kriteriumsvariable z-standardisiert werden.
+ Standardfehler beschreiben wie präzise der Regressionskoeffizient durch das Modell geschätzt werden kann.


{
{Welche der folgenden Größen werden direkt von der Höhe des Regressionskoeffizienten des Standardfehlers beeinflusst, da der Standardfehler in die Berechnung der entsprechenden Größe einfließt?
|type="[]"}
|type="[]"}
- Regressionskoeffizient
- Bestimmtheitsmaß
+ t-Wert
+ p-Wert


{
{Wie verändert sich der Wert des Standardfehlers des Regressionskoeffizienten in der einfachen linearen Regression in Abhängigkeit vom Betrag der Korrelation zwischen Prädiktor und Kriterium?
|type="[]"}
|type="[]"}
- Es gibt keinen Zusammenhang zwischen dem Betrag der Korrelation von Prädiktor und Kriterium und der Höhe des Standardfehlers des Regressionskoeffizienten des Prädiktors.
- Je höher der Betrag der Korrelation zwischen Prädiktor und Kriterium, desto höher ist der Standardfehler des Regressionskoeffizienten des Prädiktors.
+ Je höher der Betrag der Korrelation zwischen Prädiktor und Kriterium, desto geringer ist der Wert des Standardfehlers des Regressionskoeffizienten des Prädiktors.
- Es besteht ein umgekehrt u-förmiger Zusammenhang zwischen der Höhe des Betrages der Korrelation von Prädiktor und Kriterium und der Höhe des Standardfehlers des Regressionskoeffizienten des Prädiktors.


{
{Gegeben sei die folgende Situation: Es wird eine multiple lineare Regression mit zwei Prädiktoren durchgeführt. Welchen Einfluss besitzt die Höhe des Betrages der Korrelation zwischen den beiden Prädiktoren unter diesen Bedingungen?
|type="[]"}
|type="[]"}
+ Je höher der Betrag der Korrelation zwischen den Prädiktoren ist, desto größer sind die Standardfehler der Regressionskoeffizienten der Prädiktoren.
- Je höher der Betrag der Korrelation zwischen den Prädiktoren ist, desto kleiner sind die Standardfehler der Regressionskoeffizienten der Prädiktoren.
+ Je höher der Betrag der Korrelation zwischen den Prädiktoren ist, desto höher ist die Wahrscheinlichkeit, dass nur einer oder keiner der beiden Prädiktoren im Ergebnis der Regressionsanalyse einen signifikanten Regressionskoeffizienten besitzt.
- Je höher der Betrag der Korrelation zwischen den Prädiktoren ist, desto höher sind die Regressionskoeffizienten der Prädiktoren.


{
{Führt man eine multiple lineare Korrelation mit mehreren untereinander hoch korrelierenden Prädiktoren durch, welche ebenfalls alle hohe Korrelationen mit der Kriteriumsvariablen aufweisen, kann dies dazu führen, dass im Ergebnis der Regression nur ein einzelner dieser Prädiktoren einen signifikant hohen Regressionskoeffizienten erhält. Worauf ist dies zurückzuführen?
|type="[]"}
|type="[]"}
- Introjektion
- Hierarchie
+ Redundanz
- Suppression


{
{Was versteht man in der Statistik unter einer Moderatorvariable?
|type="[]"}
|type="[]"}
{
- Eine Moderatorvariable bezeichnet eine Variable A, welche einen Zusammenhang zu einer Variablen B besitzt, welche unabhängig von der Ausprägung weiterer Einflussvariablen konstant ist.
- Eine Moderatorvariable bezeichnet eine Variable A, welche in Abhängigkeit der Ausprägung einer Variable C durch Variable B beeinflusst wird.
+ Eine Moderatorvariable bezeichnet eine Variable C, von deren Ausprägung abhängig ist, wie groß der Einfluss einer Variable A auf Variable B ist.
- Eine Moderatorvariable bezeichnet eine Variable C, welche den Einfluss einer Variable A auf eine Variable B vermittelt.
 
{Im Rahmen einer multiplen linearen Regression kann die Analyse von Moderatoreffekten erfolgen.
Angenommen wir möchten durch unsere Untersuchung das Kriterium Leistungsmotivation durch die Prädiktoren Intelligenz und Gewissenhaftigkeit vorhersagen und nehmen aufgrund inhaltlicher Überlegungen an, dass Gewissenhaftigkeit einen Moderator des Zusammenhangs zwischen Intelligenz und Leistungsmotivation darstellt. Wie kann eine solche Analyse erfolgen?
|type="[]"}
|type="[]"}
+ Bildung eines Interaktionsterms als Produkt von Prädiktor Intelligenz und potenzieller Moderatorvariable Gewissenhaftigkeit und Aufnahme dieses Interaktionsterms in die multiple Regression zur Vorhersage der Kriteriumsvariable Leistungsmotivation
- Bildung eines Interaktionsterms als Summe von Prädiktor Intelligenz und potenzieller Moderatorvariable Gewissenhaftigkeit und Aufnahme dieses Interaktionsterms in die multiple lineare Regression zur Vorhersage der Kriteriumsvariable Leistungsmotivation
- Bildung eines Interaktionsterms als Quotient von Prädiktor Intelligenz und potenzieller Moderatorvariable Gewissenhaftigkeit und Aufnahme dieses Interaktionsterms in die multiple lineare Regression zur Vorhersage der Kriteriumsvariable Leistungsmotivation
- Durchführung einer multiplen linearen Regression zur Vorhersage der Variable Gewissenhaftigkeit durch Intelligenz und Leistungsmotivation, ein hohes Bestimmtheitsmaß > 90 % liefert einen starken Hinweis auf das Vorliegen eines Moderatoreffekts


{
{Im Folgenden sehen Sie die Ergebnisausgaben verschiedener multipler linearer Regressionen zur Untersuchung von potenziellen Moderatoreffekten von Prädiktor 2 auf die Stärke des Zusammenhangs zwischen Prädiktor 1 und der Kriteriumsvariable. Der Interaktionsterm stellt dabei das Produkt von Prädiktor 1 und 2 dar. Welche Ergebnisausgaben lassen auf einen signifikanten Moderatoreffekt schließen?
|type="[]"}
|type="[]"}
- [[Datei:3_8_MC_Tab1.PNG|400px]]
+ [[Datei:3_8_MC_Tab2.PNG|400px]]
+ [[Datei:3_8_MC_Tab3.PNG|400px]]
+ [[Datei:3_8_MC_Tab4.PNG|400px]]


{
{Zur Analyse von Moderatoreffekten können zusätzlich zur Anwendung einer multiplen linearen Regression auch grafische Darstellungen verwendet werden. Eine einfache Methode dafür ist die Darstellung von bedingten Regressionsgeraden. In den folgenden Darstellungen wurde dafür ein Median-Split der Werte des Moderators verwendet (blau: Moderator < Median; grün: Moderator > Median). Welche Abbildungen geben einen deutlichen Hinweis auf das Vorliegen eines Moderatoreffekts?
|type="[]"}
|type="[]"}
- [[Datei:3_8_MC_1.PNG|400px]]
+ [[Datei:3_8_MC_2.PNG|400px]]
+ [[Datei:3_8_MC_3.PNG|400px]]
- [[Datei:3_8_MC_4.PNG|400px]]


{
{Vor der Analyse eines Moderatoreffektes mithilfe einer multiplen linearen Regression empfehlen beispielsweise Cohen et al. (2003) die Zentrierung aller metrischen Prädiktorvariablen. Warum?
|type="[]"}
|type="[]"}
- Erhöhung der Rechengeschwindigkeit
- Erhöhung der Wahrscheinlichkeit der Signifikanz des Interaktionsterms
- Reduktion der Wahrscheinlichkeit der Signifikanz des Interaktionsterms
+ Verminderung von Interpretationsproblemen




</quiz>
</quiz>

Aktuelle Version vom 6. März 2020, 01:16 Uhr

Der folgenden Bereich enthält Fragen zur multiplen linearen Regression. Alle Fragen sind Multiple Choice Fragen, d.h. es können immer mehrere Antworten richtig sein. Klicken Sie zur Beantwortung einer Frage die korrekten Antwortmöglichkeiten an. Um Ihre Ergebnisse auszuwerten, wählen Sie bitte den Button "Speichern" am unteren Ende der Seite.

Für jede vollständig richtig beantwortete Frage erhalten Sie einen Punkt. Für falsche beantwortete Fragen werden Ihnen keine Punkte abgezogen. Sie können diese Einstellung jedoch beliebig verändern. Ihre Gesamtpunktzahl finden Sie am unteren Seitenende.


  

1 Welche der folgenden Definitionen kann zur Beschreibung einer multiplen linearen Regression verwendet werden?

Die multiple lineare Regression ist ein statistisches Verfahren, mit dem versucht wird, eine beobachtete abhängige ordinale oder kategoriale Variable durch mehrere unabhängige Variablen zu erklären.
Die multiple lineare Regression ist ein statistisches Verfahren, mit dem versucht wird, eine beobachtete abhängige metrische Variable durch mehrere unabhängige Variablen zu erklären.
Die multiple lineare Regression ist ein statistisches Verfahren, mit dem versucht wird, mehrere abhängige metrische Variablen durch eine oder mehrere unabhängige Variablen zu erklären.
Die multiple lineare Regression ist ein statistisches Verfahren, mit dem versucht wird, mehrere beobachtete abhängige ordinale oder kategoriale Variablen durch mehrere unabhängige Variablen zu erklären.

2 Mithilfe welches allgemeinen Schätzprinzips können die Regressionskoeffizienten im Rahmen einer multiplen linearen Regression bestimmt werden?

Methode der multiplen Quadrate
Methode der kleinsten Quadrate
Methode der multiplen linearen Quadrate
Methode der größten Quadrate

3 Welche Voraussetzungen sollten für die Durchführung einer multiplen linearen Regressionsanalyse erfüllt sein?

Festlegung von Prädiktoren und Kriterium
Normalverteilung der Modellfehler
Statistische Abhängigkeit der Modellfehler
Gültigkeit des linearen Modells
Homoskedastizität

4 Was bedeutet Homoskedastizität?

Mittelwerte der Modellfehler sind nicht normalverteilt
Varianzen der Modellfehler sind in Abhängigkeit der konkreten Werten der Prädiktoren verschieden
Mittelwerte der Modellfehler sind normalverteilt
Varianzen der Modellfehler sind unabhängig von den konkreten Werten der Prädiktoren gleich

5 Die folgenden Abbildungen stellen eine grafische Gegenüberstellung der z-standardisierten Residuen und der z-standardisierten Schätzungen für die Kriteriumsvariablen einer multiplen linearen Regression dar. Welche der Abbildungen liefern einen Hinweis auf Heteroskedastizität?

3 3 MC 4.PNG
3 3 MC 2.PNG
3 3 MC 3.PNG
3 3 MC 1.PNG

6 Was versteht man unter dem Begriff der „Multikollinearität“?

Multikollinearität ist ein Problem der Regressionsanalyse und liegt vor, wenn keine oder nur schwache Korrelationen zwischen den abhängigen Variablen bestehen.
Multikollinearität ist ein Problem der Regressionsanalyse und liegt vor, wenn zwei oder mehr der Prädiktoren stark miteinander korrelieren.
Multikollinearität ist ein Problem der Regressionsanalyse und liegt vor, wenn zwei oder mehr der abhängigen Variablen stark miteinander korrelieren
Multikollinearität ist ein Problem der Regressionsanalyse und liegt vor, wenn keine oder nur schwache Korrelationen zwischen den Prädiktoren bestehen.

7 Welche der folgenden Begriffe stellen Folgen des Vorliegens von Multikollinearität dar?

Suppressionseffekte
Redundanz
Konversion
Introjektion

8 Welche Folgen können durch das Vorhandensein von Multikollinearität bei der Durchführung einer multiplen linearen Regression auftreten?

Eindeutigkeit der Modellinterpretation
Erhöhung der Standardfehler der Schätzungen der Regressionskoeffizienten
Ungenauigkeit von Aussagen zur Schätzung von Regressionskoeffizienten
Instabilität des Verfahrens zur Schätzung der Regressionskoeffizienten

9 Welche der folgenden Beobachtungen können Warnzeichen für das Vorliegen von Multikollinearität darstellen?

Der VIF (Varianzinflationsfaktor) des Regressionsmodells ist gering und der Wert der Toleranz des Regressionsmodells ist sehr hoch.
Ein Prädiktor, der sehr stark mit der Kriteriumsvariablen korreliert, besitzt im Ergebnis der Regressionsanalyse keinen signifikanten Regressionskoeffizienten.
Nach der Aufnahme eines weiteren Prädiktors in ein Regressionsmodell kommt es zu einer starken Veränderung der Regressionskoeffizienten.
Die Prädiktoren korrelieren sehr stark miteinander.

10 Welche Beziehungen sind Hinweise für Redundanz eines Prädiktors?

Prädiktor korreliert hoch und signifikant mit dem Kriterium, aber nicht mit den anderen Prädiktoren und hat einen signifikanten Regressionskoeffizienten in der multiplen Regressionsanalyse
Prädiktor korreliert hoch und signifikant mit anderen Prädiktoren, nicht aber mit dem Kriterium, und hat einen signifikanten Regressionskoeffizienten in der multiplen Regressionsanalyse
Prädiktor korreliert hoch und signifikant mit dem Kriterium und mit anderen Prädiktoren und hat einen signifikanten Regressionskoeffizienten in der multiplen Regressionsanalyse
Prädiktor korreliert hoch und signifikant mit dem Kriterium und mit anderen Prädiktoren und hat keinen signifikanten Regressionskoeffizienten in der multiplen Regressionsanalyse

11 Welche der folgenden Ziele werden von einem Merkmalselektionsverfahrens im Rahmen einer multiplen linearen Regression verfolgt?

Identifikation von möglichst wenigen Prädiktoren, welche eine gute Vorhersage der Kriteriumsvariable ermöglichen
Erhöhung der Fehlervarianz
klare inhaltliche Interpretation des Regressionsmodells
Minimierung des erforderlichen ökonomischen, inhaltlichen und statistischen Aufwands

12 Das Grundprinzip von Merkmalsselektionsverfahren im Rahmen einer multiplen linearen Regression besteht darin, für einzelne Prädiktorvariablen zu beurteilen, inwieweit sich durch ihre Hinzunahme zw. Entfernung aus dem Merkmalssatz das multiple Bestimmtheitsmaß signifikant verändert. Welcher Test wird zur Prüfung der Signifikanz dieser Veränderung verwendet?

t-Test
F-Test
Chi-Quadrat Test
Kolmogorow-Smirnow-Test

13 Welche Arten von Merkmalssektionsverfahren werden üblicherweise im Rahmen einer multiplen linearen Regression angewandt?

Verfahren der schrittweisen Merkmalsaufnahme („Vorwärtsverfahren“)
Verfahren der sofortigen Merkmalsaufnahme („Absolutverfahren“)
Verfahren der schrittweisen Merkmalsentfernung („Rückwärtsverfahren“)
Verfahren der schrittweisen Merkmalsentfernung bzw. Merkmalsaufnahme („schrittweises Verfahren“)

14 Welche der folgenden Aussagen über Merkmalsselektionsverfahren im Rahmen einer multiplen linearen Regression sind wahr?

Die Anwendung eines Vorwärtsverfahrens führt in jedem Fall zu einem größeren multiplen Bestimmtheitsmaß als die Anwendung eines Rückwärtsverfahrens.
Das multiple Bestimmtheitsmaß R² des mithilfe eines Merkmalsselektionsverfahrens ermittelten Regressionsmodells kann sich in Abhängigkeit des ausgewählten Verfahrens unterscheiden.
Das schrittweise Verfahren kombiniert das Rückwärts- und das Vorwärtsverfahren.
Jedes Merkmalsselektionsverfahren (Vorwärtsverfahren, Rückwärtsverfahren, …) führt dazu, dass im Regressionsmodell nach Abschluss des Verfahrens die gleichen Prädiktoren enthalten sind.

15 Die Kriteriumsvariable Y soll durch die Prädiktoren A, B, C, D und E vorhergesagt werden. Die Durchführung eines Verfahrens der schrittweisen Merkmalsaufnahme (Vorwärtsverfahren) führt zur Aufnahme der Prädiktoren A und C ins Regressionsmodell. Das multiple Bestimmtheitsmaß beträgt 0.68. Basierend auf beschriebenen Ausgangsdatensatz wird außerdem ein Verfahren der schrittweisen Merkmalsentfernung (Rückwärtsverfahren) durchgeführt. Welche der folgenden Ergebnisse könnten durch dieses Verfahren ermittelt werden?

Aufnahme der Prädiktoren A und C ins Modell ; R² = 0.72
Aufnahme der Prädiktoren B und C ins Modell ; R² = 1.08
Aufnahme der Prädiktoren B und D ins Modell ; R² = 0.69
Aufnahme der Prädiktoren A und C ins Modell ; R² = 0.68

16 Welche(s) Ziel(e) verfolgt eine hierarchische Regression?

Untersuchung des Erklärungsbeitrages von Zeitreihen
Untersuchung des Erklärungsbeitrages der Regressionskonstante
Untersuchung des Erklärungsbeitrages inhaltlich strukturierter Merkmalsmengen
Untersuchung des Erklärungsbeitrages aus dem Datensatz extrahierter Hauptkomponenten

17 Was dient als Orientierung für die Auswahl der Reihenfolge der Aufnahme von Merkmalsmengen im Rahmen einer hierarchischen Regression?

Summe der t-Werte der Prädiktoren der Merkmalsmenge
Anzahl der Prädiktoren in den Merkmalsmengen
Summe der β-Gewichte der Prädiktoren der Merkmalsmenge
inhaltliche Gesichtspunkte

18 Welche der folgenden Aussage(n) über eine hierarchische Regression sind zutreffend?

Die Reihenfolge der Aufnahme von Merkmalsmengen ist besonders dann wichtig, wenn die Merkmalsmengen stark korrelieren.
Die Bedeutsamkeit der Reihenfolge der Aufnahme von Merkmalsmengen ist unabhängig von Multikollinearität im Datensatz.
Korrelieren die Merkmalsmengen kaum untereinander, dann resultieren abhängig von der Reihenfolge der Aufnahme der Merkmalsmengen oftmals sehr unterschiedliche Ergebnisse.
Resultieren in Abhängigkeit der Reihenfolge der Aufnahme der Merkmalsmengen unterschiedliche Regressionsmodelle, liefert dies einen Hinweis auf Multikollinearität.

19 Welche der folgenden Aussage(n) über das multiple Bestimmtheitsmaß R² einer hierarchischen Regression sind wahr?

Die Aufnahme von 50 % aller Merkmalsmengen führt in jedem Fall zu einem multiplen Bestimmtheitsmaß R² größer als 25 %.
Ob eine Merkmalsmenge zu einer signifikanten Zunahme an Bestimmtheitsmaß führt, kann davon abhängen, in welchem Schritt die betreffende Merkmalsmenge aufgenommen wird.
Das multiple Bestimmtheitsmaß R² nimmt ab, je mehr Merkmalsmengen ins Regressionsmodell aufgenommen werden.
Das multiple Bestimmtheitsmaß R² nimmt für die Aufnahme aller verfügbaren Merkmalsmengen ins Regressionsmodell den maximal möglichen Wert an.

20 Die Kriteriumsvariable Y soll durch die Merkmalsmengen A (Prädiktor 1 und 3), B (Prädiktor 2 und 4) und C (Prädiktor 5, 6 und 7) vorhergesagt werden. Es wird eine hierarchische Regression angewandt. Zunächst wird die Merkmalsmenge A ins Modell einbezogen. Das ermittelte multiple Bestimmtheitsmaß R² beträgt 0.65. Im Anschluss wird die Merkmalsmenge C ins Modell ins Regressionsmodell aufgenommen. Dies führt zu einer Zunahme des multiplen Bestimmtheitsmaßes R² um 0.30. In einer zweiten Analyse basierend auf dem gleichen Datensatz wird eine andere Reihenfolge der Aufnahme der Merkmalsmengen gewählt. Welche der folgenden Ergebnisse sind in dieser zweiten Analyse möglich?

Aufnahme Merkmalsmenge C → R² = 0.60; anschließend Aufnahme Merkmalsmenge A → Anstieg R² um 0.35
Aufnahme Merkmalsmenge B → R² = 0.85; anschließend Aufnahme Merkmalsmenge A → Anstieg R² um 0.20
Aufnahme Merkmalsmenge C → R² = 0.75; anschließend Aufnahme Merkmalsmenge A → Anstieg R² um 0.15
Aufnahme Merkmalsmenge B → R² = 0.40; anschließend Aufnahme Merkmalsmenge C → Anstieg R² um 0.40

21 Was versteht man unter einem Standardfehler der Schätzung eines Regressionskoeffizienten, welcher bei der Durchführung einer einfachen oder multiplen linearen Regression berechnet wird?

Standardfehler stellen die Abweichungen der Schätzwerte von den gemessenen Werten, also die Abweichungen der Messwerte von der Regressionsgerade, dar.
Standardfehler beschreiben wie präzise der Regressionskoeffizient durch das Modell geschätzt werden kann.
Standardfehler der Regressionskoeffizienten beschreiben die Regressionskoeffizienten, welche entstehen, wenn vor der Regression alle beteiligten Prädiktoren und die Kriteriumsvariable z-standardisiert werden.
Standardfehler stellen die Koeffizienten der Regressionsfunktion, die sich als Schätzungen nach der Methode der kleinsten Quadrate ergeben, dar.

22 Welche der folgenden Größen werden direkt von der Höhe des Regressionskoeffizienten des Standardfehlers beeinflusst, da der Standardfehler in die Berechnung der entsprechenden Größe einfließt?

Regressionskoeffizient
t-Wert
p-Wert
Bestimmtheitsmaß

23 Wie verändert sich der Wert des Standardfehlers des Regressionskoeffizienten in der einfachen linearen Regression in Abhängigkeit vom Betrag der Korrelation zwischen Prädiktor und Kriterium?

Je höher der Betrag der Korrelation zwischen Prädiktor und Kriterium, desto geringer ist der Wert des Standardfehlers des Regressionskoeffizienten des Prädiktors.
Es gibt keinen Zusammenhang zwischen dem Betrag der Korrelation von Prädiktor und Kriterium und der Höhe des Standardfehlers des Regressionskoeffizienten des Prädiktors.
Es besteht ein umgekehrt u-förmiger Zusammenhang zwischen der Höhe des Betrages der Korrelation von Prädiktor und Kriterium und der Höhe des Standardfehlers des Regressionskoeffizienten des Prädiktors.
Je höher der Betrag der Korrelation zwischen Prädiktor und Kriterium, desto höher ist der Standardfehler des Regressionskoeffizienten des Prädiktors.

24 Gegeben sei die folgende Situation: Es wird eine multiple lineare Regression mit zwei Prädiktoren durchgeführt. Welchen Einfluss besitzt die Höhe des Betrages der Korrelation zwischen den beiden Prädiktoren unter diesen Bedingungen?

Je höher der Betrag der Korrelation zwischen den Prädiktoren ist, desto höher sind die Regressionskoeffizienten der Prädiktoren.
Je höher der Betrag der Korrelation zwischen den Prädiktoren ist, desto größer sind die Standardfehler der Regressionskoeffizienten der Prädiktoren.
Je höher der Betrag der Korrelation zwischen den Prädiktoren ist, desto höher ist die Wahrscheinlichkeit, dass nur einer oder keiner der beiden Prädiktoren im Ergebnis der Regressionsanalyse einen signifikanten Regressionskoeffizienten besitzt.
Je höher der Betrag der Korrelation zwischen den Prädiktoren ist, desto kleiner sind die Standardfehler der Regressionskoeffizienten der Prädiktoren.

25 Führt man eine multiple lineare Korrelation mit mehreren untereinander hoch korrelierenden Prädiktoren durch, welche ebenfalls alle hohe Korrelationen mit der Kriteriumsvariablen aufweisen, kann dies dazu führen, dass im Ergebnis der Regression nur ein einzelner dieser Prädiktoren einen signifikant hohen Regressionskoeffizienten erhält. Worauf ist dies zurückzuführen?

Redundanz
Suppression
Hierarchie
Introjektion

26 Was versteht man in der Statistik unter einer Moderatorvariable?

Eine Moderatorvariable bezeichnet eine Variable C, von deren Ausprägung abhängig ist, wie groß der Einfluss einer Variable A auf Variable B ist.
Eine Moderatorvariable bezeichnet eine Variable A, welche einen Zusammenhang zu einer Variablen B besitzt, welche unabhängig von der Ausprägung weiterer Einflussvariablen konstant ist.
Eine Moderatorvariable bezeichnet eine Variable A, welche in Abhängigkeit der Ausprägung einer Variable C durch Variable B beeinflusst wird.
Eine Moderatorvariable bezeichnet eine Variable C, welche den Einfluss einer Variable A auf eine Variable B vermittelt.

27 Im Rahmen einer multiplen linearen Regression kann die Analyse von Moderatoreffekten erfolgen. Angenommen wir möchten durch unsere Untersuchung das Kriterium Leistungsmotivation durch die Prädiktoren Intelligenz und Gewissenhaftigkeit vorhersagen und nehmen aufgrund inhaltlicher Überlegungen an, dass Gewissenhaftigkeit einen Moderator des Zusammenhangs zwischen Intelligenz und Leistungsmotivation darstellt. Wie kann eine solche Analyse erfolgen?

Bildung eines Interaktionsterms als Summe von Prädiktor Intelligenz und potenzieller Moderatorvariable Gewissenhaftigkeit und Aufnahme dieses Interaktionsterms in die multiple lineare Regression zur Vorhersage der Kriteriumsvariable Leistungsmotivation
Durchführung einer multiplen linearen Regression zur Vorhersage der Variable Gewissenhaftigkeit durch Intelligenz und Leistungsmotivation, ein hohes Bestimmtheitsmaß > 90 % liefert einen starken Hinweis auf das Vorliegen eines Moderatoreffekts
Bildung eines Interaktionsterms als Produkt von Prädiktor Intelligenz und potenzieller Moderatorvariable Gewissenhaftigkeit und Aufnahme dieses Interaktionsterms in die multiple Regression zur Vorhersage der Kriteriumsvariable Leistungsmotivation
Bildung eines Interaktionsterms als Quotient von Prädiktor Intelligenz und potenzieller Moderatorvariable Gewissenhaftigkeit und Aufnahme dieses Interaktionsterms in die multiple lineare Regression zur Vorhersage der Kriteriumsvariable Leistungsmotivation

28 Im Folgenden sehen Sie die Ergebnisausgaben verschiedener multipler linearer Regressionen zur Untersuchung von potenziellen Moderatoreffekten von Prädiktor 2 auf die Stärke des Zusammenhangs zwischen Prädiktor 1 und der Kriteriumsvariable. Der Interaktionsterm stellt dabei das Produkt von Prädiktor 1 und 2 dar. Welche Ergebnisausgaben lassen auf einen signifikanten Moderatoreffekt schließen?

3 8 MC Tab1.PNG
3 8 MC Tab2.PNG
3 8 MC Tab3.PNG
3 8 MC Tab4.PNG

29 Zur Analyse von Moderatoreffekten können zusätzlich zur Anwendung einer multiplen linearen Regression auch grafische Darstellungen verwendet werden. Eine einfache Methode dafür ist die Darstellung von bedingten Regressionsgeraden. In den folgenden Darstellungen wurde dafür ein Median-Split der Werte des Moderators verwendet (blau: Moderator < Median; grün: Moderator > Median). Welche Abbildungen geben einen deutlichen Hinweis auf das Vorliegen eines Moderatoreffekts?

3 8 MC 1.PNG
3 8 MC 4.PNG
3 8 MC 2.PNG
3 8 MC 3.PNG

30 Vor der Analyse eines Moderatoreffektes mithilfe einer multiplen linearen Regression empfehlen beispielsweise Cohen et al. (2003) die Zentrierung aller metrischen Prädiktorvariablen. Warum?

Erhöhung der Wahrscheinlichkeit der Signifikanz des Interaktionsterms
Verminderung von Interpretationsproblemen
Reduktion der Wahrscheinlichkeit der Signifikanz des Interaktionsterms
Erhöhung der Rechengeschwindigkeit