Aufgaben - Fitting & Modellvergleich

zurück zu Aufgaben - Kognitive Modellierung
Navigation

Der folgenden Bereich enthält Fragen zum Prozess des Fittings und dem Vergleich von Modellen. Alle Fragen sind Multiple Choice Fragen, d.h. es können immer mehrere Antworten richtig sein. Klicken Sie zur Beantwortung einer Frage die korrekten Antwortmöglichkeiten an. Um Ihre Ergebnisse auszuwerten, wählen Sie bitte den Button "Speichern" am unteren Ende der Seite.

Für jede vollständig richtig beantwortete Frage erhalten Sie einen Punkt. Für falsche beantwortete Fragen werden Ihnen keine Punkte abgezogen. Sie können diese Einstellung jedoch beliebig verändern. Ihre Gesamtpunktzahl finden Sie am unteren Seitenende.

Pluspunkt für eine richtige Antwort:
Punkte für eine falsche Antwort:
Ignoriere die Fragen-Koeffizienten:

	Die Passung des Modells zu den Daten wird auf Werte zwischen 0 und 1 normiert.
	Das Fehlermaß wird besser interpretierbar.
	Sehr kleine Werte des Fehlermaßes werden vermieden.
	Der Rechenaufwand verringert sich durch die Vermeidung von Multiplikation.

	Zwei Modelle, welche gleich gut in der Lage sind, vorliegende empirische Daten zu beschreiben, können in Abhängigkeit ihrer Komplexität unterschiedliche Vergleichsmaßwerte besitzen. Je komplexer das Modell ist, desto höher sind diese Werte.
	Vergleichsmaße berücksichtigen neben der Vorhersagefähigkeit des Modells die Anzahl der verwendeten Parameter.
	Zwei Modelle, welche gleich gut in der Lage sind, vorliegende empirische Daten zu beschreiben, können in Abhängigkeit ihrer Komplexität unterschiedliche Vergleichsmaßwerte besitzen. Je weniger komplex das Modell ist, desto höher sind diese Werte.
	Vergleichsmaße berücksichtigen neben der Vorhersagefähigkeit des Modells die Komplexität der verwendeten Berechnungsvorschrift.

	Die Datenpunkte müssen statistisch voneinander abhängig sein.
	Die Verteilung der Daten muss bekannt sein.
	Die Daten müssen eine geringe Streuung haben.
	Die Stichprobe muss möglichst groß sein.

	viele freie Parameter führen zu „Overfitting“
	eine hohe Parameteranzahl kann dazu führen, dass das Modell nur schlecht zur korrekten Vorhersage neuer Daten in der Lage ist
	eine zu geringe Parameteranzahl führt zu „Underfitting“
	eine hohe Parameteranzahl kann dazu führen, dass das Modell nur unzureichend zur Beschreibung der vorliegenden Daten geeignet ist

	Ein quantitativer Modellvergleich sollte eingesetzt werden, wenn stärkeres Interesse am relativen Verhältnis der empirischen und simulierten Daten besteht.
	Ein qualitativer Modellvergleich ermittelt den Fit zwischen den empirisch erhobenen und den basierend auf dem Modell simulierten Daten zur Bestimmung der Vorhersagegüte des Modells.
	Ein qualitativer Modellvergleich untersucht die Übereinstimmung der Datenmuster zwischen empirischen und simulierten Daten.
	Ein qualitativer Modellvergleich sollte eingesetzt werden, wenn es sich beim Untersuchungsgegenstand um ein sehr komplexes Phänomen handelt.

	„Measure of Surprise Methode“
	Untersuchung des Fits zwischen empirisch erhobenen und simulierten Daten
	Untersuchung der Übereinstimmung des Modells mit bestehenden Theorien
	Untersuchung der Übereinstimmung von Datenmustern

	Es müssen viele Punkte der Fehlerfunktion gleichzeitig evaluiert werden.
	Optima, die weit weg vom Startpunkt liegen, können übersehen werden.
	Ein gefundenes Optimum kann im Verlauf wieder verloren gehen.
	Lokale Minima können nicht verlassen werden.

	Der Simplex wird komprimiert.
	Der expandierte Punkt wird berechnet.
	Der kontrahierte Punkt wird berechnet.
	Der reflektierte Punkt ersetzt direkt das bisherige Minimum.

	den Vektor, der in Richtung des steilsten Gefälles zeigt
	die einfachste Form, die sich in einem Raum mit gegebener Dimensionalität aufspannen lässt
	den Punkt mit dem geringsten Wert der Fehlerfunktion
	den einfachsten Weg vom Startpunkt zum Minimum

	Wahl ungünstiger Startparameterwerte
	vorzeitiger Abbruch des Algorithmus an Stellen mit sehr flachem Anstieg
	Stagnation des Algorithmus aufgrund globaler Minima
	Abbruch des Algorithmus aufgrund zu hoher Komplexität der Fehlerfunktion

	die Anzahl der Individuen pro Population
	den Wert der Fehlerfunktion
	die Ausdauer des Algorithmus beim Suchen des Minimums
	die Parameterwertkombination eines Punktes

	Fehlerquadratsumme
	Cohen's d
	Maximale Plausibilität
	Log-Likelihood

	Ein gegenseitiger Ausgleich positiver und negativer Abweichungen wird verhindert.
	Große Abweichungen bekommen durch das Quadrieren mehr Gewicht bei der Optimierung als kleine.
	Datenpunkte am Rand der Punktewolke werden weniger stark gewichtet als Datenpunkte in der Mitte.
	Die Fehlerquadratsumme ist als bedingte Wahrscheinlichkeit für die Daten bei einer bestimmten Verteilung zu interpretieren.

	Stichprobengröße > 12: BIC des Modells ist größer als AIC
	AIC und BIC sind unabhängig von der Stichprobengröße des Modells
	Berechnungen von AIC und BIC basieren auf den Log-Likelihoodwerten der Modelle
	Log-Likelihoodwert ist umso kleiner, je besser das Modell die realen Daten vorhersagen kann

	Sie beeinflusst die Wahrscheinlichkeit, dass ein zufällig erzeugter Nachbarpunkt schlechter ist.
	Sie sorgt dafür, dass gegen Ende der Optimierung ein gefundener Tiefpunkt selten verlassen wird.
	Sie beeinflusst die Anzahl der Nachbarpunkte, die zur Auswahl stehen.
	Sie beeinflusst die Wahrscheinlichkeit, mit der ein schlechterer Punkt akzeptiert wird.

	ist ein Modell in der Lage, Verhalten zu zeigen oder Daten hervorzubringen, welche aufgrund theoretischer Überzeugung vorhergesagt wurden, ist es redundant und sollte verworfen werden
	die Fähigkeit eines Modells ein unerwartetes Ereignis vorherzusagen liefert stärkere Evidenz für die Gültigkeit eines Modells als die Vorhersagefähigkeit eines bereits bekannten Ereignisses
	die Fähigkeit eines Modells ein bereits bekanntes Ereignis vorherzusagen liefert stärkere Evidenz für die Gültigkeit eines Modells als die Vorhersage eines unerwarteten komplexen Ereignisses
	ist ein Modell in der Lage, Verhalten zu zeigen oder Daten hervorzubringen, welche aufgrund theoretischer Überzeugung vorhergesagt wurden, stellt dies Evidenz für das entsprechende Modell dar

	zufällige Wahl von Punkten der Fehleroberfläche
	Bewegung in Richtung des steilsten Gefälles
	Generierung neuer Punkte durch Reproduktion, Rekombination und Mutation
	Akzeptanz der Verschlechterung des Funktionswertes mit sinkender Wahrscheinlichkeit

	„Noise“ führt zu Abweichungen zwischen den gemessenen Daten und den wahren Daten
	Verzerrungseffekte und Messfehler führen zu Rauschen (= „Noise“) in den Ergebnisdaten
	wird eine große Anzahl an Parametern zur Modellierung verwendet, werden nur die wahren Werte modelliert und nicht das der in den Daten enthaltene „Noise“
	wird zusätzlich zur Modellierung der wahren Werten auch der in den wahren Werten enthaltene „Noise“ modelliert, spricht man von „overfitting“

	wenn keine Annahmen über die Relevanz bestimmter Datenpunkte vorliegen
	wenn ein bestimmter Teil der Daten als relevanter erachtet wird als der Rest
	wenn Ausreißer die Fehlerquadratsumme verzerren
	wenn Heteroskedastizität vorliegt

	Prozess der vereinfachten Beschreibung eines wirklichen Systems, um das Verständnis der natürlichen Realität zu erhöhen
	Prozess der Verwendung eines Beispieldatensatzes zur Schätzung der Parameterwerte eines Modells, um diese bestmöglich an den Datensatz anzupassen
	Prozess der Analyse von Systemen durch die Ausführung von Experimenten an einem Modell, um Erkenntnisse über das reale System zu gewinnen
	Prozess der Implementierung eines Entwurfs in den Quellcode einer Programmiersprache

	Die Daten jeder Versuchsperson werden einzeln gefittet.
	Parameter werden nach ihrer Bedeutsamkeit für das Modell sortiert.
	Für alle Versuchspersonen wird ein gemeinsames Parameterset ermittelt.
	Verschiedene Parameter können auf verschiedenen Ebenen geschätzt werden.

	p-Wert
	Maximum Likelihood
	α-Fehler
	Fehlerquadratsummen

	es werden nicht nur wahre Werte modelliert, sondern auch das in den Daten enthaltene Rauschen
	kann auftreten, wenn ein Modell nur sehr wenige freie Parameter besitzt
	ein „overfitted“ Modell erklärt die zur Modellentwicklung verwendeten Daten meist sehr gut
	ein „overfitted“ Modell ist gut zur korrekten Vorhersage neuer Daten in der Lage

	Ermittlung der Regressionskoeffizienten bei der linearen Regression
	Gradientensuchverfahren
	Simplex Algorithmus
	Genetische Algorithmen

	Erschwerung der Parameterinterpretierbarkeit
	„underfitted“ Modell
	Erhöhung der Fehleranfälligkeit bestimmter Fittingalgorithmen
	„overfitted” Modell

	eine Fehlerfunktion ermöglicht die schrittweise Veränderung der Parameterwerte, um das Modell besser an den gegebenen Datensatz anzupassen
	eine Fehlerfunktion berechnet, wie sehr das Modell von den Daten abweicht
	ein Fittingalgorithmus ermöglicht die schrittweise Veränderung der Parameterwerte, um das Modell besser an den gegebenen Datensatz anzupassen
	empirische Ergebnisse und simulierte Daten werden durch eine Fehlerfunktion verglichen

	um eine Fehlerfunktion zu erstellen
	um die Streuung der Modelldaten auszudrücken
	um zu quantifizieren, wie gut Modelldaten und empirische Daten zusammenpassen
	um das unzuverlässige Fitten nach Augenmaß zu vermeiden

	Ein gefundenes Optimum kann im Verlauf wieder verloren gehen.
	Lokale Minima können nicht verlassen werden.
	Es müssen viele Punkte der Fehlerfunktion gleichzeitig evaluiert werden.
	Optima, die weit weg vom Startpunkt liegen, können übersehen werden.

	Güte der deskriptiven Beschreibung der Daten
	Interpretierbarkeit des Modells und seiner Parameter
	Plausibilität der Annahmen
	Generalisierbarkeit auf alle bereits vorhandenen Modelle

	globales Maximum
	Sattelpunkt
	lokales Minimum
	globales Minimum

	Algorithmen mit Zufallskomponente benutzen, durch die lokale Minima verlassen werden können
	grafische Veranschaulichung der Fehleroberfläche
	mehrfaches Anwenden des Algorithmus mit verschiedenen Startpunkten
	analytische Lösung

	Zusätzlich zur Übereinstimmung empirischer und simulierter Daten sollte bei einem Modellvergleich die Komplexität der jeweiligen Modelle berücksichtigt werden, welche sich in der Art und Anzahl wichtiger Annahmen und Parameter des Modells zeigt.
	Zusätzlich zur Übereinstimmung empirischer und simulierter Daten sollte bei einem Modellvergleich die Komplexität der jeweiligen Modelle berücksichtigt werden, welche sich in der Übereinstimmung mit bereits existierenden Modellen zeigt.
	Durch die Verwendung von Vergleichsmaßen ist es möglich gleichermaßen Komplexität und Vorhersagefähigkeit bei der Modellauswahl zu berücksichtigen.
	Durch die Verwendung von Parameterschätzverfahren ist es möglich gleichermaßen Komplexität und Vorhersagefähigkeit bei der Modellauswahl zu berücksichtigen.

	Simulated Anneahling
	Gradientensuchverfahren
	Ermittlung der Regressionskoeffizienten bei der logistischen Regression
	Ermittlung von Mittelwert und Standardabweichung bei der Ex-Gauß Verteilung

	Es kann keine Fehlerfunktion bestimmt werden.
	Die Komplexität der Modelle ist sehr hoch.
	Es existiert kein globales Minimum.
	Die Fehleroberfläche ist sehr komplex.

	ein Abbruchkriterium
	Kenntnis aller Punkte der Fehleroberfläche
	Startparameterwerte
	eine Fehlerfunktion

	Lokale Minima können nicht verlassen werden.
	Der Algorithmus akzeptiert die Verschlechterung des Funktionswertes im nächsten Schritt.
	Bei zu großer Schrittweite können schmale Täler der Fehleroberfläche übersprungen werden.

	Hierarchische Modellierung
	Summationsebene
	Individualebene
	Aggregatebene

	Analytische Lösungen führen zu reproduzierbaren und objektiven Ergebnissen.
	Numerische Lösungen ermöglichen die Ermittlung einer interessierenden Größe durch eine endliche Anzahl von Schritten mittels Standardoperationen.
	Analytische Lösungen ermöglichen die Ermittlung einer interessierenden Größe durch eine endliche Anzahl von Schritten mittels Standardoperationen.
	Numerische Lösungen verursachen in der Regel einen geringeren Rechenaufwand als analytische Lösungen.

	wie sehr die Parameterwerte im folgenden Stimulationsschritt verändert werden müssen
	wie sehr die Anzahl an freien Parametern die Komplexität des Modells bestimmt
	wie sehr durch das Modell simulierte Daten von den erhobenen Daten abweichen
	wie sehr die Anzahl an freien Parametern zu Rauschen in den Daten führt

	ungünstige Parameterschätzwerte können zu einer fehlerhaften Modellauswahl führen
	ungünstige Parameterschätzwerte können zur Überschätzung der Vorhersagefähigkeit eines Modells führen
	ungünstige Parameterschätzwerte können zur Unterschätzung der Vorhersagefähigkeit eines Modells führen
	ungünstige Parameterschätzwerte können zur Instabilität der Einschätzung der Vorhersagefähigkeit eines Modells führen

	Evolution
	Mutation
	Reproduktion
	Rekombination
	Intuition
	Reanimation

Aufgaben - Fitting & Modellvergleich

Navigationsmenü

Suche