SSE: Unterschied zwischen den Versionen

Aus eLearning - Methoden der Psychologie - TU Dresden
Zur Navigation springen Zur Suche springen
Keine Bearbeitungszusammenfassung
Keine Bearbeitungszusammenfassung
Zeile 6: Zeile 6:
Wenn ''Y<sub>d</sub>'' die empirischen Y-Werte und ''Y<sub>m</sub>'' die Y-Werte des Modells sind, wird das Vorgehen durch folgende Formel beschrieben:
Wenn ''Y<sub>d</sub>'' die empirischen Y-Werte und ''Y<sub>m</sub>'' die Y-Werte des Modells sind, wird das Vorgehen durch folgende Formel beschrieben:


[[Datei:Sse.png|150px]]
[[Datei:Sse.png|150px]|link=Ausgelagerte_Formeln#SSE|Ausgelagerte Formel Sum of Squared Errors]


Die Fehlerquadratsumme ist eines der häufigsten [[Abweichungsmaße]], da sie maßgebliche Vorteile mit sich bringt:
Die Fehlerquadratsumme ist eines der häufigsten [[Abweichungsmaße]], da sie maßgebliche Vorteile mit sich bringt:

Version vom 12. November 2021, 11:16 Uhr

Die Abkürzung SSE bezeichnet die Fehlerquadratsumme, welche im Englischen Sum of Squared Errors genannt wird. Zur Berechnung dieses Abweichungsmaßes wird für jeden empirischen Datenpunkt die Differenz vom entsprechenden Modellwert ermittelt. Durch Quadrieren und anschließendes Aufsummieren der Werte ergibt sich schließlich die Fehlerquadratsumme.

Plot sse.png

Wenn Yd die empirischen Y-Werte und Ym die Y-Werte des Modells sind, wird das Vorgehen durch folgende Formel beschrieben:

[[Datei:Sse.png|150px]|link=Ausgelagerte_Formeln#SSE|Ausgelagerte Formel Sum of Squared Errors]

Die Fehlerquadratsumme ist eines der häufigsten Abweichungsmaße, da sie maßgebliche Vorteile mit sich bringt:

  • Durch das Quadrieren der Abweichungen werden große Fehler stärker bestraft als kleinere, sodass erstere mehr Gewicht bei der Optimierung bekommen.
  • Ein gegenseitiger Ausgleich positiver und negativer Abweichungen wird verhindert.
  • Nicht zuletzt wird die Fehlerquadratsumme verwendet, weil sie unkompliziert zu implementieren und leicht zu interpretieren ist.

Nachteile und Grenzen der Methode:

  • Ein Problem stellen Ausreißer in den Daten dar, welche das Abweichungsmaß stark verzerren können und dadurch zu einer scheinbar schlechten Passung des Modells führen.
  • Zudem wird jede Differenz zwischen empirischen und entsprechenden Modelldaten gleichwertig in die Berechnung der SSE einbezogen. Dies kann ein Nachteil sein, wenn die Streuung der y-Werte sich für verschiedene x-Werte systematisch unterscheidet (das heißt, wenn Heteroskedastizität vorliegt). Ebenso ist die gleiche Gewichtung unvorteilhaft, wenn ein Teil der Daten für relevanter erachtet wird als ein anderer. Beispielhaft könnte man es für wichtiger halten, dass das Modell den subjektiven Wert über kurze Intervalle gut beschreiben kann. In diesem sowie im vorherigen Fall ist die Verwendung der gewichteten Fehlerquadratsumme eine Lösungsmöglichkeit, bei welcher jeder Abweichung ein eigenes Gewicht zugewiesen werden kann.

Simulationslink neu2.PNG kkk Die Entstehung der Fehleroberfläche aus der Fehlerquadratsumme wird in der R-Shiny-App "Fitting" veranschaulicht.