Zufallsgröße
Zufallsgrößen (auch Zufallsvariablen) ordnen jedem möglichen Ergebnis einer Zufallssituation eine Zahl zu oder anders: der Wert einer Zufallsgröße hängt vom Zufall ab, z.B. die Augensumme mehrerer geworfener Würfel.
Eigenschaften
- Erwartungswert: ein nach der Wahrscheinlicheit der Werte gewichtetes Mittel
- Varianz: Streuung von Werten um einen Mittel- oder Erwartungswert, bzw. die durchschnittliche quadratische Abweichung von Werten einer Zufallsgröße von ihrem Erwartungswert.
- Standardabweichung: Ein Streuungsmaß, das die durchschnittliche Abweichung der Werte einer Zufallsgröße von ihrem Erwartungswert angibt, also die Wurzel der Varianz
- Für Summen von Zufallsgrößen gilt unter der Annahme, dass die Größen unabhängig sind:
- Für konstante Faktoren in den Summen gilt:
Diskret & Kontinuierlich
Zufallsgrößen können diskret oder kontinuierlich sein. Diskret bedeutet, dass die Größe eine abzählbare bzw. endliche Anzahl von Werten annehmen kann, z.B. kann das Ergebnis beim Werfen eines (idealen) Würfels nur sechs verschiedene Augenzahlen annehmen. Kontinuierliche Zufallsgrößen können hingegen innerhalb eines Intervalls unendlich viele Werte annehmen.
Diskrete Zufallsgrößen werden durch eine Wahrscheinlichkeitsfunktion beschrieben, die die Wahrscheinlichkeit jedes Werts angibt. Kontinuierliche Zufallsgrößen werden mit einer Wahrscheinlichkeitsdichtefunktion beschrieben. Dabei werden allerdings nicht die Funktionswerte einzelner Werte ermittelt, sondern es wird das Integral eines bestimmten Intervalls in der Zufallsgröße gebildet. Dieses Intervall gibt die Wahrscheinlichkeit an, dass die Zufallsgröße Werte in diesem Intervall annimmt. Eine Übersicht zu diskreten und kontinuierlichen Zufallsgrößen haben unter anderem GeeksForGeeks erstellt (Stand Mai 2024).
Verteilungen
Die Verteilung einer Zufallsgröße beschreibt, wie die möglichen Werte dieser Größe über verschiedene Ereignisse oder Experimente verteilt sind. Einige der wichtigsten Verteilungen werden im Folgenden beschrieben. In den Formeln steht X jeweils für eine Zufallsgröße, die die Ereignisse oder Ergebnisse eines Experiments repräsentiert, x für einen spezifischen Wert oder eine Ausprägung der Zufallsgröße X und P(X = x) als die Wahrscheinlichkeit, dass die Zufallsgröße X den Wert x annimmt.
Diskrete Verteilungen
- Gleichverteilung (Uniformverteilung): alle möglichen Ergebnisse eines Experiments sind gleich wahrscheinlich. Die Wahrscheinlichkeitsfunktion ist konstant über einem Intervall. Sie wird beschrieben durch die Formel für mit a und b als Intervallgrenzen
- Bernoulli-Verteilung: ein einmaliges binäres Experiment, bei dem es nur zwei mögliche Ergebnisse gibt (Erfolg oder Misserfolg). Sie wird oft verwendet, um den Erfolg oder Misserfolg einer einzelnen Bernoulli-Trial zu modellieren. Ihre Formel ist für und mit p als die Wahrscheinlichkeit für einen Erfolg in der Bernoulli- oder Binomialverteilung
- Binomialverteilung: beschreibt die Anzahl der Erfolge in einer festen Anzahl von unabhängigen Bernoulli-Trials. Sie wird verwendet, wenn jedes Experiment nur zwei mögliche Ergebnisse hat und die Wahrscheinlichkeit für Erfolg und Misserfolg konstant ist. Ihre Formel ist für , wobei k die Anzahl der Erfolge in der Binomialverteilung ist
- Poisson-Verteilung: modelliert die Anzahl der Ereignisse in einem festen Intervall, wenn die Ereignisse mit einer konstanten Rate und unabhängig voneinander auftreten. Sie wird häufig für die Modellierung seltener Ereignisse verwendet. Ihre Formel ist für , wobei k die Anzahl der Ereignisse in der Poisson-Verteilung und die Rate der Ereignisse in der Poisson-Verteilung ist
Kontinuierliche Verteilungen
- Normalverteilung (Gauß-Verteilung): gekennzeichnet durch ihre Glockenkurve und wird häufig verwendet, um natürliche Phänomene zu modellieren, bei denen die Daten um einen Mittelwert herum symmetrisch verteilt sind. Ihre Formel ist mit als Mittelwert und als die Standardabweichung der Normalverteilung.
- Exponentialverteilung: beschreibt die Zeit zwischen unabhängigen Ereignissen in einem Poisson-Prozess. Sie wird oft verwendet, um die Dauer von Wartezeiten zu modellieren. Ihre Formel ist für und mit als Rate der Exponentialverteilung
- Chi-Quadrat-Verteilung: tritt häufig in der Inferenzstatistik auf, insbesondere bei der Bestimmung von Konfidenzintervallen und der Berechnung von Teststatistiken für Chi-Quadrat-Tests. Ihre Formel ist für und mit k als Anzahl der Freiheitsgrade
- Student's t-Verteilung: wird in der Inferenzstatistik verwendet, insbesondere wenn die Stichprobengröße klein ist und die Standardabweichung der Population unbekannt ist. Zu dieser Verteilung gibt es innerhalb des E-Learnings eine eigene Seite.
- F-Verteilung: F-Verteilung wird verwendet, um die Variabilität von Stichprobenvarianzen zu modellieren und um Hypothesentests in Bezug auf die Varianzen durchzuführen. Auch hierzu gibt es eine eigene Seite.