Kapitel 2 · Univariate deskriptive Statistik
Streuungsmaße
Warum Streuung?
Ein Lagemaß allein sagt wenig: Zwei Datensätze mit identischem Mittel können völlig unterschiedlich streuen. Streuungsmaße erfassen die Variabilität und zeigen, wie repräsentativ das Zentrum ist.
Spannweite, IQR und Box-Plot
Die Spannweite nutzt nur die Extremwerte (sehr ausreißerempfindlich), der IQR nur die Quartile (robust). Der Box-Plot visualisiert die Fünf-Punkte-Zusammenfassung: Box von bis , Strich am Median, Whisker zu den Extremwerten (nach Tukey maximal , Werte darüber als Ausreißer separat).
Varianz: empirisch vs. Stichprobe
Hier liegt eine zentrale Klausurfalle — zwei Varianten mit unterschiedlichem Nenner:
Die Stichprobenvarianz () ist erwartungstreu und wird in der induktiven Statistik bevorzugt. Die Standardabweichung ist — gleiche Dimension wie die Daten.
Durchgerechnet: »Maßkrug Bier«
Mit und (n = 10):
Dieser Wert wird in den Tests gegen den Rechenkern reproduziert
(tests/fixtures/kapitel-2).
Relative Streuung und nominale Merkmale
- Variationskoeffizient : dimensionslos, vergleicht Streuungen unterschiedlicher Größenordnung. Normiert .
- Gini-Simpson-Index : Streuungsmaß für nominale Merkmale (0 bei maximaler Konzentration).
Übersicht: was darf welches Skalenniveau?
| Skala | Lagemaße | Streuungsmaße |
|---|---|---|
| Nominal | Modus | Gini-Simpson |
| Ordinal | + Median, Quantile | + Spannweite, IQR |
| Intervall | + arithm. Mittel | + Varianz, Standardabw. |
| Verhältnis | + geom. Mittel | + Variationskoeffizient |
Klausurfalle: Steht in der Aufgabe »Varianz«, prüfe den geforderten Nenner (n oder n−1). Beide sind im Rechenkern getrennt (
variancePopulationvs.varianceSample).
Abruf-Quiz
Frage 1 / 4Maßkrug Bier (, ). Wie groß ist die **empirische** Varianz (Teilung durch n)?