Statistik

Kapitel 2 · Univariate deskriptive Statistik

Streuungsmaße

📄 Folien:alle Materialien →

Warum Streuung?

Ein Lagemaß allein sagt wenig: Zwei Datensätze mit identischem Mittel können völlig unterschiedlich streuen. Streuungsmaße erfassen die Variabilität und zeigen, wie repräsentativ das Zentrum ist.

Spannweite, IQR und Box-Plot

R=xmaxxmin,IQR=x0,75x0,25R = x_{max} - x_{min}, \qquad IQR = x_{0{,}75} - x_{0{,}25}

Die Spannweite nutzt nur die Extremwerte (sehr ausreißerempfindlich), der IQR nur die Quartile (robust). Der Box-Plot visualisiert die Fünf-Punkte-Zusammenfassung: Box von x0,25x_{0{,}25} bis x0,75x_{0{,}75}, Strich am Median, Whisker zu den Extremwerten (nach Tukey maximal 1,5×IQR1{,}5\times IQR, Werte darüber als Ausreißer separat).

Varianz: empirisch vs. Stichprobe

Hier liegt eine zentrale Klausurfalle — zwei Varianten mit unterschiedlichem Nenner:

s~2=1ni=1n(xixˉ)2empirische Varianzs2=1n1i=1n(xixˉ)2Stichprobenvarianz\underbrace{\tilde s^2 = \frac{1}{n}\sum_{i=1}^{n}(x_i-\bar x)^2}_{\text{empirische Varianz}} \qquad \underbrace{s^2 = \frac{1}{n-1}\sum_{i=1}^{n}(x_i-\bar x)^2}_{\text{Stichprobenvarianz}}

Die Stichprobenvarianz (/(n1)/(n-1)) ist erwartungstreu und wird in der induktiven Statistik bevorzugt. Die Standardabweichung ist s=s2s = \sqrt{s^2} — gleiche Dimension wie die Daten.

Durchgerechnet: »Maßkrug Bier«

Mit xˉ=2,2\bar x = 2{,}2 und i(xixˉ)2=31,6\sum_i (x_i - \bar x)^2 = 31{,}6 (n = 10):

s~2=31,610=3,16,s2=31,69=3,51,s=3,511,9\tilde s^2 = \frac{31{,}6}{10} = 3{,}16, \qquad s^2 = \frac{31{,}6}{9} = 3{,}51\ldots, \qquad s = \sqrt{3{,}51} \approx 1{,}9

Dieser Wert wird in den Tests gegen den Rechenkern reproduziert (tests/fixtures/kapitel-2).

Relative Streuung und nominale Merkmale

  • Variationskoeffizient v=s/xˉv = s/\bar x: dimensionslos, vergleicht Streuungen unterschiedlicher Größenordnung. Normiert v=v/n[0,1]v^* = v/\sqrt{n} \in [0,1].
  • Gini-Simpson-Index vG=jfj(1fj)v_G = \sum_j f_j(1-f_j): Streuungsmaß für nominale Merkmale (0 bei maximaler Konzentration).

Übersicht: was darf welches Skalenniveau?

SkalaLagemaßeStreuungsmaße
NominalModusGini-Simpson
Ordinal+ Median, Quantile+ Spannweite, IQR
Intervall+ arithm. Mittel+ Varianz, Standardabw.
Verhältnis+ geom. Mittel+ Variationskoeffizient

Klausurfalle: Steht in der Aufgabe »Varianz«, prüfe den geforderten Nenner (n oder n−1). Beide sind im Rechenkern getrennt (variancePopulation vs. varianceSample).

Quellen:K02 S.92, K02 S.93, K02 S.94, K02 S.102, K02 S.105, K02 S.107, K02 S.109, K02 S.112, K02 S.115

Abruf-Quiz

Frage 1 / 4

Maßkrug Bier 1,0,3,4,4,2,0,3,0,51,0,3,4,4,2,0,3,0,5 (xˉ=2,2\bar x=2{,}2, (xixˉ)2=31,6\sum(x_i-\bar x)^2=31{,}6). Wie groß ist die **empirische** Varianz s~2\tilde s^2 (Teilung durch n)?