Statistik

Kapitel 2 · Univariate deskriptive Statistik

Kumulierte Häufigkeiten

📄 Folien:alle Materialien →

Kumulieren setzt Ordnung voraus

Bei mindestens ordinalskalierten Merkmalen lassen sich die geordneten Ausprägungen a1<<aka_1 < \dots < a_k sinnvoll aufsummieren. Die kumulierten Häufigkeiten beantworten: „Welcher Anteil der Daten ist x\le x?“

H(x)=i:aixhi,F(x)=i:aixfiH(x) = \sum_{i\,:\,a_i \le x} h_i, \qquad F(x) = \sum_{i\,:\,a_i \le x} f_i

FF heißt empirische Verteilungsfunktion (»empirisch« = aus konkreten Daten berechnet, im Unterschied zur Verteilungsfunktion einer Zufallsvariablen).

Eigenschaften

HH und FF sind monoton wachsende Treppenfunktionen, die an den Ausprägungen um hih_i bzw. fif_i nach oben springen. An den Sprungstellen gilt der obere Wert (Treppenkante). Außerdem:

F(x)=0   fu¨x<a1,F(x)=1   fu¨xak.F(x) = 0 \;\text{ für } x < a_1, \qquad F(x) = 1 \;\text{ für } x \ge a_k .

Die Quantile (nächster Abschnitt) sind gerade die Umkehrung dieser Funktion.

Beispiel »Maßkrug Bier«

xx012345
H(x)H(x)3457910
F(x)F(x)0,30,40,50,70,91,0

Ablesebeispiel: F(2)=0,5F(2) = 0{,}5 — die Hälfte der Absolventen trank höchstens 2 Maß.

Quellen:K02 S.56, K02 S.57, K02 S.59, K02 S.61

Abruf-Quiz

Frage 1 / 2

Maßkrug Bier 1,0,3,4,4,2,0,3,0,51,0,3,4,4,2,0,3,0,5: Welcher Wert hat die empirische Verteilungsfunktion F(2)F(2)? (Anteil der Werte 2\le 2)