Kapitel 2 · Univariate deskriptive Statistik
Lagemaße
Das Zentrum einer Verteilung
Lagemaße verdichten die Daten zu einem »typischen« Wert. Setze selbst Punkte und
beobachte, wie Mittel und Median auf einen Ausreißer reagieren:
Arithmetisches Mittel
xˉ=n1i=1∑nxi=n1j=1∑kajhj=j=1∑kajfj
Es entspricht dem physikalischen Schwerpunkt, ist nur ab Intervallskala
sinnvoll und empfindlich gegenüber Ausreißern.
Der Median ist der Wert in der Mitte der geordneten Reihe
x(1)≤⋯≤x(n):
xmed=⎩⎨⎧x(2n+1)21(x(2n)+x(2n+1))n ungeraden gerade
Er ist robust (ab Ordinalskala) und bei wenigen Werten, Asymmetrie oder
Ausreißerverdacht zu bevorzugen.
Modus und geometrisches Mittel
- Modus xmod: häufigste Ausprägung, bereits für nominale Merkmale.
- Geometrisches Mittel xgeom=nx1⋯xn: für
Wachstums-/Zinsfaktoren. Beispiel: Faktoren 1,02,1,07,1,05 →
31,02⋅1,07⋅1,05≈1,0466 (≈ 4,66 % p. a.).
Quantile und Fünf-Punkte-Zusammenfassung
Das p-Quantil xp trennt die Daten so, dass mindestens p⋅100%
darunter liegen:
xp={x(⌈np⌉)21(x(np)+x(np+1))np∈/Znp∈Z
Spezialfälle: x0,5 = Median, x0,25 = unteres, x0,75 = oberes
Quartil. Die Fünf-Punkte-Zusammenfassung xmin,x0,25,xmed,x0,75,xmax fasst die Verteilung kompakt zusammen (Basis des Box-Plots).
Lageregel als Schiefe-Indikator: Je stärker sich xˉ, xmed und
xmod unterscheiden, desto schiefer die Verteilung.
Median der Werte 1,0,3,4,4,2,0,3,0,5? (n=10, geordnet)