Statistik

Kapitel 3 · Bivariate deskriptive Statistik

Kontingenztafeln & bedingte Häufigkeiten

📄 Folien:alle Materialien →

Bivariate Daten

Werden an jeder statistischen Einheit zwei Merkmale XX und YY gemeinsam erhoben, spricht man von bivariaten Daten (xi,yi)(x_i, y_i). Die Kernfrage: Gibt es einen Zusammenhang? — als Korrelation (XYX \leftrightarrow Y) oder Regression (XYX \to Y).

Die Kontingenztafel

Für diskrete Merkmale mit Ausprägungen a1,,aka_1,\dots,a_k (X) und b1,,bmb_1,\dots,b_m (Y) zählt man die gemeinsamen Häufigkeiten hij=h(ai,bj)h_{ij} = h(a_i, b_j) und ergänzt um die Randhäufigkeiten:

hi.=j=1mhij,h.j=i=1khij,i,jhij=nh_{i.} = \sum_{j=1}^m h_{ij}, \qquad h_{.j} = \sum_{i=1}^k h_{ij}, \qquad \sum_{i,j} h_{ij} = n

Beispiel »Bier & Kopfweh« (n=91n = 91):

Bierkein Bierhi.h_{i.}
Kopfweh164056
kein Kopfweh72835
h.jh_{.j}236891

Bedingte relative Häufigkeiten

Hält man X=aiX = a_i fest, erhält man die bedingte Verteilung von YY:

fY(bjai)=hijhi.f_Y(b_j \mid a_i) = \frac{h_{ij}}{h_{i.}}

So wird die Verteilung innerhalb einer Teilgruppe sichtbar. Beispiel: Von den 56 Personen mit Kopfweh hatten 16/560,2916/56 \approx 0{,}29 Bier getrunken. Erst der Vergleich mit der Gruppe ohne Kopfweh (7/35=0,207/35 = 0{,}20) deutet auf einen Zusammenhang — den wir im nächsten Abschnitt messbar machen.

Quellen:K02 S.117, K02 S.119, K02 S.123, K02 S.125, K02 S.130, K02 S.132

Abruf-Quiz

Frage 1 / 2

Was sind Rand- bzw. Zeilen-/Spaltensummen einer Kontingenztafel?