Kapitel 3 · Bivariate deskriptive Statistik
Zusammenhangsmaße für nominale Merkmale
Idee: beobachtet vs. erwartet
Läge kein Zusammenhang vor, sollten sich die gemeinsamen Häufigkeiten allein aus den Randverteilungen ergeben — das Postulat der empirischen Unabhängigkeit:
Die Diskrepanz zwischen beobachteten und erwarteten misst der χ²-Koeffizient:
Probiere es: Ändere die Zellen und beobachte, wie χ² und Cramérs V reagieren. Setzt du die beobachteten gleich den erwarteten Werten, wird χ² = 0.
Normierung: K, K* und Cramérs V
allein ist schlecht vergleichbar (es wächst mit und der Tafelgröße). Daher normiert man mit :
und liegen in . Für »Bier & Kopfweh« ergibt sich , — also nur ein schwacher Zusammenhang (im Test gegen den Kern reproduziert).
Klausurfalle: Diese Maße messen nur die Stärke, nie die Richtung. Und sie nutzen ausschließlich das Nominalniveau — auch bei höher skalierten Merkmalen. „Positiver Zusammenhang“ ist hier sinnlos.
Abruf-Quiz
Frage 1 / 3Tafel [[16,40],[7,28]] (n=91). Welche unter Unabhängigkeit erwartete Häufigkeit gehört in die Zelle „Kopfweh & Bier"? (Zeilensumme 56, Spaltensumme 23)