Kapitel 3 · Bivariate deskriptive Statistik
Kovarianz & Korrelation
Vom Streudiagramm zur Kovarianz
Das Streudiagramm (Scatterplot) zeigt die Punktwolke . Die Abweichungsprodukte sind positiv im 1./3. Quadranten (bezogen auf den Schwerpunkt ) und negativ im 2./4. Ihre Summe, geteilt durch , ist die empirische Kovarianz:
Sie ist positiv/negativ je nach Richtung — aber nicht normiert (sie hängt von den Maßeinheiten ab). Die Kovarianz mit Nenner heißt .
Pearson-Korrelation
Teilt man die Kovarianz durch das Produkt der Standardabweichungen, erhält man den dimensionslosen Bravais-Pearson-Korrelationskoeffizienten:
Ziehe selbst Punkte und beobachte , die Regressionsgerade und live:
Faustregel: schwach, mittel, stark.
Spearman, Ausreißer und Anscombe
misst nur lineare Zusammenhänge und reagiert empfindlich auf Ausreißer — ein einzelner Punkt kann von auf nahe ziehen. Das berühmte Anscombe-Quartett zeigt vier völlig verschiedene Punktwolken mit identischem . Deshalb: immer zusammen mit dem Streudiagramm interpretieren.
Für ordinale Daten oder robustere Aussagen nutzt man Spearmans — Pearson angewandt auf die Ränge. Es erfasst monotone Zusammenhänge.
Eine zweite Rangkorrelation ist Kendalls : Sie zählt konkordante Paare (gleiche Richtung in und , ) gegen diskordante ():
( = nur in bzw. nur in gebundene Paare). ist interpretierbar als Differenz der Anteile gleich- und gegenläufiger Paare.
Korrelation ≠ Kausalität
Die wichtigste Klausur- und Lebensfalle: Korrelation misst nur einen statistischen Zusammenhang. Sie sagt nichts über Ursache und Wirkung und nicht über die Richtung (, nicht ). Eine dritte Variable kann beide treiben (Scheinkorrelation).
Abruf-Quiz
Frage 1 / 4Punktwolke mit , , . Wie groß ist Pearsons ? (2 Nachkommastellen)