Liegt eine Wirkungsrichtung nahe (X→Y), beschreibt man Y als Funktion von
X: yi=β0+β1xi+εi. Der Fehler ε
fängt die Abweichung von Modell und Daten auf.
Kleinste-Quadrate-Methode
Man wählt die Gerade so, dass die Summe der quadrierten vertikalen Abstände
minimal wird:
Das Bestimmtheitsmaß ist gerade der Anteil der erklärten an der gesamten
Streuung:
R2=SSTSSR=1−SSTSSE∈[0,1]
Bei Einfachregression gilt R2=r2. Für das Schlafbeispiel
R2≈0,45.
Die Residuene^i=yi−y^i zeigen, wie gut das Modell passt: Ein
Residuenplot ohne Muster spricht für ein gutes Modell; ein Trend oder eine
sich ändernde Streuung deutet auf Modellverletzungen.
Klausurfalle:R2 ist nicht die Steigung und nichtr selbst,
sondern r2. Und: Eine gut passende Gerade rechtfertigt keine
Extrapolation weit außerhalb des Datenbereichs.
Abruf-Quiz
Frage 1 / 4
Schlafverhalten: ∑(xi−xˉ)(yi−yˉ)=−3,71, ∑(xi−xˉ)2=8,24. Wie groß ist die Steigung b1? (2 Nachkommastellen)