Formelsammlung & Glossar
Alle Schlüsselbegriffe und Formeln aus den Kapiteln an einem Ort — durchsuchbar und nach Kapitel filterbar.
👉 Für die Klausur die handgeschriebenen Blätter vorbereiten? Der Formelblatt-Planer kuratiert die Formeln und schätzt den Platz (mit den verbindlichen Regeln).
128 Einträge
- Deskriptive Statistik
- Beschreiben und Verdichten vorliegender Daten (Kennzahlen, Grafiken) — ohne Verallgemeinerung auf eine Grundgesamtheit.K1 · Wozu Statistik?
- Induktive (schließende) Statistik
- Schluss von der Stichprobe auf die Grundgesamtheit, inkl. Quantifizierung der Unsicherheit (Schätzen, Testen).K1 · Wozu Statistik?
- Explorative Statistik
- Suchen nach Strukturen/Auffälligkeiten in Daten, oft als Vorstufe; wird häufig mit der Deskription zusammengefasst.K1 · Wozu Statistik?
- Grafische Verzerrung
- Manipulation des optischen Eindrucks durch Auseinanderziehen/Zusammenschieben der Skalenwerte (z. B. abgeschnittene y-Achse), ohne die Daten zu ändern.K1 · Missbrauch der Statistik
- Nichtrepräsentative Daten
- Stichprobe, deren Zusammensetzung systematisch von der Grundgesamtheit abweicht — Schlüsse darauf sind verzerrt.K1 · Missbrauch der Statistik
- Statistische Einheit
- Objekt, an dem die interessierenden Größen erfasst werden (z. B. Person, Wohnung, Baum).K1 · Grundbegriffe
- Grundgesamtheit
- Menge aller für die Fragestellung relevanten statistischen Einheiten.K1 · Grundbegriffe
- Stichprobe
- Tatsächlich untersuchte Teilmenge der Grundgesamtheit.K1 · Grundbegriffe
- Merkmal
- Für die Untersuchung relevante Größe (z. B. Alter, Nationalität).K1 · Grundbegriffe
- Merkmalsausprägung
- Möglicher oder beobachteter Wert eines Merkmals (z. B. {0,1,2,…} oder {deutsch, französisch, …}).K1 · Grundbegriffe
- Qualitatives Merkmal
- Ausprägungen sind Namen/Kategorien (nicht messbar im Mengen-Sinn), z. B. Nationalität, Baumart.K1 · Merkmale & Skalenniveaus
- Quantitatives Merkmal
- Zählbar/messbar, durch Zahlen erfasst, z. B. Alter, Miete, Durchmesser.K1 · Merkmale & Skalenniveaus
- Diskretes Merkmal
- Endlich oder abzählbar unendlich viele Ausprägungen (z. B. Zimmerzahl, Geschlecht).K1 · Merkmale & Skalenniveaus
- Stetiges Merkmal
- Alle Werte eines Intervalls möglich (überabzählbar viele Ausprägungen), z. B. Länge, Temperatur.K1 · Merkmale & Skalenniveaus
- Nominalskala
- Kategorien ohne Rangfolge; nur = / ≠. Zulässig: Häufigkeiten, Modus.K1 · Merkmale & Skalenniveaus
- Ordinalskala
- Geordnete Kategorien, Abstände nicht interpretierbar; zusätzlich < / >. Zulässig: Median, Quantile.K1 · Merkmale & Skalenniveaus
- Intervallskala
- Zahlen mit interpretierbaren Abständen, aber ohne absoluten Nullpunkt (z. B. °C). Zulässig: arithm. Mittel, Varianz.K1 · Merkmale & Skalenniveaus
- Verhältnisskala
- Zahlen mit absolutem Nullpunkt; Verhältnisse interpretierbar (»doppelt so groß«). Zulässig: alle Maße inkl. Variationskoeffizient.K1 · Merkmale & Skalenniveaus
- Urliste
- Die rohe Beobachtungsreihe — die Ergebnisse der Messung an n statistischen Einheiten, unsortiert.K2 · Häufigkeiten
- Absolute Häufigkeit
- Anzahl der Beobachtungen mit Ausprägung . Es gilt .K2 · Häufigkeiten
- Relative Häufigkeit
- — Anteil der Ausprägung . Es gilt .K2 · Häufigkeiten
- Histogramm
- Flächenproportionale Darstellung einer klassierten Häufigkeitsverteilung: Balkenhöhe = bzw. (Häufigkeitsdichte), Fläche ∝ Häufigkeit.K2 · Grafische Darstellungen
- Faustregeln Klassenanzahl
- oder . Klassengrenzen möglichst einfach, Breiten möglichst gleich.K2 · Grafische Darstellungen
- Uni-/bi-/multimodal
- Anzahl ausgeprägter Gipfel der Verteilung: ein Gipfel (unimodal), zwei (bimodal), mehrere (multimodal).K2 · Grafische Darstellungen
- Linkssteil vs. rechtssteil
- Linkssteil (rechtsschief): Daten links konzentriert, Ausläufer rechts (). Rechtssteil (linksschief): umgekehrt.K2 · Grafische Darstellungen
- Empirische Verteilungsfunktion
- Anteil der Beobachtungen : . Monoton wachsende Treppenfunktion, 0 für , 1 für .K2 · Kumulierte Häufigkeiten
- Kumulierte absolute Häufigkeit
- Anzahl der Beobachtungen : . An den Sprungstellen gilt der obere Wert (Treppenkante).K2 · Kumulierte Häufigkeiten
- Arithmetisches Mittel
- . Schwerpunkt der Daten; nur ab Intervallskala sinnvoll; empfindlich gegen Ausreißer.K2 · Lagemaße
- Median
- Mittlerer Wert der geordneten Reihe. n ungerade: ; n gerade: . Robust, ab Ordinalskala.K2 · Lagemaße
- Modus
- Häufigste Ausprägung. Bereits für nominale Merkmale geeignet; nicht immer eindeutig.K2 · Lagemaße
- Geometrisches Mittel
- . Für Wachstums-/Zinsfaktoren. Es gilt stets .K2 · Lagemaße
- p-Quantil
- Trennt die Daten: mind. sind . nicht ganz: ; ganz: .K2 · Lagemaße
- Lageregeln (unimodal)
- Symmetrisch: . Linkssteil: . Rechtssteil: .K2 · Lagemaße
- Spannweite
- . Sehr empfindlich gegen Ausreißer.K2 · Streuungsmaße
- Interquartilsabstand IQR
- . Robustes Streuungsmaß; Länge der Box im Box-Plot.K2 · Streuungsmaße
- Empirische Varianz
- — Teilung durch n.K2 · Streuungsmaße
- Stichprobenvarianz
- — Teilung durch n−1 (erwartungstreu, in der induktiven Statistik bevorzugt).K2 · Streuungsmaße
- Standardabweichung
- . Gleiche Dimension wie die Daten; beschreibt die Streuung um .K2 · Streuungsmaße
- Variationskoeffizient
- (alle , ). Dimensionsloses relatives Streuungsmaß zum Vergleich verschiedener Größenordnungen.K2 · Streuungsmaße
- Kontingenztafel
- Tabelle der gemeinsamen absoluten Häufigkeiten zweier diskreter Merkmale, ergänzt um Zeilen- und Spaltensummen.K3 · Kontingenztafeln & bedingte Häufigkeiten
- Randhäufigkeit
- Zeilensumme (Verteilung von X) bzw. Spaltensumme (Verteilung von Y).K3 · Kontingenztafeln & bedingte Häufigkeiten
- Bedingte relative Häufigkeit
- — Verteilung von Y für festgehaltenes (Normierung auf die Zeilensumme).K3 · Kontingenztafeln & bedingte Häufigkeiten
- Empirische Unabhängigkeit
- Erwartete Häufigkeit ohne Zusammenhang: . Beobachtete = erwartete ⇒ kein Zusammenhang.K3 · Zusammenhangsmaße für nominale Merkmale
- χ²-Koeffizient
- . Misst die Abweichung von der Unabhängigkeit; hängt von n und Tafelgröße ab.K3 · Zusammenhangsmaße für nominale Merkmale
- Kontingenzkoeffizient K
- , . Normiert: .K3 · Zusammenhangsmaße für nominale Merkmale
- Cramérs V
- , . Bei 2×2-Tafeln gleich dem Phi-Koeffizienten.K3 · Zusammenhangsmaße für nominale Merkmale
- Empirische Kovarianz
- . Vorzeichen = Richtung des linearen Zusammenhangs; nicht normiert (skalenabhängig).K3 · Kovarianz & Korrelation
- Pearson-Korrelation
- . Normierte Kovarianz; nur linearer Zusammenhang; ausreißerempfindlich.K3 · Kovarianz & Korrelation
- Spearman-Rangkorrelation
- Pearson auf den Rängen. Für ordinale Daten; erfasst monotone Zusammenhänge; robuster gegen Ausreißer.K3 · Kovarianz & Korrelation
- Faustregel Stärke von |r|
- schwach , mittel , stark .K3 · Kovarianz & Korrelation
- Kendalls (Rangkorrelation)
- Beruht auf konkordanten (C) und diskordanten (D) Paaren: . Wie Spearman für ordinale Daten, mit Bindungskorrektur.K3 · Kovarianz & Korrelation
- Kleinste-Quadrate-Methode
- Minimiert . Lösung: , .K3 · Regressionsrechnung
- Ausgleichsgerade
- mit KQ-Schätzern. = Steigung (Änderung von Y je Einheit X), = Achsenabschnitt (Y bei X=0).K3 · Regressionsrechnung
- Bestimmtheitsmaß
- Anteil der durch das Modell erklärten Streuung von Y, . Bei Einfachregression .K3 · Regressionsrechnung
- Residuen
- — vertikale Abweichung Datenpunkt ↔ Gerade. Muster im Residuenplot deuten auf Modellverletzungen.K3 · Regressionsrechnung
- Zufallsexperiment
- Vorgang mit mehreren möglichen, im Voraus nicht sicher bestimmbaren Ausgängen, der (gedanklich) beliebig oft unter gleichen Bedingungen wiederholbar ist.K4 · Zufallsexperimente & Ereignisse
- Ergebnisraum Ω
- Menge aller möglichen Ausgänge (Elementarereignisse ω) eines Zufallsexperiments. Beispiel Würfel: Ω = {1,2,3,4,5,6}.K4 · Zufallsexperimente & Ereignisse
- Ereignis A
- Teilmenge des Ergebnisraums, . Tritt ein, wenn das beobachtete Ergebnis in A liegt.K4 · Zufallsexperimente & Ereignisse
- Laplace-Wahrscheinlichkeit
- — gültig nur bei endlich vielen, gleichwahrscheinlichen Elementarereignissen.K4 · Wahrscheinlichkeit
- Axiome von Kolmogorov
- (1) ; (2) ; (3) für disjunkte : .K4 · Wahrscheinlichkeit
- Additionssatz
- . Für disjunkte Ereignisse entfällt der letzte Term.K4 · Wahrscheinlichkeit
- Komplementregel
- .K4 · Wahrscheinlichkeit
- Empirisches Gesetz der großen Zahlen
- : Für großes n liegt die relative Häufigkeit mit großer Wahrscheinlichkeit nahe bei P(A).K4 · Wahrscheinlichkeit
- Bedingte Wahrscheinlichkeit
- für . Wahrscheinlichkeit von A, wenn B bereits eingetreten ist.K4 · Bedingte Wahrscheinlichkeit & Unabhängigkeit
- Produktsatz (Multiplikationssatz)
- .K4 · Bedingte Wahrscheinlichkeit & Unabhängigkeit
- Stochastische Unabhängigkeit
- , äquivalent : B liefert keine Information über A.K4 · Bedingte Wahrscheinlichkeit & Unabhängigkeit
- Satz von der totalen Wahrscheinlichkeit
- Für eine Zerlegung von Ω: .K4 · Totale Wahrscheinlichkeit & Satz von Bayes
- Satz von Bayes
- . Dreht die Bedingung um (a priori → a posteriori).K4 · Totale Wahrscheinlichkeit & Satz von Bayes
- Basisraten-Falle
- Vernachlässigung der A-priori-Wahrscheinlichkeit (Prävalenz): Bei seltenen Ereignissen ist die A-posteriori-Wahrscheinlichkeit trotz „guter" Tests klein.K4 · Totale Wahrscheinlichkeit & Satz von Bayes
- Permutation
- Anordnung aller n Elemente in einer Reihenfolge: Möglichkeiten.K4 · Kombinatorik
- Variation (geordnet, ohne Zurücklegen)
- k aus n auswählen UND anordnen: .K4 · Kombinatorik
- Kombination (ungeordnet, ohne Zurücklegen)
- k aus n auswählen ohne Reihenfolge: .K4 · Kombinatorik
- Binomialkoeffizient
- — Anzahl der k-elementigen Teilmengen einer n-Menge.K4 · Kombinatorik
- Zufallsvariable X
- Abbildung, die jedem Ergebnis eines Zufallsvorgangs eine Zahl zuordnet. Großbuchstabe X, Realisierung x.K5 · Diskrete Zufallsvariablen
- Wahrscheinlichkeitsfunktion f(x)
- an den Trägerpunkten, sonst 0. Analog zur relativen Häufigkeitsverteilung; .K5 · Diskrete Zufallsvariablen
- Verteilungsfunktion F(x) (diskret)
- . Monoton wachsende Treppenfunktion, 0 links, 1 rechts.K5 · Diskrete Zufallsvariablen
- Erwartungswert E(X)
- — mit Wahrscheinlichkeiten gewichtetes Mittel der möglichen Werte; Lage/Zentrum der Verteilung.K5 · Erwartungswert & Varianz
- Varianz Var(X)
- . Streuung der Verteilung; .K5 · Erwartungswert & Varianz
- Rechenregeln E/Var
- , . ; für unabhängige X,Y: .K5 · Erwartungswert & Varianz
- Bernoulli-Verteilung
- X ∈ {0,1} mit P(X=1)=π. , . Modell für einen dichotomen Versuch.K5 · Bernoulli, Gleichverteilung & geometrische Verteilung
- Diskrete Gleichverteilung
- k gleichwahrscheinliche Werte, . , (für {1,…,k}).K5 · Bernoulli, Gleichverteilung & geometrische Verteilung
- Geometrische Verteilung
- X = Anzahl Versuche bis zum 1. Erfolg, Träger {1,2,…}. , , , .K5 · Bernoulli, Gleichverteilung & geometrische Verteilung
- Binomialverteilung
- X = Anzahl Erfolge bei n unabhängigen Bernoulli-Versuchen. , , .K5 · Binomial- & Poisson-Verteilung
- Poisson-Verteilung
- Seltene Ereignisse in festem Intervall. , Träger {0,1,2,…}, .K5 · Binomial- & Poisson-Verteilung
- Binomial vs. geometrisch
- Binomial: Anzahl Erfolge bei festem n (Träger 0…n). Geometrisch: Anzahl Versuche bis zum 1. Erfolg (Träger 1,2,…).K5 · Binomial- & Poisson-Verteilung
- Wahrscheinlichkeitsdichte f(x)
- mit . Fläche = Wahrscheinlichkeit; .K6 · Stetige Zufallsvariablen & Dichte
- Verteilungsfunktion (stetig)
- . Stetig, monoton wachsend, von 0 nach 1; .K6 · Stetige Zufallsvariablen & Dichte
- P(X = x) bei stetiger ZV
- Immer 0. Daher — die Grenzen spielen keine Rolle.K6 · Stetige Zufallsvariablen & Dichte
- Erwartungswert (stetig)
- . Bei symmetrischer Dichte um c ist .K6 · Maßzahlen & stetige Gleichverteilung
- Varianz (stetig)
- .K6 · Maßzahlen & stetige Gleichverteilung
- p-Quantil (stetig)
- mit . Teilt die Fläche in p links, 1−p rechts. Median = .K6 · Maßzahlen & stetige Gleichverteilung
- Stetige Gleichverteilung U(a,b)
- Dichte auf [a,b]. , .K6 · Maßzahlen & stetige Gleichverteilung
- Exponentialverteilung
- Dichte (), , , . Modell für Wartezeiten/Lebensdauern.K6 · Exponentialverteilung
- Gedächtnislosigkeit
- : Ein bereits „überlebtes" Bauteil ist so gut wie neu. Charakteristisch für die Exponentialverteilung.K6 · Exponentialverteilung
- Normalverteilung N(μ, σ)
- Dichte . Symmetrisch um μ, Wendepunkte bei μ±σ. , .K6 · Normalverteilung
- Standardisierung
- Ist , so ist . Damit .K6 · Normalverteilung
- σ-Regeln
- μ±σ ≈ 68,3 %, μ±2σ ≈ 95,4 %, μ±3σ ≈ 99,7 % der Wahrscheinlichkeitsmasse.K6 · Normalverteilung
- Wichtige z-Quantile
- z₀,₉₀=1,28; z₀,₉₅=1,64; z₀,₉₇₅=1,96; z₀,₉₉=2,33. Symmetrie: , .K6 · Normalverteilung
- Induktive Statistik
- Schluss von der Stichprobe auf die Grundgesamtheit mit Hilfe der Wahrscheinlichkeitstheorie. Teilgebiete: Schätzen und Testen.K7 · Induktive Statistik & Zufallsstichproben
- Stichprobenvariablen
- Modellieren die wiederholte Beobachtung von X: unabhängig und identisch verteilt (i.i.d.) wie X. Realisierungen sind die Stichprobenwerte.K7 · Induktive Statistik & Zufallsstichproben
- Einfache Zufallsstichprobe
- Jedes Element der Grundgesamtheit hat dieselbe bekannte Wahrscheinlichkeit, gezogen zu werden. Voraussetzung für induktive Verfahren.K7 · Induktive Statistik & Zufallsstichproben
- Schätzfunktion (Schätzer)
- Vorschrift, die aus einen Näherungswert für einen Parameter berechnet. Als Funktion von Zufallsvariablen selbst eine Zufallsvariable.K7 · Schätzfunktionen & Güte
- Erwartungstreue
- — kein systematischer Fehler. Z. B. ist erwartungstreu für μ und für σ².K7 · Schätzfunktionen & Güte
- Konsistenz
- Mit wachsendem Stichprobenumfang n wird die Schätzung immer genauer (konvergiert gegen den wahren Wert).K7 · Schätzfunktionen & Güte
- Effizienz
- Eine Schätzfunktion ist effizient, wenn sie bei gegebenem n möglichst kleine Streuung hat (schon bei kleiner Stichprobe brauchbar).K7 · Schätzfunktionen & Güte
- Zentrales Schwankungsintervall
- . Für N(0,1): [−1,64;1,64]→90 %, [−1,96;1,96]→95 %, [−2,58;2,58]→99 %.K7 · Prüfverteilungen: χ² und t
- χ²-Verteilung
- Summe von Quadraten von n i.i.d. N(0,1)-Variablen, χ²(n). , . Rechtsschief, nur für x≥0.K7 · Prüfverteilungen: χ² und t
- t-Verteilung
- mit , unabhängig. Symmetrisch um 0, schwerere Ränder; → N(0,1) für n→∞.K7 · Prüfverteilungen: χ² und t
- Konfidenzintervall (1−α)
- Zufälliges Intervall, das den festen Parameter mit Wahrscheinlichkeit 1−α überdeckt. α = Irrtumswahrscheinlichkeit (üblich 0,10/0,05/0,01).K7 · Konfidenzintervalle
- KI für μ, σ bekannt (z-Intervall)
- (X normalverteilt).K7 · Konfidenzintervalle
- KI für μ, σ unbekannt (t-Intervall)
- . Für n>30 ist (Normalapproximation).K7 · Konfidenzintervalle
- Breite des KI
- Wächst mit dem Konfidenzniveau (1−α) und mit σ; sinkt mit wachsendem n (∝ 1/√n).K7 · Konfidenzintervalle
- Null- und Alternativhypothese
- H₀ (Gleichheit/kein Effekt, „zu widerlegen") gegen H₁ (Unterschied/Effekt, „zu zeigen"). Sie schließen einander aus.K8 · Testlogik & Hypothesen
- Prüfgröße (Testfunktion)
- Aus der Stichprobe berechnete Zahl, deren Verteilung unter H₀ bekannt ist. Beim Gauß-Test: .K8 · Testlogik & Hypothesen
- Ablehnbereich (kritischer Bereich)
- Wertebereich der Prüfgröße, bei dem H₀ verworfen wird. Die Wahrscheinlichkeit, unter H₀ hineinzufallen, ist höchstens α. Grenze = kritischer Wert.K8 · Testlogik & Hypothesen
- Gauß-Test
- Test für μ bei bekanntem σ. Prüfgröße unter H₀.K8 · Gauß-Test
- Ein- vs. zweiseitig
- Zweiseitig H₁: μ≠μ₀ → Ablehnung bei |Z|>z_{1−α/2}. Einseitig H₁: μ>μ₀ → Z>z_{1−α}; H₁: μ<μ₀ → Z<−z_{1−α}.K8 · Gauß-Test
- Fehler 1. Art (α-Fehler)
- H₀ ist wahr, wird aber verworfen. Die Wahrscheinlichkeit wird durch das Signifikanzniveau α kontrolliert: P(Fehler 1. Art) ≤ α.K8 · Fehlerarten & Signifikanz
- Fehler 2. Art (β-Fehler)
- H₁ ist wahr, H₀ wird aber nicht verworfen. β ist nicht direkt kontrollierbar; 1−β ist die Güte (Power) des Tests.K8 · Fehlerarten & Signifikanz
- Signifikanzniveau α
- Maximal zugelassene Wahrscheinlichkeit für einen Fehler 1. Art. Übliche Werte 0,10 / 0,05 / 0,01. Vorab festlegen!K8 · Fehlerarten & Signifikanz
- Güte (Power) 1−β
- Wahrscheinlichkeit, einen tatsächlich vorhandenen Effekt zu entdecken. Steigt mit n, mit der Effektgröße und mit größerem α.K8 · Fehlerarten & Signifikanz
- t-Test
- Test für μ bei UNBEKANNTEM σ. Prüfgröße unter H₀. Für n>30 ≈ N(0,1).K8 · t-Test
- Gauß- oder t-Test?
- σ bekannt → Gauß-Test (z, N(0,1)). σ unbekannt → t-Test (t(n−1)). Bei n>30 beide ≈ Normalapproximation.K8 · t-Test
- p-Wert
- Wahrscheinlichkeit unter H₀, den beobachteten oder einen extremeren Prüfgrößenwert (Richtung H₁) zu erhalten. Entscheidung: p < α ⇒ H₀ verwerfen.K8 · p-Wert & formaler Testablauf
- p-Wert ein-/zweiseitig
- Einseitig: Fläche in einem Ende. Zweiseitig: doppelte Fläche des kleineren Endes, .K8 · p-Wert & formaler Testablauf
- Auswahl eines Tests
- Entscheidend: Funktion des Tests, Datenniveau (nominal/ordinal/metrisch), Verteilung der Daten und Stichprobenart (verbunden/unverbunden).K8 · p-Wert & formaler Testablauf
- Binomialtest
- Exakter Test für einen Anteil, H₀: π = π₀. Prüfgröße = Erfolgszahl k, Prüfverteilung Bin(n, π₀). Für kleine n genauer als der approximative z-Anteilstest.K8 · Binomialtest & Tests via Konfidenzintervall
- Dualität Test ↔ Konfidenzintervall
- Ein zweiseitiger Test zum Niveau α verwirft H₀: θ=θ₀ genau dann, wenn θ₀ außerhalb des (1−α)-KI liegt. Das KI = Menge der nicht verwerfbaren θ₀.K8 · Binomialtest & Tests via Konfidenzintervall