Lernzettel (reduziert)

Grundbegriffe Stochastik

Wahrscheinlichkeitsraum

  • mit
    • Ergebnisraum (Grundraum):
    • Festlegung der Menge (-Algebra) der interessierenden Ereignisse: , Ereignis:
    • Wahrscheinlichkeitsbewertung der Ereignisse:
  • Ist höchstens abzählbar: diskreter Wahrscheinlichkeitsraum
  • Ist überabzählbar: stetiger Wahrscheinlichkeitsraum

Satz von der totalen Wahrscheinlichkeit, Zerlegungsformel

  • Sei

    • ein W’keitsraum
    • eine disjunkte Zerlegung von wobei
      • eine höchstens abzählbare Indexmenge bezeichnet
      • es gelte
    • Es sei also und , .
    • Dann gilt für alle , dass .
    • Beispiel:

    Untitled

Satz von Bayes

  • Sei ein W’keitsraum und Ereignisse mit und dann gilt:
    • bzw.
      • heißt a priori-Wahrscheinlichkeit von und heißt a posteriori-Wahrscheinlichkeit von B.

Kovarianz und Korellationskoeffizient

  • Seien zwei Zufallsvariablen mit jeweils endlichen Varianzen.
    • Kovarianz von und :
    • Korellationskoeffizient von und :

Untitled

Eigenschaften der Kovarianz

  • (Symmetrie)
  • für alle reellen Konstanten (Translationsinvarianz)

Bilinearität der Kovarianz

  • Seien drei Zufallsvariablen mit endlichen Varianzen.
  • Dann gelten:
    • für alle reellen Konstanten .

Unkorreliertheit und stochastische Unabhängigkeit

  • Seien zwei Zufallsvariablen mit endlichen Varianzen.
  • Dann:
  • Aus der Unkorreliertheit von und kann im Allgemein nicht auf und sind stochastisch unabhängig geschlossen werden.

Die Quantilsfunktion

  • Sei eine Verteilungsfunktion auf .
  • Dann nennen wir die Funktion

    die verallgemeinerte Inverse von bzw. die Quantilsfunktion zu . Dabei ist das Quartil.
  • Falls stetig und streng monoton wachsend ist, so stimmt mit der Umkehrfunktion überein.

Interquartilsabstand

  • Sei das obere und das untere Quartil.
  • Dann nennen wir

    den Interquartilsabstand von .
  • Der Interquartilsabstand von ist eine Alternative zur Standardabweichung von , um die Streuungsbreite der zu gehörigen W’keitsverteilung zu quantifizieren

Chebyshev-Ungleichung

  • Setzt man in der Markov-Ungleichung voraus, dass ist und betrachtet man statt selbst die Zufallsvariable so erhält man für :
  • Oftmals benutzt man für ein Vielfaches von .

Verteilungen

Verteilung einer diskreten Zufallsvariable

Diskrete Gleichverteilung (La Place)

  • Alle Ereignisse gleiche Wahrscheinlichkeit
  • Bsp.: Fairer Würfelwurf, zufällige Auswahlen, Lotto

Bernoulli-Verteilung

  • Zwei mögliche Ausgänge mit Erfolgswahrscheinlichkeit und Misserfolgswahrscheinlichkeit

Binomialverteilung

  • Unabhängige Bernoulliverteilung mit
  • Zählen der Anzahl der Erfolge unabhängiger Bernoulli-Experimente
  • Bsp.: -mal “Kopf” bei Würfen

Normalverteilung

  • ,

  • mit:

    • Erwartungswert
    • Standartabweichung
    • Für Standardnormalverteilung: und

    Untitled

Poisson-Verteilung

  • Anzahl der Ereignisse im festen Zeit- oder Raumbereich, Ereignisse sind unabhängig und mit konstanter Rate
  • Bsp.: Anrufe in Telefonzentrale pro Zeitintervall (Stunde), Epidemologie
  • Beziehung zur Binomialverteilung: und
  • Normalverteilung: Ab

Verallgemeinerte Geometrische Verteilung

  • Der -te Treffer in -Versuchen, Bernoullisches Versuchsschema

Median einer Verteilungsfunktion

  • Sei eine Verteilungsfunktion auf . Dann heißt jeder Wert mit der Eigenschaft ,
    ein Median von bzw. der zu gehörigen W’keitsverteilung.
  • Falls stetig ist, so gilt .
    Falls stetig und streng monoton wachsend mit Umkehrfunktion ist, so gilt
    .

Umkehrfunktion

  • Sei eine Funktion, die nach abbildet.
    • Löse nach auf und der neue Term steht in Abhängigkeit von
    • Es gilt also:

Tests

p-Wert

  • Bei Normalverteilung:
    • Nachschlagen in z-Wertetabelle und ablesen
  • Bei Binomialverteilung:
    • Sei Stichprobe der Größe :
  • Wenn wird verworfen

Hypothesentest

Hypothesentest: Einseitiger und beidseitiger Test

  • Binomialverteilt: Tabelle aufstellen und kritischen Wert suchen, wenn verwerfe

Untitled

Signifikanztest

  • Nachschlagen in der Tabelle anhand von Anzahl Fälle , Wahrscheinlichkeit und Signifikanzniveau . Der kritische Wert ist der -Wert, für den gerade noch unter liegt. Wenn die Anzahl Treffer größer gleich dem Kritischen Wert sind, wird verworfen. Es gilt:
    • wird verworfen, wenn
    • wird verworfen, wenn

Chi Quadrat Test

  • Voraussetzungen:
    • nominales oder ordinales Skalenniveau
    • zufallsverteilt
  • Häufigkeit

Untitled

  • Kritischen Wert in Tabelle ablesen mit Hilfe von und Freiheitsgrad
  • Wenn dann gibt es einen statistisch signifikanten Zusammenhang.
  • : und sind stochastisch unabhängig
  • : Zwischen und gibt es einen statistisch signifikanten Zusammenhang

Chi Quadrat Test • Erklärung, Berechnung & Beispiele

T-Test

  • Einstichproben t-Test:
    • linksseitig: ,
    • rechtsseitig: ,
    • zweiseitig: ,
    • Teststatistik:
    • Nachschlagen in der t-Verteilungstabelle, wobei .
      • Ablesen des kritischen Wertes:
        • rechtsseitig: direkt ablesbar
        • linksseitig: Kehrwert bilden (einfach ein “” davor)
        • beidseitig: Signifikanzniveau halbieren (z.B. bei zu ) und zwei Kritische Werte bilden, einmal normal ablesen und dann für den anderen Kehrwert bilden
      • Verwerfen wenn:
        • links:
        • rechts:
        • beidseitig:

Welch-Test

Fisher-Test

  • Wie Chi-Quadrat, aber für kleine Stichproben

Wilcoxon(-Mann-Whitney)-Test

  • -Wert entspricht kleinstem Signifikanzniveau , bei dem gerade noch zu gunsten von verworfen wird
  • unabhängige Variable:
    • Unterschiedlich bei beiden Teilen der Stichprobe (z.B. Geschlecht)
  • abhängige Variable:
    • das gleiche wird überprüft bei beiden Stichprobenteilen (z.B. Dauer der Internetnutzung)
  • Aufstellen einer Tabelle und verteilen von Rangplätzen abhängig vom Wert (z.B. Platz 1 für kürzeste Dauer)
    • bei mehreren gleichen Werten: Mittelwert aus den betroffenen Rangplätzen bilden und diesen neuen Rangwert an alle betroffenen Werte verteilen
  • Aufaddieren der Rangplätze für die unabhängigen Variablen (z.B. für alle Frauen und alle Männer)
    • Für jede Gruppe berechne Teststatistik
      • Größe Stichprobe für erste unabhängige Variable (z.B. Anzahl Männer)
      • Größe Stichprobe für zweite unabhängige Variable (z.B. Anzahl Frauen)
      • : Rangsumme für die unabhängige Variable

Untitled

  • anschließend mit Hilfe von und den kritischen Wert aus der Tabelle ablesen
  • wird verworfen, wenn:
  • Bei Stichprobengröße ÜBER 30:
    • kleine Stichprobe: U-Wert oder z-Wert
    • U-Wert z-standardisieren mit Erwartungswert und Standardfehler von
      • wenn , wird verworfen

Kombinatorik

Schema zur Kombinatorik

Wiederholung
janein
Reihenfolgeberücksichtigt
unberücksichtigt

Erwartungswert

  • Diskrete Zufallsvariable: (mit Zähldichte bzw. hier )
  • Stetige Zufallsvariable:

Rechenregeln Erwartungswert

  • Monotonie: Ist , so ist .
  • Linearität: für beliebige .
  • -Additivität: Sind alle und ist , so gilt .
  • Produktregel bei stochastischer Unabhängigkeit: Sind und stochastisch unabhängig, so existiert der Erwartungswert von und es gilt:

Varianz

  • empirisch:

Standardabweichung

Varianzzerlegung

Die Varianzzerlegung, auch als Varianzzerlegung der linearen Regression oder als Varianzkomponentenanalyse bekannt, ist ein Konzept aus der Statistik, das die Gesamtvarianz einer abhängigen Variable in verschiedene Komponenten zerlegt. Hier ist die grundlegende Formel der Varianzzerlegung:

Die Gesamtvarianz (Varianz der abhängigen Variable ) kann in die erklärte Varianz (durch das Modell erklärt) und die unerklärte Varianz (Fehlerterm) zerlegt werden:

Dabei sind:

  • : Gesamtvarianz der abhängigen Variable .
  • : Erklärte Varianz, also die Varianz der vorhergesagten Werte .
  • : Unerklärte Varianz, also die Varianz des Fehlerterms .

Diese Komponenten können weiter erläutert werden:

  1. Gesamtvarianz (): Dies ist die Varianz der Zielvariable , die wir modellieren möchten.
  2. Erklärte Varianz (): Dies ist der Anteil der Varianz in , der durch die unabhängigen Variablen im Modell erklärt wird. sind die vorhergesagten Werte von .
  3. Unerklärte Varianz (): Dies ist der Anteil der Varianz in , der durch die unabhängigen Variablen nicht erklärt wird und auf Zufallsfehler oder nicht erfasste Faktoren zurückzuführen ist. ist der Fehlerterm des Modells.

In der Praxis wird die Varianzzerlegung oft in der Analyse von linearen Modellen verwendet, um zu verstehen, wie gut das Modell die Varianz der Zielvariablen erklärt. Ein höherer Anteil der erklärten Varianz bedeutet, dass das Modell eine bessere Passung hat.

Bei Erwatungswert

Die Varianzzerlegung kann in Verbindung mit dem Berechnen von Erwartungswerten (Erwartungswertzerlegung) genutzt werden, um die Gesamtvarianz einer Zufallsvariablen zu verstehen und in verschiedene Komponenten zu zerlegen. Dabei wird oft die Bedingte Erwartungswertzerlegung verwendet. Diese Methode ist besonders nützlich in der Regressionsanalyse und bei der Analyse von Zufallsvariablen.

Hier sind die Schritte und die mathematischen Ausdrücke zur Anwendung der Varianzzerlegung auf Erwartungswerte:

  1. Gesamtvarianz einer Zufallsvariablen :

  2. Erwartungswertzerlegung:

    Man teilt die Gesamtvarianz von in zwei Komponenten: die Varianz des bedingten Erwartungswertes von gegeben (erklärte Varianz) und die Erwartung der bedingten Varianz von gegeben (unerklärte Varianz):

    Hierbei sind:

    • : Varianz des bedingten Erwartungswertes von gegeben . Dies ist die erklärte Varianz durch .
    • : Erwartungswert der bedingten Varianz von gegeben . Dies ist die unerklärte Varianz, die verbleibt, nachdem man den Einfluss von berücksichtigt hat.

Anwendung in der Praxis

Angenommen, wir haben eine Zufallsvariable (z.B. das Einkommen einer Person) und eine erklärende Variable (z.B. die Anzahl der Ausbildungsjahre):

  1. Berechnung der bedingten Erwartungswerte:

    Bestimmen Sie den bedingten Erwartungswert von gegeben , das heißt . Dieser Wert gibt an, wie sich das Einkommen im Durchschnitt ändert, wenn sich (die Ausbildungsjahre) ändert.

  2. Berechnung der Varianzen:

    • Erklärte Varianz: Berechnen Sie die Varianz der bedingten Erwartungswerte . Dies misst, wie stark der bedingte Erwartungswert um seinen Gesamtmittelwert streut.
    • Unerklärte Varianz: Berechnen Sie den Erwartungswert der bedingten Varianz . Dies misst, wie stark um den bedingten Erwartungswert streut.

Beispiel

Angenommen, wir haben Daten zu Einkommen und Ausbildungsjahren für eine Stichprobe von Personen. Wir können ein Regressionsmodell verwenden, um den bedingten Erwartungswert zu schätzen und dann die oben beschriebenen Varianzen berechnen.

  1. Regressionsmodell:
  2. Erklärte Varianz: Varianz der vorhergesagten Werte .
  3. Unerklärte Varianz: Varianz der Residuen (Fehler) .

Durch diese Zerlegung können wir verstehen, wie viel der Gesamtvarianz des Einkommens durch die Anzahl der Ausbildungsjahre erklärt wird und wie viel der Varianz auf andere Faktoren oder Zufall zurückzuführen ist.

Normiertheit

Nicht neg. distat (Nicht negativ distributiv)

Lebesgue-Dichte

  • Jede Lebesguedichte auf einem Grundraum hat die folgenden Eigenschaften:

Integrationsregeln

Partielle Integration

Integration durch Substitution

Statistik

Skalierungen

  • Nominalskaliert: Merkmale wie Postleitzahl, Automarke, Haarfarbe, …,die zwar durch einen Zahlenwert codiert werden können, bei denen die Zuordnung zu den einzelnen Ausprägungen aber willkürlich ist
  • Ordinalskaliert: Merkmale wie Schulnote, Platz in einer Tabelle, bei denen der Zahlenwert nur eine Reihung darstellt
  • Intervallskaliert: Merkmale wie Temperatur, bei denen Differenzbildung sinnvoll ist
  • Verhältnisskaliert: Merkmale wie Größe, Alter, Temperatur in Kelvin, die einen absoluten Nullpunkt haben. Bei diesen ist dann zudem das Bilden von Quotienten sinnvoll

Konfidenzintervall

  • Untere Grenze:
  • Obere Grenze:
    • mit Mittelwert
    • Standardfehler
    • Wurzel aus der Stichprobe ()
    • untere Intervallgrenze , obere Intervallgrenze
      • bei Konfidenzniveau :
        • da Grenze für oben und unten gilt: und
        • Wert liegt also mit Wahrscheinlichkeit in diesem Intervall

Mittelwert

Standardabweichung (empirisch)

Stichprobenquartile

    1. Quartil:
    • wenn gebrochen:
    • wenn eine ganze Zahl ist:
  • Ersetzt man durch

Maße für Lage und Streuung

SkalenniveauLagemaßStreuungsmaß
VerhältnisskalaMittelwert, MedianVarianz, Standardabw., IQR, Spannweite
IntervallskalaMittelwert, MedianVarianz, Standardabw., IQR, Spannweite
OrdinalskalaMedianIQR, Spannweite
Nominalskala

Fehlertypen

  • Eine fälschliche Verwerfung der Nullhypothese (in unserem Beispiel: Behaupten, dass die Ernährung das Gewicht beeinflusst) nennen wir Fehler 1.Art
  • Eine fälschliche nicht-Verwerfung der Nullhypothese (in unserem Beispiel: Annehmen, dass die Ernährung das Gewicht nicht beeinflusst, obwohl es so ist) nennen wir Fehler 2.Art
  • Die Entscheidung für oder gegen eine Hypothese basiert auf einer Zufallsstichprobe und ist damit selbst wieder zufällig
  • Wir können also theoretisch Wahrscheinlichkeiten dafür angeben einen Fehler 1.Art bzw. einen Fehler 2.Art zu begehen

Untitled

Fehlerwahrscheinlichkeiten

  • Die Wahrscheinlichkeit für einen Fehler 1.Art bezeichnen wir mit , die Wahrscheinlichkeit für einen Fehler 2.Art mit
  • Man möchte natürlich beide Fehlerwahrscheinlichkeiten möglichst klein halten
  • Dies ist in der Praxis jedoch nicht gleichzeitig möglich
  • In der Regel wird ein Fehler 1.Art als schwerwiegender betrachtet, als ein Fehler 2.Art (im medizinischen Umfeld bedeutet ein Fehler 1.Art in der Regel die potentielle Zulassung einer nicht wirksamen Therapie)
  • Man versucht daher Entscheidungsregeln für die Entscheidung zwischen und zu
    finden, bei denen die Wahrscheinlichkeit α für einen Fehler 1.Art gering ist
  • In der Regel versucht man Entscheidungsregeln zu finden, für die sichergestellt ist, dass ist
  • Das heißt, wenn die Nullhypothese gilt, möchte man sie nur mit Wahrscheinlichkeit
    (fälschlicherweise) ablehnen
  • In Fällen, in denen eine fälschliche Verwerfung der Nullhypothese besonders schwerwiegend ist, werden auch kleinere gewählt
  • Man nennt auch das Signifikanzniveau des Tests
  • Wichtig: Das Signifikanzniveau muss vor der Durchführung des Tests festgelegt werden!

Power

  • Wie gesehen bezeichnen wir mit die Wahrscheinlichkeit für einen Fehler 2.Art, also der
    fälschlichen nicht-Verwerfung der Nullhypothese