Wiederholung Wahrscheinlichkeitstheorie
Diese Sitzung ist eine (relativ oberflächliche) Einführung/Wiederholung in die/der Grundlagen der Wahrscheinlichkeitstheorie.
Wir schauen uns die möglichen Ausgänge eines Zufallsexperiments an ("Ereignisse"). Wenn diese Ereignisse sich gegenseitig ausschließen und alle denkbaren Ergebnisse abdecken, dann nennt man diese Ereignisse auch Elementarereignisse. Die Wahrscheinlichkeit für ein Ereignis kann man angeben als Anzahl der möglichen Ergebnisse, die für dieses Ereignis günstig sind, geteilt durch die Anzahl aller Ausgänge. Über die Kolmogorov Axiome bekommt man die typischen Rechenregel für die Wahrscheinlichkeit.
Man kann eine Verbundwahrscheinlichkeit
Die bedingte Wahrscheinlichkeit für
Daraus kann man die Bayes-Regel ableiten:
"Prior" oder "A-priori-Wahrscheinlichkeit" (die Wahrscheinlichkeit für ohne weiteres Wissen), "Likelihood" (Wie wahrscheinlich ist das Auftreten von , gegeben ?), "Posterior" oder "A-posteriori-Wahrscheinlichkeit" (Wie wahrscheinlich ist , wenn eingetreten ist?), und ist ein Normierungsfaktor (Wie wahrscheinlich ist an sich?).
- (K2) Elementarereignisse und Wahrscheinlichkeit
- (K2) Bedingte Wahrscheinlichkeit und Verbundwahrscheinlichkeit
- (K2) (Bedingte) Unabhängigkeit
- (K3) Rechenregeln
- (K3) Marginalisierung
- (K3) Bayes'sche Regel
Ereignisse und Wahrscheinlichkeit
Hinweis: Die folgende Darstellung zur Einführung in die Wahrscheinlichkeitstheorie dient dem Verständnis des Naive Bayes Klassifikationsalgorithmus und ist teilweise eher oberflächlich gehalten. Sie kann und soll keine entsprechende mathematische Einführung ersetzen!
Ereignisse
-
Ereignisse
: endliche Menge der Ausgänge eines Zufallsexperiments -
Elementarereignis: Die
- decken alle möglichen Versuchsergebnisse ab, und
- schließen sich gegenseitig aus
Regeln
- Wenn
und Ereignisse sind, dann auch wird als sicheres Ereignis bezeichnet: Enthält definitionsgemäß alle Versuchsausgänge, d.h. ein in der Menge enthaltenes Ereignis muss auftreten- Die leere Menge
wird als unmögliches Ereignis bezeichnet - Die Variablen
und heißen auch Zufallsvariablen
Im Rahmen dieser Veranstaltung betrachten wir nur diskrete Zufallsvariablen mit endlichem Wertebereich!
Wahrscheinlichkeit
-
Wahrscheinlichkeit:
Sei
endlich. Die Wahrscheinlichkeit für ein Ereignis ist dann definiert alsMan könnte auch schreiben:
Hinweis: Diese Definition von Wahrscheinlichkeit geht von gleich wahrscheinlichen Elementarereignissen aus! Die allgemeine Definition geht über einen entsprechenden Grenzwert.
Verteilung
Den Vektor mit den Wahrscheinlichkeiten aller Elementarereignisse nennt man auch Verteilung.
Beispiel:
Hinweis: Wir betrachten hier nur diskrete Zufallsvariablen. Für kontinuierliche Variablen wird die Verteilung mit Hilfe einer Dichtefunktion dargestellt, beispielsweise der Gauss'schen Funktion.
Beispiel
- Einmaliges Würfeln mit einem Spielwürfel:
- Elementarereignisse:
- Das Würfeln einer geraden Zahl (
) ist kein Elementarereignis, ebenso wie das Würfeln einer Zahl kleiner 5 ( ), da - Wahrscheinlichkeit, eine 1 zu würfeln:
. Anmerkung: Man schreibt statt oft einfach . - Wahrscheinlichkeit, eine gerade Zahl zu würfeln:
Rechenregeln: Kolmogorov Axiome
Sei
-
-
: (Normierungsbedingung: Summe über die Wahrscheinlichkeiten aller Elementarereignisse ist immer 1) -
Daraus folgt (u.a.):
-
-
-
-
und unabhängig: -
ist leer, wenn und sich nicht überlappen -
:
Verbundwahrscheinlichkeiten
Halsschmerzen | ||
---|---|---|
Schnupfen | 0.04 | 0.06 |
0.01 | 0.89 |
Die Tabelle kann man so lesen: In 4 von 100 Fällen tritt das Ereignis "Schnupfen" gleichzeitig mit dem Ereignis "Halsschmerzen" auf, in 6 von 100 Fällen tritt "Schupfen" ohne Halsschmerzen auf. ... In Summe kommt man wieder auf 100 Fälle (100 Prozent).
Nach diesen Zahlen liegt also die Verbundwahrscheinlichkeit für die Ereignisse
"Schnupfen" und "Husten", d.h.
Hinweis: Die gezeigten Zahlen und Zusammenhänge sind fiktiv und dienen lediglich zur Verdeutlichung der Wahrscheinlichkeitsbegriffe!
Bedingte Wahrscheinlichkeit
Definition:
Bedingte Wahrscheinlichkeit für
Halsschmerzen | ||
---|---|---|
Schnupfen | 0.04 | 0.06 |
0.01 | 0.89 |
Wegen
Marginalisierung
Halsschmerzen | |||
---|---|---|---|
Schnupfen | 0.04 | 0.06 | 0.1 |
0.01 | 0.89 | 0.9 | |
0.05 | 0.95 | 1 |
Allgemein:
Seien
Diesen Vorgang nennt man Marginalisierung. Die resultierende Verteilung
Kettenregel
-
Produktregel: Wegen
gilt -
Verallgemeinerung (Kettenregel):
Bayes-Regel
Bedingte Wahrscheinlichkeit:
nennt man "Prior" oder "A-priori-Wahrscheinlichkeit" (Das ist die Wahrscheinlichkeit für ohne weiteres Wissen) nennt man "Likelihood" (Wie wahrscheinlich ist das Auftreten von , gegeben ?) nennt man "Posterior" oder "A-posteriori-Wahrscheinlichkeit" (Wie wahrscheinlich ist , wenn eingetreten ist?) ist ein Normierungsfaktor
Wenn man (siehe später: Naive Bayes Klassifikator)
: Wie wahrscheinlich ist eine bestimmte Klasse an sich (A-priori-Wahrscheinlichkeit der Klassen)? : Wie wahrscheinlich sind bestimmte Daten, gegeben die Klasse ? (Likelihood der Daten) : Gegeben die Daten , wie wahrscheinlich ist die Klasse ? (Posterior)
In der Medizin hat sucht man i.d.R. die Ursache für beobachtete Symptome:
Aus der A-priori-Wahrscheinlichkeit für bestimmte Krankheiten und der Likelihood der Symptome (wie wahrscheinlich sind Symptome, gegeben eine Krankheit) kann man die Wahrscheinlichkeit für das Vorliegen einer Erkrankung gegeben bestimmte Symptome berechnen.
Beispiel Bayes
- Bei Arthrose wird in 80 Prozent der Fälle ein steifes Gelenk beobachtet
- Eine von 10.000 Personen hat Arthrose
- Eine von 10 Personen hat ein steifes Gelenk
=> Ich habe ein steifes Gelenk. Habe ich Arthrose?
- Gegeben:
- Gesucht:
Wenn ein steifes Gelenk vorliegt, ist die Wahrscheinlichkeit, dann an Arthrose erkrankt zu sein, bei nur 0.08%. Kein Grund zur Sorge in diesem Fall :-)
=> Wie wahrscheinlich ist ein steifes Gelenk ohne Arthrose, also
Mit Marginalisierung:
In knapp 10 Prozent der Fälle würde man im obigen Beispiel bei der Diagnose "keine Arthrose" ein steifes Gelenk beobachten.
Hinweis: Die genannten Zahlen und Zusammenhänge sind rein fiktional und sollen lediglich zur Veranschaulichung der Bayes-Regel dienen!
Schauen Sie sich auch das Beispiel 7.9 in [Ertel2017, Ex. 7.9, S. 135] an!
Unabhängige Ereignisse
-
-
-
Zwei Ereignisse
und sind unabhängig, wenn=>
Dies kann man verallgemeinern (bedingte Unabhängigkeit):
und sind bedingt unabhängig (gegeben ), wenn bzw.
Daraus folgt:
Wrap-Up
- Grundlagen der Wahrscheinlichkeitstheorie
- Elementarereignisse und Wahrscheinlichkeit
- Rechenregeln
- Bedingte Wahrscheinlichkeit und Verbundwahrscheinlichkeit
- Marginalisierung
- (Bedingte) Unabhängigkeit
- Bayes'sche Regel
- [Ertel2017] Introduction to Artificial Intelligence
Ertel, W., Springer, 2017. ISBN 978-3-319-58487-4. DOI 10.1007/978-3-319-58487-4.
Abschnitt 7.1 - [Russell2020] Artificial Intelligence: A Modern Approach
Russell, S. und Norvig, P., Pearson, 2020. ISBN 978-0134610993.
Kapitel 12