3  Wahrscheinlichkeit

3.1 Lernsteuerung

3.1.1 Position im Modulverlauf

Abbildung 1.1 gibt einen Überblick zum aktuellen Standort im Modulverlauf.

3.1.2 Überblick

Dieses Kapitel hat die Wahrscheinlichkeitstheorie (synonym: Wahrscheinlichkeitsrechnung) bzw. das Konzept der Wahrscheinlichkeit zum Thema.1 Es geht sozusagen um die Mathematik des Zufalls.

3.1.3 Wozu brauche ich dieses Kapitel?

Im wirklichen Leben sind Aussagen (Behauptungen) so gut wie nie sicher.

  • “Weil sie so schlau ist, ist sie erfolgreich.”
  • “In Elektroautos liegt die Zukunft.”
  • “Das klappt sicher, meine Meinung.”
  • “Der nächste Präsident wird XYZ.”

Aussagen sind nur mehr oder weniger (graduell) sicher. Wir können die Regeln der Wahrscheinlichkeitslogik verwenden, um den Grad der Sicherheit (von ganz unsicher bis ganz sicher) zu präzisieren. Daher sagt man auch, Wahrscheinlichkeit sei die Logik der Wissenschaft (Jaynes 2014).

3.1.4 Lernziele

Nach Absolvieren des jeweiligen Kapitels sollen folgende Lernziele erreicht sein.

Sie können …

  • die Grundbegriffe der Wahrscheinlichkeitsrechnung erläuternd definieren
  • die drei Arten der direkten Ermittlung von Wahrscheinlichkeit erläutern
  • typische Relationen (Operationen) von Ereignissen anhand von Beispielen veranschaulichen
  • mit Wahrscheinlichkeiten rechnen

3.1.5 Begleitliteratur

Lesen Sie zur Begleitung dieses Kapitels Bourier (2018), Kap. 2-4.

3.1.6 Eigenstudium

Wichtig

Dieses Kapitel ist selbständig im Eigenstudium vorzubereiten vor dem Unterricht. Lesen Sie dazu die angegebene Literatur. Im Unterricht werden Fragen beantwortet und Aufgaben gemeinsam bearbeitet. Der Stoff wird aber nicht vorgestellt, sondern ist im Selbststudium vorab vorzubereiten.\(\square\)

3.1.7 Prüfungsrelevanter Stoff

Der Stoff dieses Kapitels deckt sich (weitgehend) mit Bourier (2018), Kap. 2-4. Weitere Übungsaufgaben finden Sie im dazugehörigen Übungsbuch, Bourier (2022).

Hinweis

In Ihrer Hochschul-Bibliothek kann das Buch als Ebook verfügbar sein. Prüfen Sie, ob Ihr Dozent Ihnen weitere Hilfen im geschützten Bereich (Moodle) eingestellt hat.\(\square\)

3.1.8 Zentrale Begriffe

3.1.8.1 Grundbegriffe

  • Zufallsvorgang (Zufallsexperiment)
  • Elementarereignis
  • Ereignisraum
  • Zufallsereignis (zufälliges Ereignis)
  • Sicheres Ereignis
  • Unmögliches Ereignis

3.1.8.2 Wahrscheinlichkeitsbegriffe

  • Klassische Wahrscheinlichkeit (LaPlace’sche Wahrscheinlichkeit)
  • Statistische (empirische) Wahrscheinlichkeitsermittlung
  • Subjektive (Bayes) Wahrscheinlichkeitsermittlung

3.1.8.3 Wahrscheinlichkeitsrelationen

  • Vereinigung von Ereignissen
  • Schnitt(menge) von Ereignissen
  • Komplementärereignis
  • Vollständiges Ereignissystem
  • Anforderungen an eine Definition von Wahrscheinlichkeit

3.1.8.4 Wahrscheinlichkeitsrechnung

  • Allgemeiner Additionsssatz
  • Disjunkte Ereignisse
  • Additionssatz für disjunkte Ereignisse
  • Bedingte Wahrscheinlichkeit
  • (Stochastische) Unabhängigkeit
  • Baumdiagramm für gemeinsame Wahrscheinlichkeit
  • Allgemeiner Multiplikationssatz
  • Multiplikationssatz für unabhängige Ereignisse
  • Totale Wahrscheinlichkeit
  • Satz von Bayes

3.1.8.5 Kolmogorovs Wahrscheinlichkeitsdefinition

Wir richten eine Reihe von Forderungen an eine Definition von bzw. an das Rechnen mit Wahrscheinlichkeiten, die direkt plausibel erscheinen:2

  1. Nichtnegativität: Die Wahrscheinlichkeit eines Ereignisses kann nicht negativ sein.
  2. Normierung: Das sichere Ereignis hat die Wahrscheinlichkeit 1 bzw. 100%: \(Pr(\Omega)=1\); das unmögliche Ereignis hat die Wahrscheinlichkeit 0: \(Pr(\emptyset)=0\).
  3. Additivität. Sind \(A\) und \(B\) disjunkt, dann ist die Wahrscheinlichkeit von \(A\cup B\) die Summe der beiden Einzelwahrscheinlichkeiten von \(A\) und \(B\).

3.1.9 Begleitvideos

3.2 Grundbegriffe

Beispiel 3.1 Klassisches Beispiel für einen Zufallsvorgang ist das (einmalige oder mehrmalige) Werfen einer Münze.\(\square\)

Werfen Sie eine Münze! Diese hier zum Beispiel:

Quelle: By OpenClipartVectors, CC0

Wiederholen Sie den Versuch 10 Mal.

Das reicht Ihnen nicht? Okay, wiederholen Sie den Versuch 100, nein 1000, nein: \(10^6\) Mal.

Notieren Sie als Ergebnis, wie oft die Seite mit der Zahl oben liegen kommt (“Treffer”).\(\square\)

Oder probieren Sie die App der Brown University, wenn Sie keine Sehnenscheidenentzündung bekommen wollen.

Definition 3.1 (Zufallsvorgang) Ein Zufallsvorgang oder Zufallsexperiment ist eine einigermaßen klar beschriebene Tätigkeit, deren Ergebnis nicht bekannt ist. Allerdings ist die Menge möglicher Ergebnisse sicher und die Wahrscheinlichkeit für die Ergebnisse kann quantifiziert werden.\(\square\)

Übungsaufgabe 3.1 Nennen Sie Beispiele für Zufallsvorgänge!3

Vorsicht

Zufall heißt nicht, dass ein Vorgang keine Ursachen hätte. So gehorcht der Fall einer Münze komplett den Gesetzen der Gravitation. Würden wir diese Gesetze und die Ausgangsbedingungen (Luftdruck, Fallhöhe, Oberflächenbeschaffenheit, Gewichtsverteilungen, …) exakt kennen, könnten wir theoretisch sehr genaue Vorhersagen machen. Der “Zufall” würde aus dem Münzwurf verschwinden. Man sollte “Zufall” also besser verstehen als “unbekannt”.\(\square\)

Übungsaufgabe 3.2 Mit dieser App können Sie Würfelwürfe simulieren und die Ausgänge dieses Zufallsexperiments beobachten.\(\square\)

Definition 3.2 (Ereignisraum) Die möglichen Ergebnisse eines Zufallvorgangs fasst man als Menge mit dem Namen Ereignisraum[leider gibt es eine Fülle synonymer Namen: Ereignisraum, Elementarereignisraum, Ergebnisraum oder Grundraum] zusammen. Man verwendet den griechischen Buchstaben \(\Omega\) für diese Menge. Die Elemente \(\omega\) (kleines Omega) von \(\Omega\) nennt man Ergebnisse.\(\square\)

Beispiel 3.2 Beobachtet man beim Würfelwurf (s. Abbildung 3.4) die oben liegende Augenzahl, so ist

\[\Omega = \{ 1,2,3,4,5,6 \} = \{⚀, ⚁, ⚂, ⚃, ⚄, ⚅\}\]

ein natürlicher Grundraum (Henze 2019).\(\square\)

Ein (sechsseitiger) Würfel

Bildquelle: CC BY-SA 3.0

Abbildung 3.1: Ein (sechsseitiger) Würfel, Bildquelle: Peter Steinberg, Wikipedia, CC-BY-

Definition 3.3 (Ereignis) Jede Teilmenge4 von \(\Omega\) heißt Ereignis; \(A \subseteq B\) .\(\square\)

Beispiel 3.3 Beim Mensch-ärger-dich-nicht Spielen habe ich eine 6 geworfen.5 Das Nennen wir das Ereignis \(A\): “Augenzahl 6 liegt oben”.\(\square\)

\(A= \{6\}\)

Beispiel 3.4 Sie werfen eine Münze (Sie haben keinen Grund, an ihrer Fairness zu zweifeln). “Soll ich jetzt lernen für die Klausur (Kopf) oder lieber zur Party gehen (Zahl)?”

Abbildung 3.2 zeigt die möglichen Ausgänge (T wie Treffer (Party) und N (Niete, Lernen)) dieses Zufallexperiments.

flowchart LR
 M[Sie werfen die Münze] --> T
 M --> N
Abbildung 3.2: Sie werfen eine Münze. Party oder Lernen???

Zahl! Treffer! Glück gehabt!6\(\square\)

Definition 3.4 (Unmögliches und sicheres Ereignis) Die leere Menge \(\varnothing\) heißt das umögliche, der Grundraum \(\Omega\) heißt das sichere Ereignis. \(\square\)

Beispiel 3.5 (Unmögliches Ereignis) Alois behauptet, er habe mit seinem Würfel eine 7 geworfen. Schorsch ergänt, sein Würfel liege auf einer Ecke, so dass keine Augenzahl oben liegt. Draco hat seinen Würfel runtergeschluckt.\(\square\)

Beispiel 3.6 Nach dem der Würfel geworfen wurde, liegt eine Augenzahl zwischen 1 und 6 oben.\(\square\)

Definition 3.5 (Elementarereignis) Jede einelementige Teilmenge \(\{\omega\}\) von \(\Omega\) heißt Elementarereignis (häufig mit \(A\) bezeichnet).\(\square\)

Beispiel 3.7 (Elementarereignis)  

  • Sie spielen Mensch-ärger-dich-nicht. Und brauchen dringend eine 6. Sie würfeln. Das Ereignis \(A = \{1\}\) tritt ein.7

  • Sie schreiben eine Statistik-Klausur. Irgendwie haben Sie das Gefühl, das Ergebnis ist eine Zufallsexperiment… Jedenfalls können nach Adam Riese zwei Dinge passieren: \(\Omega= \{\text{bestehen, nicht bestehen}\}\). Das erste der beiden Elementarereignisse tritt ein. Yeah!

  • Sie führen eine Studie durch zur Wirksamkeit einer Lern-App. Es ist nicht klar, ob die App wirklich was bringt für den Lernerfolg. Vereinfacht gesprochen ist der Grundraum dieses Experiments: \(\Omega = \{\text{schadet, bringt nichts, nützt}\}\). Die Daten sprechen für das Ereignis \(A = \{\text{bringt nichts}\}\).

Definition 3.6 (Vollständiges Ereignissystem) Wird der Grundraum \(\Omega\) vollständig in paarweis disjunkte Ereignisse zerlegt, so bilden diese Ereignisse ein vollständiges Ereignissystem, s. Abbildung 3.3.\(\square\)

Abbildung 3.3: Zerlegung des Grundraums in ein vollständiges Ereignissystem

Beispiel 3.8 Sei \(\Omega\) der typische Ereignisraum des Würfelwurfs. Wir zerlegen den Grundraum in zwei Ereignisse, \(A\) “gerade Zahlen”, und \(B\) “ungerade Zahlen”. Damit haben wir ein vollständiges Ereignissystem erstellt.

\[\begin{align} A = \{2,4,6\} \qquad \hfill \boxed{\color{gray}{1}\; \boxed{\color{black}{2}}\; \color{gray}{3}\; \boxed{\color{black}{4}}\; \color{gray}{5}\; \boxed{\color{black}{6}}\;} \\ B = \{1,3,5\} \qquad \hfill \boxed{\boxed{\color{black}{1}}\; \color{gray}{2}\; \boxed{\color{black}{3}}\; \color{gray}{4}\; \boxed{\color{black}{5}}\; \color{gray}{6}\; } \\ \hline \\ \Omega = \{1,2,3,4,5,6\} \qquad \hfill \boxed{1\; 2\; 3\; 4\; 5\; 6 } \end{align}\]

Beispiel 3.9 Sei \(\Omega\) der typische Ereignisraum des Würfelwurfs. Wir zerlegen den Grundraum in zwei Ereignisse, \(A\) “1,2,3”, und \(B\) “4,5,6”. Damit haben wir ein vollständiges Ereignissystem erstellt.

\[\begin{align} A = \{1,2,3\} \qquad \qquad \hfill \boxed{\boxed{ \color{black}{1\; 2\; 3}}\; \color{gray}{4\; 5\; 6}} \\ B = \{4,5, 6\} \qquad \qquad \hfill \boxed{\color{gray}{1 \; 2 \; 3}\; \boxed{\color{black}{4\; 5 \; 6}}} \\ \newline \hline \\ \Omega = \{1,2,3,4,5,6\} \qquad \qquad \hfill \boxed{1\; 2\; 3\; 4\; 5\;6} \end{align}\]

Definition 3.7 (Mächtigkeit) Die Anzahl der Elementarereignisse eines Ereignismraums nennt man die Mächtigkeit (des Ereignisraums).8\(\square\)

Die Mächtigkeit von \(\Omega\) bezeichnet man mit dem Symbol \(|\Omega|\).

Beispiel 3.10 Beim Wurf eines Würfels mit \(\Omega=\{1,2,3,4,5,6\}\) gibt es 6 Elementarereignisse. Die Mächtigkeit ist also 6: \(|\Omega|=6\).\(\square\)

3.3 Direkte Ermittlung von Wahrscheinlichkeiten

3.3.1 Epistemologische Wahrscheinlichkeit

Vor uns liegt ein Würfel. Schlicht, ruhig, unbesonders. Wir haben keinen Grund anzunehmen, dass eine seiner \(n=6\) Seiten bevorzugt nach oben zu liegen kommt. Jedes der sechs Elementarereignisse ist uns gleich plausibel; der Würfel erscheint uns fair. In Ermangelung weiteres Wissens zu unserem Würfel gehen wir schlicht davon aus, dass jedes der \(n\) Elementarereignis gleich wahrscheinlich ist. Es gibt keinerlei Notwendigkeit, den Würfel in die Hand zu nehmen, um zu einer Wahrscheinlichkeitsaussage auf diesem Weg zu kommen. Natürlich könnten wir unsere Auffassung eines fairen Würfels testen, aber auch ohne das Testen können wir eine stringente Aussage (basierend auf unserer Annahme der Indifferenz der \(n\) Elementarereignisse) zur Wahrscheinlichkeit eines bestimmten (Elementar-)Ereignisses \(A\) kommen (Briggs 2016), s. Gleichung 3.1.

\[Pr(A) = 1/n= \frac{1}{|\Omega|} \tag{3.1}\]

Beispiel 3.11 Sei \(A\) = “Der Würfel wird beim nächsten Wurf eine 6 zeigen.” Die Wahrscheinlichkeit für \(A\) ist \(1/6. \square\)

Definition 3.8 Ein Zufallsexperiment, bei dem alle Elementarereignisse die selbe Wahrscheinlichkeit haben, nennt man man ein Laplace-Experiment.\(\square\)

In Erweiterung von Gleichung 3.1 können wir schreiben:

\[Pr(A)=\frac{\text{Anzahl Treffer}}{\text{Anzahl möglicher Ergebnisse}}\]

3.3.2 Frequentistische Wahrscheinlichkeit

In Ermangelung einer Theorie zum Verhalten eines (uns) unbekannten Zufallsvorgangs und unter der Vermutung, dass die Elementarereignisse nicht gleichwahrscheinlich sind, bleibt uns ein einfacher (aber aufwändiger) Ausweg: Ausprobieren.

Angenommen, ein Statistik-Dozent, bekannt für seine Vorliebe zum Glücksspiel und scheinbar endlosen Glückssträhnen, er wirft andauernd eine 6, hat seinen Lieblingswürfel versehentlich liegen gelassen. Das ist die Gelegenheit! Sie greifen sich den Würfel, und … Ja, was jetzt? Nach kurzer Überlegung kommen Sie zum Entschluss, den Würfel einen “Praxistest” zu unterziehen: Sie werfen ihn 1000 Mal (Puh!) und zählen den Anteil der 6. Falls der Würfel fair ist, müsste gelten \(Pr(A=6)=1/6\approx .17\). Schauen wir mal!

Und hier der Anteil von 6 im Verlauf unserer Würfe, s. Abbildung 3.4.

Abbildung 3.4: Das Gesetz der großen Zahl am Beispiel der Stabilisierung des Trefferanteils beim wiederholten Würfelwurf

Hm, leider ist auf den ersten Blick kein Anzeichen für Schummeln bzw. einen gezinkten Würfel zu finden (zumindest nicht zu Gunsten des Zwielichten Dozenten).

3.3.3 Subjektive Wahrscheinlichkeit

Um subjektiv zu einer Wahrscheinlichkeit zu kommen, sagt man einfach seine Meinung. Das hört sich natürlich total plump an. Und tatsächlich besteht die Gefahr, dass die so ermittelten Wahrscheinlichkeiten aus der Luft gegriffen, also haltlos, sind.

Allerdings kann diese Art von Wahrscheinlichkeitsermittlung auch sehr wertvoll sein. In komplizierten Situation im echten Leben kommt man oft in die Situation, dass weder die epistemologische noch die frequentistische Variante verwendet werden kann. Dann muss man auf Schätzungen, Vorwissen, Erfahrung, theoretischen Überlengungen etc. zurückgreifen.

3.4 Indirekte Ermittlung von Wahrscheinlichkeiten

Die indirekte Ermittlung von Wahrscheinlichkeiten meint das Ableiten von Wahrscheinlichkeitsaussagen, wenn man schon etwas über die Wahrscheinlichkeiten des Grundraums weiß. Dazu greift man auf Rechenregeln der Stochastik zurück. Das hört sich vielleicht wild an, ist aber oft ganz einfach.

Beispiel 3.12 (Gezinkter Würfel) Ein gezinkter Würfel hat eine erhöhte Wahrscheinlichkeit für das Ereignis \(A=\)“6 liegt oben”, und zwar gelte \(Pr(A)=1/3\). Was ist die Wahrscheinlichkeit, keine 6 zu würfeln?\(\square\)9

Für das Rechnen mit Wahrscheinlichkeiten ist es hilfreich, ein paar Werkzeuge zu kennen, die wir uns im Folgenden anschauen.

3.5 Relationen von Ereignissen

3.5.1 Überblick

Wir gehen von Grundraum \(\Omega\) aus, mit dem Ereignis \(A\) als Teilmenge: \(A \subset B\).

Da wir Ereignisse als Mengen auffassen, verwenden wir im Folgenden die beiden Begriffe synonym.

Dabei nutzen wir u.a. Venn-Diagramme. Venn-Diagramme eigenen sich, um typische Operationen (Relationen) auf Mengen zu visualisieren. Die folgenden Venn-Diagramme stammen von Wikipedia (En).

Wozu sind die Venn-Diagramme gut? Warum soll ich die lernen?

Venn-Diagramme zeigen Kreise und ihre überlappenden Teile; daraus lassen sich Rückschlüsse auf Rechenregeln für Wahrscheinlichkeiten ableiten. Viele Menschen tun sich leichter, Rechenregeln visuell aufzufassen als mit Formeln und Zahlen alleine. Aber entscheiden Sie selbst!\(\square\)

Die folgende App versinnbildlicht das Rechnen mit Relationen von Ereignissen anhand von Venn-Diagrammen.

3.5.2 Vereinigung von Ereignissen

Definition 3.9 (Vereinigung von Ereignissen) Vereinigt man zwei Ereignisse \(A\) und \(B\), dann besteht das neue Ereignis \(C\) genau aus den Elementarereignissen der vereinigten Ereignisse. Man schreibt \(C = A \cup B\), lies: “C ist A vereinigt mit B”.\(\square\)

Abbildung 3.5 zeigt ein Venn-Diagramm zur Verdeutlichung der Vereinigung von Ereignissen.

Abbildung 3.5: \(A \cup B\)

Beispiel 3.13 Um einen (hohen!) Geldpreis zu gewinnen, muss bei ihrem nächsten Wurf mindestens eines der beiden Ereignisse \(A\) oder \(B\) eintreten.

\[\begin{aligned} A = \{1,2\} \qquad \boxed{\boxed{1\; 2}\; \color{gray}{ 3\; 4\; 5\; 6}} \\ B = \{2,3\} \qquad \boxed{1\; \boxed{2\; 3}\; \color{gray}{ 4\; 5\; 6}} \\ \newline \hline \\ A \cup B = \{1,2,3\} \qquad \boxed{\boxed{1\; 2\; 3}\; \color{gray}{4\; 5\; 6}} \end{aligned}\]

Zur besseren Verbildlichung betrachten Sie mal diese Animation zur Vereinigung von Mengen; Quelle.

In R heißt die Vereinigung von Mengen union(). Praktisch zum Ausprobieren:

A <- c(1, 2)
B <- c(2, 3)

union(A, B)
## [1] 1 2 3

3.5.3 (Durch-)Schnitt von Ereignissen

Definition 3.10 (Schnittmenge von Ereignissen) Die Schnittmenge zweier Ereignisse \(A\) und \(B\) umfasst genau die Elementarereignisse, die Teil beider Ereignisse sind. Man schreibt: \(A \cap B.\)10 Lies: “A geschnitten B”. \(\square\)

Abbildung 3.6 zeigt ein Sinnbild zur Schnittmenge zweier Ereignisse.

Abbildung 3.6: \(A \cap B\)

Beispiel 3.14 Um einen (hohen!) Geldpreis zu gewinnen, muss bei ihrem nächsten Wurf sowohl das Ereignis \(A\) = “gerade Augenzahl” als auch \(B\) = “Augenzahl größer 4”.

\[\begin{align} & A = \{2,4,6\} \qquad \hfill \boxed{\color{gray}{1}\; \boxed{\color{black}{2}}\; \color{gray}{3}\; \boxed{\color{black}{4}}\; \color{gray}{5}\; \boxed{\color{black}{6}}\;} \\ & B = \{5,6\} \qquad \qquad \hfill \boxed{ \color{gray}{1\; 2\; 3\; 4\;} \boxed{\color{black}{5\; 6}}} \\ \newline \hline \\ & A \cap B = \{6\} \qquad \qquad \hfill \boxed{\color{gray}{1\; 2\; 3\; 4\; 5\;} \color{black}{6}} \end{align}\]

A <- c(2, 4, 6)
B <- c(5, 6)
intersect(A, B)
## [1] 6
Eselsbrücke zur Vereinigungs- und Schnittmenge

Das Zeichen für eine Vereinigung zweier Mengen kann man leicht mit dem Zeichen für einen Schnitt zweier Mengen leicht verwechseln; d. h.r kommt eine Eselbrücke gelesen, s. Abbildung 3.7.

Abbildung 3.7: Eselsbrücke für Vereinigungs- und Schnittmenge

3.5.4 Komplementärereignis

Definition 3.11 (Komplementärereignis) Ein Ereignis \(A\) ist genau dann ein Komplementärereignis zu \(B\), wenn es genau die Elementarereignisse von \(\Omega\) umfasst, die nicht Elementarereignis des anderen Ereignisses sind, s. Abbildung 3.8.\(\square\)

Man schreibt für das Komplementärereignis von \(A\) oft \(\bar{A}\) oder \(\neg A\)11; lies “Nicht-A” oder “A-quer”.

Beispiel 3.15 Beim normalen Würfelwurf sei \(A\) das Ereignis “gerade Augenzahl”; das Komplementärereignis ist dann \(\neg A\) “ungerade Augenzahl”.

\[\begin{align} A = \{2,4,6\} \qquad \hfill \boxed{\color{gray}{1}\; \boxed{\color{black}{2}}\; \color{gray}{3}\; \boxed{\color{black}{4}}\; \color{gray}{5}\; \boxed{\color{black}{6}}\;} \\ \hline \\ \neg A = \{1,3,5\} \qquad \hfill \boxed{\boxed{\color{black}{1}}\; \color{gray}{2}\; \boxed{\color{black}{3}}\; \color{gray}{4}\; \boxed{\color{black}{5}}\; \color{gray}{6}\; } \\ \end{align}\]

Abbildung 3.8: \(\bar{A}\)

3.5.5 Logische Differenz

Definition 3.12 (Logische Differenz) Die logische Differenz der Ereignisse \(A\) und \(B\) ist das Ereignis, das genau aus den Elementarereignissen besteht von \(A\) besteht, die nicht zugleich Elementarereignis von \(B\) sind, s. Abbildung 3.9.\(\square\)

Die logische Differenz von \(A\) zu \(B\) schreibt man häufig so: \(A \setminus B\); lies “A minus B”.

Abbildung 3.9: \(A \setminus B\)

Beispiel 3.16 Sei \(A\) die Menge “große Zahlen” mit \(A = \{4,5,6 \}\). Sei \(B\) die Menge “gerade Zahlen”. Wir suchen die logische Differenz, \(A \setminus B\).

\[\begin{align} A = \{4,5, 6\} \qquad \hfill \boxed{4\; 5\; 6} \\ B = \{2,4,6\} \qquad \hfill \boxed{2\; 4\; 6} \\ \hline \\ A \setminus B \qquad \hfill \boxed{5} \end{align}\]

In R gibt es die Funktion setdiff(), die eine Mengendifferenz ausgibt.

A <- c(4, 5, 6)
B <- c(2, 4, 6)

setdiff(A, B)
## [1] 5

🤯 Von der Menge \(A\) die Menge \(B\) abzuziehen, ist etwas anderes, als von \(B\) die Menge \(A\) abzuziehen:

setdiff(B, A)
## [1] 2
Vorsicht

\(A \setminus B \ne B \setminus A\).

3.5.6 Disjunkte Ereignisse

Seien \(A= \{1,2,3\}; B= \{4,5,6\}\).

\(A\) und \(B\) sind disjunkt12: ihre Schnittmenge ist leer: \(A \cap B = \emptyset\), s. Abbildung 3.10

Abbildung 3.10: Zwei disjunkte Ereignisse, dargestellt noch überlappungsfreie Kreise

Quelle: rither.de

Beispiel 3.17  

  • Das Ereignis \(A\) “Gerade Augenzahl beim Würfelwurf”, \(A={2,4,6}\) und das Ereignis \(B\) “Ungerade Augenzahl beim Würfelwurf”, \(B={1,3,5}\) sind disjunkt.

  • Die Ereignisse “normaler Wochentag” und “Wochenende” sind disjunkt.\(\square\)

3.5.7 Vertiefung

Animation zu Mengenoperationen

3.6 Rechnen mit Wahrscheinlichkeiten

3.6.1 Additionssatz

Der Additionssatz wird verwendet, wenn wir an der Wahrscheinlichkeit interessiert sind, dass mindestens eines der Ereignisse eintritt.

3.6.1.1 Disjunkte Ereignisse

Gegeben sei \(\Omega = {1,2,3,4,5,6}\). Als Sinnbild: \(\boxed{1\; 2\; 3\; 4\; 5\; 6}\).

Gesucht sei die Wahrscheinlichkeit des Ereignis \(A=\{1,2\}\).

\(\boxed{\boxed{1\; 2}\; \color{gray}{ 3\; 4\; 5\; 6}}\)

\(P(1 \cup 2) = \frac{1}{6} + \frac{1}{6} = \frac{2}{6}\)

Beispiel 3.18 Was ist die Wahrscheinlichkeit, an einem Samstag oder Sonntag geboren zu sein? Unter der (vereinfachten) Annahme, dass alle Jahre zu gleichen Teilen aus allen Wochentagen bestehen und dass an allen Tagen gleich viele Babies geworden werden13, ist die Antwort \(Pr(A)=1/7 + 1/7 = 2/7\).\(\square\)

3.6.1.2 Allgemein (disjunkt oder nicht disjunkt)

Bei der Addition der Wahrscheinlichkeiten für \(A\) und \(B\) wird der Schnitt \(A\cap B\) doppelt erfasst.14 Er muss d. h.r noch abgezogen werden.

Definition 3.13 (Allgemeiner Additionssatz) Die Wahrscheinlichkeit, dass mindestens eines der beiden Ereignisse \(A\) und \(B\) eintritt, ist gleich der Summe ihrer Wahrscheinlichkeiten minus ihrer gemeinsamen Wahrscheinlichkeit, s. Gleichung 3.2.

\[P(A \cup B) = P(A) + P(B) - P(A\cap B) \square \tag{3.2}\]

Beispiel 3.19 (Lernen und Klausur bestehen) In einem angewandten Psychologie-Studiengang sind die Studis verdonnert, zwei Statistik-Module (\(S1, S2\)) zu belegen. Die meisten bestehen (\(B\)), einige leider nicht (\(N\)), s. tbl-klausur2.

Ereignis \(A\) ist “Klausur Statistik 1” mit den Ergebnissen “bestanden” und “nicht bestanden”. Ereignis \(B\) ist analog für “Klausur Statistik 2”.

Wir suchen die Wahrscheinlichkeit, mindestens eine der beiden Klausuren zu bestehen: \(Pr(S_1B \cup S_2B)\). Nennen wir das Ereignise \(A\).

Tabelle 3.1: Daten von 100 Studis; L: Lerner, B: Bestanden, N: Negation/Nicht
. S1_B S1_NB Summe
S2_B 85 9 94
S2_NB 5 1 6
Summe 90 10 100
\[\begin{aligned} Pr(A) &= Pr(S_1B \cup S_2B) \\ &= Pr(S1_B) + Pr(S_2B) - Pr(S_1B \cap S_2B) \\ &= (90 + 94 - 85) / 100 = 99 / 100\\ \end{aligned}\]

Die Wahrscheinlichkeit, mindestens eine der beiden Klausuren zu bestehen liegt bei 99%. Umgekehrt liegt die Wahrscheinlichkeit, keine der beiden Klausuren zu bestehen, liegt bei \(Pr(\neg A) = 1- Pr(A) = 0.01 = 1\%\); ein Sachverhalt, der sich auch mit einem kurzen Blick in die Datentabelle erkennen lässt.\(\square\)

3.6.2 Bedingte Wahrscheinlichkeit

Definition 3.14 (Bedingte Wahrscheinlichkeit) Die Bedingte Wahrscheinlichkeit ist die Wahrscheinlichkeit, dass \(A\) eintritt, gegeben dass \(B\) schon eingetreten ist. \(\square\)

Man schreibt: \(Pr(A|B).\) Lies: “A gegeben B” oder “A wenn B”.

Übungsaufgabe 3.3 Schauen Sie sich mal diese Wahnsinnsanimation von Victor Powell an zu bedingten Wahrscheinlichkeiten. Hammer!

Abbildung 3.11 illustriert gemeinsame Wahrscheinlichkeit, \(P(A \cap B)\), und bedingte Wahrscheinlichkeit, \(P(A|B)\).

(a) Wahrscheinlichkeit für Ereignis B: 50%
(b) Wahrscheinlichkeit für Ereignis A: 50%
(c) Wahrscheinlichkeit für Ereignis B gegeben A: 50%
Abbildung 3.11: Illustration von gemeinsamer und bedingter Wahrscheinlichkeit

Beispiel 3.20 (Bedingte Wahrscheinlichkeit) Sei \(A\) “Schönes Wetter” und \(B\) “Klausur steht an”. Dann meint \(Pr(A|B)\) die Wahrscheinlichkeit, dass das Wetter schön ist, wenn gerade eine Klausur ansteht.\(square\)

Beispiel 3.21 (Von Päpsten und Männern) Man(n) beachte, dass die Wahrscheinlichkeit, Papst \(P\) zu sein, wenn man Mann \(M\) ist etwas anderes ist, als die Wahrscheinlichkeit, Mann zu sein, wenn man Papst ist: \(Pr(P|M) \ne Pr(M|P)\). Das hört sich erst verwirrend an, aber wenn man darüber nachdenkt, wird es sehr plausibel.\(\square\)

Beispiel 3.22 (Kalt und Regen) Die Wahrscheinlichkeit, dass es kalt ist, wenn es regnet, ist gleich der Wahrscheinlichkeit, dass es gleichzeitig kalt ist und regnet geteilt durch die Wahrscheinlichkeit, dass es regnet.\(\square\)

Beispiel 3.23 Gustav Groß-Gütz verkauft eine Tinktur15, die schlau machen soll, “Gützis Gehirn Grütze”.16 Gustav trinkt die Grütze und sagt schlaue Dinge. Was schließen wir daraus? Sei \(H\) (wie Hypothese) “Gützis Grütze macht schlau”; sei \(D\) (wie Daten) die Beobachtung, dass Gustav schlaue Dinge gesagt hat. Ohne exakte Zahlen zu suchen, wie hoch ist wohl \(Pr(D|H)\)? In Worten: “Wie wahrscheinlich ist es, schlaue Dinge gesagt zu haben, wenn die Grütze wirklich schlau macht?”. Vermutlich ist diese Wahrscheinlichkeit sehr hoch. Aber wie hoch ist wohl \(Pr(H|D)\)? In Worten: “Wie wahrscheinlich ist es, dass die Grütze wirklich schlau macht, gegeben, dass wir gesehen hat, dass jemand etwas schlaues gesagt hat, nachdem er besagte Grütze getrunken hat?” Skeptische Geister werden der Meinung sein, \(Pr(H|D)\) ist gering. Das Beispiel zeigt u.a. \(Pr(H|D) \ne Pr(D|H).\square\)

Das Berechnen einer bedingten Wahrscheinlichkeit, \(Pr(A|B)\), ist vergleichbar zum Filtern einer Tabelle:

id A B
1 0 0
2 0 1
3 1 0
4 1 1
SUMME 2 2

Es ergeben sich folgende Wahrscheinlichkeiten:

\(Pr(A) = 2/4; Pr(B) = 2/4; Pr(A \cap B) = 1/4; Pr(A|B) = 1/2\)

3.6.2.1 Rechenregel

Die Wahrscheinlichkeit für \(A\), wenn \(B\) schon eingetreten ist, berechnet sich so, s. Gleichung 3.3.

\[Pr(A|B) = \frac{Pr(A \cap B)}{Pr(B)} \tag{3.3}\]

Außerdem gilt analog

\[Pr(B|A) = \frac{Pr(B \cap A)}{Pr(A)} \tag{3.4}\]

Stochastische Unabhängigkeit ist symmetrisch: Wenn \(A\) unabhängig zu \(B\) ist auch \(B\) unabhängig zu \(A\),

\[Pr(A|B) = Pr(A) \leftrightarrow Pr(B|A) = Pr(A) \tag{3.5}\]

Man beachte, dass stochastische Unabhängigkeit und kausale Unabhängigkeit unterschiedliche Dinge sind (Henze 2019): Stochastische Unabhängigkeit impliziert nicht kausale Unahbängigkeit.

Beispiel 3.24 (Lernen und Klausur bestehen) Sie bereiten sich gerade auf die Klausur bei Prof. Süß vor. Das heißt: Sie überlegen, ob Sie sich auf die Klausur vorbereiten sollten. Vielleicht lohnt es sich ja gar nicht? Vielleicht ist die Wahrscheinlichkeit zu bestehen, wenn man nicht gelernt hat, sehr groß? Aber da Sie nun mal auf Fakten stehen, haben Sie sich nach einiger Recherche folgende Zahlen besorgen können, s. Tabelle 3.2. In der Tabelle sind die Daten von 100 Studis ausgewiesen. Ein Teil hat sich vorbereitet, ordentlich gelernt, nenen wir sie die “Lerner. Ein anderer Teil hat nicht gelernt, \(NL\) bzw. \(\neg L\). Ein Teil hat bestanden, \(B\), ein Teil nicht \(NB\) oder \(\neg B\).

Wir suchen die Wahrscheinlichkeit, zu bestehen, wenn man nicht gelernt hat: \(Pr(B |\neg L)\).

Tabelle 3.2: Daten von 100 Studis; L: Lerner, B: Bestanden, N: Negation/Nicht
. L NL Summe
B 80 1 81
NB 5 14 19
Summe 85 15 100
\[\begin{aligned} Pr(B |\neg L) &= \frac{Pr(B \cap \neg L)}{Pr(\neg L)} \\ &=\frac{1/100}{15/100} = 1/15 \\ \end{aligned}\]

Die Wahrscheinlichkeit, zu bestehen, wenn man nicht gelernt hat, liegt bei 1 von 15, also ca. 7%.17 \(\square\)

3.6.3 Stochastische (Un-)Abhängigkeit

Stochastische Unabhängigkeit ist ein Spezialfall von Abhängigkeit: Es gibt sehr viele Ausprägungen für Abhängigkeit, aber nur eine für Unabhängigkeit. Können wir Unabhängigkeit nachweisen, haben wir also eine starke Aussage getätigt.

Definition 3.15 (Stochastische Unabhängigkeit) Zwei Ereignisse sind (stochastisch) unabhängig voneinander, wenn die Wahrscheinlichkeit von \(A\) nicht davon abhängt, ob \(B\) der Fall ist, s. Gleichung 3.6. Dann gilt:18

\[Pr(A|B) = Pr(A) = Pr(A|\neg B). \square \tag{3.6}\]

Die Unabhängigkeit von \(A\) und \(B\) wird manchmal so in Kurzschreibweise ausgedrückt: \(\perp \!\!\! \perp(A, B) \square\).

Setzt man Gleichung 3.4 in Gleichung 3.6 (linke Seite) ein, so folgt19

\[Pr(B \cap A) = Pr(A) \cdot Pr(B). \tag{3.7}\]

Beispiel 3.25 (Augenfarbe und Statistikliebe) Ich vermute, dass die Ereignisse \(A\), “Augenfarbe ist blau”, und \(B\), “Ich liebe Statistik”, voneinander unabhängig sind.\(\square\)20

Beispiel 3.26 (Überleben auf der Titanic) S. Abbildung 3.12, links: Überleben (Ü) auf der Titanic ist offenbar abhängig von der Passagierklasse (\(K_1, K_2, K_3\)). In Abbildung 3.12, links gilt also \(Pr(Ü|K_1) \ne Pr(Ü|K_2) \ne Pr(Ü|K_3) \ne Pr(Ü)\).

Auf der anderen Seite: Das Ereignis Überleben (Ü) auf der Titanic ist unabhängig vom Ereignis Alter ist eine Primzahl (P), s. Abbildung 3.12, rechts. Also: \(Pr(Ü|P) = Pr(Ü|\neg P) = Pr(Ü)\), vgl. Tabelle 3.3.

Tabelle 3.3: Kontingenztablle (Häufigkeiten) für ‘Überleben auf der Titanic’ und ‘Alter ist Primzahl’. Wie man sieht, gibt es keine stochastische Abhängigkeit.
Age_prime n prop
0
non-prime 96 0.17
prime 453 0.83
1
non-prime 58 0.17
prime 282 0.83
(a) Überleben und Passagierklasse sind abhängig
(b) Überleben und ‘Geburstag ist eine Primzahl’ sind nicht abhängig
Abbildung 3.12: Abhängigkeit und Unabhängigkeit zweier Ereignisse

Beispiel 3.27 (Zusammenhang von Covidsterblichkeit und Impfquote) Sind die Ereignisse Tod durch Covid bzw. Impfquote (\(A\)) und Land21 (\(B\)) voneinander abhängig (Abbildung 3.13)?

(a) Impfquote und Land sind voneinander abhängig
(b) Anteil Corona-Tote und Land sind voneinander abhängig
Abbildung 3.13: Impfquote und Sterblichkeit sind voneinander abhängig (bezogen auf Covid, auf Basis vorliegender Daten)

Ja, die beiden Ereignisse sind abhägig, da in beiden Diagrammen gilt: \(P(A|B) \ne Pr(A) \ne Pr(A|\neg B)\).\(\square\)22

3.6.4 Multiplikationssatz

Gegeben seien die Ereignisse \(A\) und \(B\). Der Multiplikationssatz wird verwendet, wenn wir an der Wahrscheinlichkeit interessiert sind, dass beide Ereignisse \(A\) und \(B\) eintreten.

3.6.4.1 Unabhängige Ereignisse

Beispiel 3.28 Wir führen das Zufallsexperiment “Wurf einer fairen Münze” zwei Mal aus (Abbildung 3.14). Wie groß ist die Wahrscheinlichkeit, 2 Mal Kopf zu werfen? Dabei vereinbaren wir, dass “Kopf” als “Treffer” zählt (und “Zahl” als “Niete”).\(\square\)

Abbildung 3.14: Wir werfen zwei faire Münzen

Abbildung 3.14 zeigt ein Baumdiagramm. Jeder Kasten (Knoten) zeigt ein Ergebnis. Die Pfeile (Kanten) symbolisieren die Abfolge des Experiments: Vom “Start” (schwarzer Kreis) führen zwei mögliche Ergebniss ab, jeweils mit Wahrscheinlichkeit 1/2. Die untersten Knoten nennt man auch Blätter (Endknoten), sie zeigen das Endresultat des (in diesem Fall) zweifachen Münzwurfs. Der Weg vom Start zu einem bestimmten Blatt nennt man Pfad. Die Anzahl der Pfade entspricht der Anzahl der Blätter. In diesen Diagramm gibt es vier Pfade (und Blätter).

Den Wurf der ersten Münze nennen wir in gewohnter Manier \(A\); den Wurf der zweiten Münze \(B\).

Die Wahrscheinlichkeiten der resultierenden Ereignisse finden sich in Tabelle 3.4.

Tabelle 3.4: Wahrscheinlichkeiten der Ereignisse im zweimaligen Münzwurf
Ereignis Pr
0K 1/2 * 1/2 = 1/4
1K 1/4 + 1/4 = 1/2
2K 1/2 * 1/2 = 1/4

Sei \(K_1\) das Ereignis, mit der 1. Münze Kopf zu werfen; sei \(K_2\) das Ereignis, mit der 2. Münze Kopf zu werfen-

Wir suchen \(Pr(K_1 \cap K_2)\). Aufgrund der stochastischen Unabhängigkeit der beiden Ereignisse gilt: \(Pr(K_1 \cap K_2) = Pr(K_1) \cdot Pr(K_2)\).

Pr_K1K2 <- 1/2 * 1/2
Pr_K1K2
## [1] 0.25

Definition 3.16 (Multiplikationssatz für unabhängige Ereignisse) Die Wahrscheinlichkeit, dass zwei unabhängige Ereignisse \(A\) und \(B\) gemeinsam eintreten, ist gleich dem Produkt ihrer jeweiligen Wahrscheinlichkeiten, s. Gleichung 3.8.

\[Pr(A \cap B) = Pr(AB) = Pr(A) \cdot Pr(B) = Pr(B\cap A) = Pr(B) \cdot Pr(A)\square \tag{3.8}\]

Mit dieser App können Sie das Baumdiagramm für den zweifachen Münzwurf näher erkunden.

Wir führen das Zufallsexperiment “Wurf einer fairen Münze” drei Mal aus (Abbildung 3.15). Dabei vereinbaren wir wieder, dass “Kopf” (K) als “Treffer” gilt und “Zahl” (Z) als “Niete”.

Abbildung 3.15: Wir werfen drei faire Münzen

Beim Wurf von “fairen” Münzen gehen wir davon aus, dass Kenntnis des Ergebnis des 1. Wurfes unsere Einschätzung des Ergebnis des 2. Wurfes nicht verändert etc. Anders gesagt: Wir gehen von (stochastischer) Unabhängigkeit aus.

Für z. B. das Ereignis \(A=\{ZZZ\}\) gilt: \(Pr(A) = 1/2 \cdot 1/2 \cdot 1/2 = (1/2)^3\). Da jeder Endknoten (jedes Blatt) gleichwahrscheinlich ist, ist die Wahrscheinlichkeit jeweils gleich.

Allgemeiner gilt: Für ein Zufallsexpriment, das aus \(k\) Wiederholungen besteht und in jeder Wiederholung die Wahrscheinlichkeit \(Pr(X)=p\) ist, so ist die Wahrscheinlichkeit für einen Endkonten \(Pr(X^k)=p^k\).

Tabelle 3.5: Ausgewählte Wahrscheinlichkeiten von Ereignissen im dreifachen Münzwurf

Da die Endknoten disjunkte Elementarereignisse sind, kann man ihre Wahrscheinlichkeit addieren, um zu anderen (zusammengesetzten) Ereignissen zu kommen, vgl. Tabelle 3.5.

Abbildung 3.11 versinnbildlicht nicht nur die Bedingtheit zweier Ereignisse, sondern auch die (Un-)Abhängigkeit zweier Ereignisse, \(A\) und \(B\). In diesem Fall ist die Wahrscheinlichkeit von \(A\) gleich \(B\): \(Pr(A)=Pr(B)=.5\). Man sieht, dass die Wahrscheinlichkeit von \(A\) bzw. von \(B\) jeweils die Hälfte der Fläche (der Gesamtfläche, d.h von \(Pr(\Omega)=1\)) ausmacht. Die Schnittmenge der Fläche von \(A\) und \(B\) entspricht einem Viertel der Fläche: \(Pr(AB) = Pr(A) \cdot Pr(B) = 50\% \cdot 50\% = 25\%.\) In diesem Fall sind \(A\) und \(B\) unabhängig.

(a) \(A\)
(b) \(B\)
(c) \(A \cap B\), \(B|A\)
Abbildung 3.16: Unabhängige Ereignisse visualisiert

Abbildung 3.16 zeigt weiterhin, dass gilt: \(P(A\cap B) = P(A) \cdot P(B) = P(B) \cdot P(A)\).

Beispiel 3.29 (Kalt und Regen) Von McElreath (2020) stammt diese Verdeutlichung der gemeinsamen Wahrscheinlichkeit:

Was ist die Wahrscheinlichkeit für kalt ❄ und Regen ⛈️?

Die Wahrscheinlichkeit für kalt und Regen ist die Wahrscheinlichkeit von Regen ⛈, wenn’s kalt ❄ ist mal die Wahrscheinlichkeit von Kälte ❄.

Ebenfalls gilt:

Die Wahrscheinlichkeit für kalt und Regen ist die Wahrscheinlichkeit von Kälte ❄, wenn’s regnet ⛈️ mal die Wahrscheinlichkeit von Regen ⛈️.

Das Gesagte als Emoji-Gleichung:

\(P(❄️ \text{ und } ⛈️) = P(⛈️ |❄️ ) \cdot P(❄️) = P(❄️ |⛈️ ) \cdot P(⛈️) = P(⛈ \text{ und } ❄️)\) Man kann also die “Gleichung drehen”.23\(\square\)

Definition 3.17 (Kettenregel) Allgemein gesagt, spricht man von der Kettenregel der Wahrscheinlichkeitsrechnung, s. Gleichung 3.9.

\[P(A\cap B) = P(A) \cdot P(B|A) = P(B) \cdot P(A|B)\square \tag{3.9}\]

In Worten: Die Wahrscheinlichkeit von \(A\) gegeben \(B\) ist gleich der Wahrscheinlichkeit von \(A\) mal der Wahrscheinlichkeit von \(B\) gegeben \(A\).

3.6.4.2 Abhängige Ereignisse

Ein Baumdiagramm bietet sich zur Visualisierung abhängiger Ereignisse an, s. Abbildung 3.17. Für unabhängige Ereignisse übrigens auch.

Beispiel 3.30 In einer Urne befinden sich fünf Kugeln, von denen vier rot sind und eine blau ist.

wie groß ist die Wahrscheinlichkeit, dass bei zwei Ziehungen ohne Zurücklegen (ZOZ) zwei rote Kugeln gezogen werden (Bourier 2018), S. 47.

Hier ist unsere Urne:

\[\boxed{\color{red}{R, R, R, R}, \color{blue}B}\]

Und jetzt ziehen wir. Hier ist das Baumdiagramm, s. Abbildung 3.17.

flowchart LR
  A[Start] -->|4/5|B[1. Zug: R]
  A -->|1/5|C[1. Zug: B]
  B -->|3/4|D[2. Zug: R]
  B -->|1/4|E[2. Zug: B]
  D --- H[Fazit: RR:  12/20]
  E --- I[Fazit: RB: 4/20]
  C -->|4/4|F[2. Zug: R]
  C -->|0/4|G[2. Zug: B]
  F --- J[Fazit: BR: 4/20]
  G --- K[Fazit: BB: 0/20]
Abbildung 3.17: Baumdiagramm für ein ein zweistufiges Zufallsereignis, wobei der 2. Zug (Stufe) abhängig ist vom 1. Zug.

Es gilt also: \(P(A\cap B) = P(A) \cdot P(B|A) \square\).

Beispiel 3.31 (Bertie Botts Bohnen jeder Geschmacksrichtung)  

Sei bloß vorsichtig mit denen. Wenn sie sagen jede Geschmacksrichtung, dann meinen sie es auch - Du kriegst zwar alle gewöhnlichen wie Schokolade und Pfefferminz und Erdbeere, aber auch Spinat und Leber und Kutteln. George meint, er habe mal eine mit Popelgeschmack gehabt.“

— Ron Weasley zu Harry Potter24

In einem Beutel liegen \(n=20\) Bertie Botts Bohnen jeder Geschmacksrichtung. Uns wurde verraten, dass fast alle gut schmecken, also z. B. nach Schokolade, Pfefferminz oder Marmelade. Leider gibt es aber auch \(x=3\) furchtbar scheußliche Bohnen (Ohrenschmalz-Geschmacksrichtung oder Schlimmeres). Sie haben sich nun bereit erklärt, \(k=3\) Bohnen zu ziehen. Und zu essen, und zwar direkt und sofort! Also, jetzt heißt es tapfer sein. Ziehen und runter damit!

Wie groß ist die Wahrscheinlichkeit, genau eine scheußliche Bohne zu erwischen?

Es gibt drei Pfade für 1 Treffer bei 3 Wiederholungen:

Pfad1 <- 3/20 * 17/19 * 16/18
Pfad2 <- 17/20 * 3/19 * 16/18
Pfad3 <- 17/20 * 16/19 * 3/18

Gesamt_Pr <- Pfad1 + Pfad2 + Pfad3
Gesamt_Pr
## [1] 0.3578947

Nutzen Sie diese App, um das auszuprobieren. Sie müssen in der App noch die Zahl der Bohnen (\(n\)) und die Zahl der scheußlichen Bohnen (\(x\)) einstellen.\(\square\)

3.6.5 Baumdiagramm sucht Problem

Überlegen Sie sich eine Problemstellung (Aufgabenstellung), die mit folgender Baumdiagramm-App gelöst werden kann.\(\square\)

3.6.6 Totale Wahrscheinlichkeit

Abbildung 3.18 zeigt das Baumdiagramm für die Aufgabe Bourier (2018), S. 56.

flowchart LR
  A[Start] -->|0.6|B[A1]
  A -->|0.1|C[A2]
  A -->|0.3|D[A3]
  B -->|0.05|E[B]
  B -.->|0.95|F[Nicht-B]
  C -->|0.02|G[B]
  C -.->|0.98|H[Nicht-B]
  D -->|0.04|I[B]
  D -.->|0.96|J[Nicht-B]
Abbildung 3.18: Totale Wahrscheinlichkeit

Gesucht ist die Wahrscheinlichkeit \(P(B)\); \(A\) ist ein vollständiges Ereignissystem.

Dazu addieren wir die Wahrscheinlichkeiten der relevanten Äste. Jeder Ast stellt wiederum das gemeinsame Auftreten der Ereignisse \(A_i\) und \(B\) dar.

W_Ast1 <- 0.6 * 0.05  # Wahrscheinlichkeit für Ast 1
W_Ast2 <- 0.1 * 0.02  # ... Ast 2
W_Ast3 <- 0.3 * 0.04  # ... Ast 3
W_total <- W_Ast1 + W_Ast2 + W_Ast3  # totale W.
W_total
## [1] 0.044

Die totale Wahrscheinlichkeit beträgt in diesem Beispiel also \(P(B) = 4.4\%\).25

Definition 3.18 (Totale Wahrscheinlichkeit) Bilden die Ereignisse \(A_1, A_2, ..., A_n\) ein vollständiges Ereignissystem und ist \(B\) ein beliebiges Ereignis dann gilt \(Pr(B) = \sum_{i=1}^n Pr(A_i) \cdot Pr(B|A_i).\square\)

In Abbildung 3.18 gilt \(Pr(B) = 0.6 \cdot 0.05 + 0.1 \cdot 0.02 + 0.3 \cdot 0.04 = 0.03 + 0.002 + 0.012 = 0.04.\square\)

Übungsaufgabe 3.4 (Bertie Botts Bohnen jeder Geschmacksrichtung, Teil 2) Es ist die gleich Aufgabe wie Beispiel 3.31, aber jetzt lautet die Frage: Wie groß ist die Wahrscheinlichkeit, mindestens eine scheußliche Bohne zu erwischen?26

\(\square\)

3.6.7 Baumsammlung

Baumdiagramme sind ein hilfreiches Werkzeug für wiederholte Zufallsexperimente. Daher ist hier eine “Baumsammlung”27 zusammengestellt, s. fig-baumsammlung.

3.7 Bayes’ Theorem

3.7.1 Wozu wird Bayes in der Praxis genutzt?

In der Praxis nutzt man Bayes häufig, wenn man Daten zu einer Wirkung \(W\) hat, und auf die Ursache \(U\) zurückschließen möchte, sinngemäß:

\[W \quad \underrightarrow{Bayes} \quad U\]

Dann kann man Gleichung 3.12 so schreiben, s. Gleichung 3.10:

\[P(U|W) = \frac{ P(U) \cdot P(W|U) }{P(W)} \tag{3.10}\]

Eine ähnliche Situation, die in der Praxis häufig ist, dass man Daten \(D\) hat und auf die Wahrscheinlichkeit einer Hypothese \(H\) schließen möchte, s. Gleichung 3.11.

\[D \quad \underrightarrow{Bayes} \quad H\]

\[P(H|D) = \frac{ P(H) \cdot P(D|H) }{P(D)} \tag{3.11}\]

Gleichung 3.11 fragt nach \(P(H|D)\):

Was ist die Wahrscheinlichkeit der Hypothese H, jetzt wo wir die Daten haben (und ein Modell?)

Und antwortet so (Gleichung 3.11):

Diese Wahrscheinlichkeit entspricht der Grundrate (Apriori-Wahrscheinlichkeit) der Hypothese mal der Plausibilität (Likelihood) der Daten unter Annahme (gegeben) der Hypothese. Aus Standardisierungsgründen dividiert man noch die totale Wahrscheinlichkeit der Daten über alle Hypothesen.

3.7.2 Bayes als Baum

Gesucht sei \(P(A_1|B)\).

Für Bayes’ Formel28 setzt man die Wahrscheinlichkeit des günstigen Ast zur Wahrscheinlichkeit aller relevanten Äste, \(P(B)\).

Beispiel 3.32 (Maschine produziert Ausschuss) Die drei Maschinen \(M_1, M_2, M_3\) produzieren den gleichen Artikel. Ihr jeweiliger Anteil, an der Produktion liegt bei 60%, 10% bzw. 30%. Die jeweilige Ausschussquote liegt bei 5, 2, bzw. 4%, s. Abbildung 3.19. Aufgabe: Wie groß ist die Wahrscheinlichkeit, dass ein defektes Teil von Maschine 1 produziert wurde?\(\square\)

Der günstige (gesuchte) Ast ist hier schwarz gedruckt, die übrigen Äste gestrichelt, s. Abbildung 3.19. \(A_i\) zeigt das Ereignis, dass der Artikel von Maschine \(i\) produziert wurde. \(B\) ist das Ereignis “Artikel ist Ausschuss”.

flowchart LR
  A[Start] -->|0.6|B[A1]
  A -.->|0.1|C[A2]
  A -.->|0.3|D[A3]
  B --->|0.05|E[B]
  B -.->|0.95|F[Nicht-B]
  C -.->|0.02|G[B]
  C -.->|0.98|H[Nicht-B]
  D -.->|0.04|I[B]
  D -.->|0.96|J[Nicht-B]
Abbildung 3.19: Günstige Pfade

\[P(A|B) = \frac{P(A1 \cap B)}{P(B)} = \frac{0.6 \cdot 0.05}{0.03 + 0.002 + 0.012} = \frac{0.03}{0.044} \approx 0.68\]

\(P(A|B)\) beträgt also ca. 68%.

Zur Erinnerung: \(P(B)\) ist die totale Wahrscheinlichkeit.

3.7.3 Bayes als bedingte Wahrscheinlichkeit

Bayes’ Theorem ist auch nur eine normale bedingte Wahrscheinlichkeit:

\(P(A|B) = \frac{\overbrace{ P(A\cap B)}^\text{umformen}}{P(B)}\)

\(P(A| B)\) kann man umformen, s. Gleichung 3.12:

\[P(A|B) =\frac{P(A\cap B)}{P(B)} = \frac{P(B|A) \cdot P(A)}{P(B)} \tag{3.12}\]

Man kann sich Bayes’ Theorem auch wie folgt herleiten:

\(P(A\cap B) = P(B \cap A) = P(A) \cdot P(B|A) = P(B) \cdot P(A|B)\)

Dann lösen wir nach P\((A|B)\) auf:

\(P(A|B) = \frac{P(A) \cdot P(B|A)}{P(B)}\)

3.7.4 Zusammengesetzte Hypothesen

Das ist vielleicht ein bisschen fancy, aber man kann Bayes’ Theorem auch nutzen, um die Wahrscheinlichkeit einer zusammengesetzten Hypothese zu berechnen: \(H = H_1 \cap H_2\). Ein Beispiel wäre: “Was ist die Wahrscheinlichkeit, dass es Regen (\(R\)) und Blitzeis (\(B\)) gibt, wenn es kalt (\(K\)) ist?”.

Das sieht dann so aus, Gleichung 3.13:

\[ \begin{aligned} P(R \cap B |K) &= \frac{ P(R \cap B) \cdot P(K|R \cap B) }{P(D)} \\ &= \frac{ P(R ) \cdot P(B) \cdot P(K|R \cap B) }{P(D)} \end{aligned} \tag{3.13}\]

Hier haben wir \(P(R \cap B)\) aufgelöst in \(P(R) \cdot P(B)\), das ist nur zulässig, wenn \(R\) und \(B\) unabhängig sind.

3.8 Vertiefung

Bei Henze (2019) findet sich eine anspruchsvollere Einführung in das Rechnen mit Wahrscheinlichkeit; dieses Kapitel behandelt ein Teil des Stoffes der Kapitel 2 und 3 von Henze (2019).

Mit dieser App, die ein zweistufiges Baumdiagramm zeigt, können Sie das Verhalten von verschiedenen Arten von Wahrscheinlichkeiten weiter untersuchen.

Diese App lässt dich herausfinden, ob man wirklich krank ist, wenn der Arzt es bheauptet.

Das Video zu Bayes von 3b1b verdeutlicht das Vorgehen der Bayes-Methode auf einfache und anschauliche Weise.

(mittag_statistik_2020?) stellen in Kap. 11 die Grundlagen der Wahrscheinlichkeitstheorie vor. Ähnliche Darstellungen finden sich in einer großen Zahl an Lehrbüchern.

3.9 Aufgaben

Bearbeiten Sie die Aufgabe in der angegeben Literatur.

  1. Additionssatz1

  2. Nerd-gelockert

  3. Urne1

  4. Urne2

  5. k-coins-k-hits

  6. sicherheit

  7. sicherheit2

  8. Klausuren-bestehen

  9. Gem-Wskt1

  10. Gem-Wskt2

  11. Gem-Wskt3

  12. wuerfel05

  13. wuerfel06

  14. Bed-Wskt1

  15. Bed-Wskt2

  16. Bed-Wskt3

  17. mtcars-abhaengig

  18. mtcars-abhaengig-var2

  19. mtcars-abhaengig_var3a

  20. voll-normal

  21. corona-blutgruppe

  22. totale-Wskt1

  23. Krebs1

  24. Bayes-Theorem1

  25. wskt-df-r

3.10


  1. Die Wahrscheinlichkeitstheorie bildet zusammen mit der Statistik das Fachgebiet der Stochastik.↩︎

  2. Ein Herr Kolmogorov hat das mal aufgeschrieben.↩︎

  3. Beispiele für Zufallsexperimente sind das Werfen einer Münze, das Ziehen einer Karte aus einem Kartenspiel, das Messen eines Umweltphänomens wie der Temperatur oder die Anzahl der Kunden, die einen Laden betreten. In jedem dieser Fälle sind die möglichen Ergebnisse nicht im Voraus bekannt und hängen von nicht komplett bekannten Faktoren ab.↩︎

  4. \(A\) ist eine Teilmenge von \(B\), wenn alle Elemente von \(A\) auch Teil von \(B\) sind.↩︎

  5. Schon wieder.↩︎

  6. ?↩︎

  7. Na toll.↩︎

  8. Die Menge aller Teilmengen einer Menge \(A\) nennt man die Potenzmenge \(\mathcal{P}(A)\), vgl. hier.↩︎

  9. Die Wahrscheinlichkeit, keine 6 zu würfeln, liegt bei \(2/3\).↩︎

  10. Synonym und kürzer: \(AB\) anstelle von \(A \cap B\).↩︎

  11. manchmal auch \(A^C\); C wie complementary event↩︎

  12. engl. disjoint↩︎

  13. vermutlich gibt es noch mehr Annahmen, die wir uns explizit machen sollten.↩︎

  14. sofern sie nicht disjunkt sind, aber wenn sie diskunkt sind, so ist der Schnitt gleich Null und wir machen auch dann nichts falsch↩︎

  15. genauer besehen sieht sie eher aus wie eine Grütze oder ein Brei↩︎

  16. Sie schmeckt scheußlich.↩︎

  17. \(Pr(L).85; Pr(\neg L) = .15; Pr(B) =.81; Pr(\neg B) = .19\)↩︎

  18. Exakte Gleichheit ist in dieser Welt empirisch schwer zu finden. Daher kann man vereinbaren, dass Unabhängigkeit erfüllt ist, wenn die Gleichheit “einigermaßen” oder “ziemlich” gilt, die Gleichheit gewissermaßen “praktisch bedeutsam” ist.↩︎

  19. Vgl. Gleichung 3.8↩︎

  20. Wer Daten dazu hat oder eine Theorie, der melde sich bitte bei mir.↩︎

  21. hier mit den zwei Ausprägungen DEU und USA↩︎

  22. Daten von Our World in Data.↩︎

  23. Da \(P(A\cap B)=Pr(B \cap A)\)↩︎

  24. Quelle: https://harrypotter.fandom.com/de/wiki/Bertie_Botts_Bohnen_jeder_Geschmacksrichtung↩︎

  25. Einfacher als das Rechnen mit Wahrscheinlichkeiten ist es in solchen Fällen, wenn man anstelle von Wahrscheinlichkeiten absolute Häufigkeiten zum Rechnen verwendet.↩︎

  26. Die Wahrscheinlichkeit keine scheußliche Bohne zu ziehen ist \(1 - (17/20 \cdot 16/19 \cdot 15/18) \approx 0.4\).↩︎

  27. Wald?↩︎

  28. synonym: Satz von Bayes↩︎