Wahrscheinlichkeitsrechnung mit Bernoulli-Experimenten

Einführung

Ein Zufallsexperiment, das genau zwei mögliche Ausgänge hat, z. B. Treffer und Nicht-Treffer, heißt Bernoulli-Experiment. Dabei wird p als Treffer-Wahrscheinlichkeit bezeichnet, die Wahrscheinlichkeit dafür, dass kein Treffer eintritt, ist entsprechend q=1-p.

Wird ein solches Experiment n Mal hintereinander durchgeführt, so liegt eine Bernoulli-Kette der Länge n vor.

Um die Wahrscheinlichkeit $B_{n;p}(k)$ dafür zu berechnen, dass bei einer Bernoulli-Kette der Länge n mit der Treffer-Wahrscheinlichkeit p genau k Treffer vorkommen, kann man die Formel $B_{n;p}(k)=\binom{n}{k} \cdot p^k \cdot (1-p)^{n-k}$ verwenden.

Darin steht der Teil $p^k \cdot (1-p)^{n-k}$ für die Wahrscheinlichkeit, bei einer Abfolge von n Zufallsversuchen k Treffer zu erzielen.

Der vordere Teil, der Binomialkoeffizient $\binom{n}{k}$ (sprich: "n über k") zählt dabei, wie viele Möglichkeiten es gibt, bei n Versuchen genau k Treffer zu erzielen:

Beispiel: $\binom{3}{2}$ Wie viele Möglichkeiten gibt es, bei 3 Versuchen genau 2 Treffer zu erzielen (t als Treffer, n als Niete)?

t t n
t n t
n t t

Es gibt offensichtlich 3 Möglichkeiten, bei drei Versuchen 2 Treffer zu erzielen. Somit ist $\binom{3}{2}=3$ .

Wie kann man $\binom{n}{k}$ berechnen?

Zunächst stehen n leere Plätze zur Verfügung (diese stehen für die einzelnen Versuche der Bernoulli-Kette). Für den ersten der k Treffer stehen somit n Plätze zur Verfügung, für den zweiten (n-1), bis der k-te Treffer noch (n-k+1) Möglichkeiten hat.

Somit hätten wir insgesamt $n \cdot (n-1) \cdot ... \cdot (n-k+1)$ Möglichkeiten.

Eine mögliche Abfolge wäre für n=3:

$t_1$ $t_2$ $n$

Allerdings ist es so, dass wir nicht unterscheiden müssen, ob ein Treffer in der Bernoulli-Kette der erste oder zweite Treffer ist.

Deshalb ist die obere Abfolge für unseren Fall identisch zu

$t_2$ $t_1$ $n$

Deswegen muss man also noch alle Vertauschungsmöglichkeiten der Treffer untereinander berücksichtigen: alle Abfolgen, bei denen an den gleichen Stellen Treffer und Nieten vorzufinden sind (unabhängig davon, ob dort der erste, zweite oder dritte Treffer steht), zählen als eine mögliche Abfolge.

Wie viele Möglichkeiten gibt es, k Treffer auf k Plätze zu verteilen? Dies entspricht nämlich der Anzahl, der nicht unterscheidbaren Abfolgen:

Der erste Treffer hat k freie Plätze, der zweite (k-1), bis der k-te Treffer nur noch eine Möglichkeit hat, da alle anderen ja schon belegt sind.

Somit ist die Anzahl der möglichen Vertauschungen der k Treffer untereinander $k \cdot (k-1) \cdot ... \cdot 1$ .

Insgesamt erhält man somit für die Anzahl der Möglichkeiten, bei n Versuchen genau k Treffer zu landen also: $\binom{n}{k}=\frac{n \cdot (n-1) \cdot ... \cdot (n-k+1)}{k\cdot (k-1)\cdot ... \cdot 1}$

Mit Hilfe der Fakultät $n!=n\cdot (n-1) \cdot (n-2) \cdot ... \cdot 2 \cdot 1$

kann man den Ausdruck schreiben als

Der Binomialkoeffizient

$\binom{n}{k}=\frac{n!}{k!\cdot(n-k)!}$

Beispiel:

$\binom{3}{2}=\frac{3!}{2!\cdot 1!}=\frac{3\cdot 2\cdot 1}{2\cdot 1\cdot 1}=3$

Also gibt es als Ergebnis 3 Möglichkeiten, um 2 Treffer auf 3 Versuche zu verteilen. Das hatten wir weiter oben schon:

1. t t n
2. t n t
3. n t t

Um nun die Gesamtwahrscheinlichkeit zu berechnen, bei n Versuchen genau k Treffer zu landen, müssen die Wahrscheinlichkeiten aller Pfade mit k Treffern addiert werden.

Für n=3 und k=2 kann man sich das folgendermaßen vorstellen:

Die Wahrscheinlichkeit dafür, dass bei einer Bernoulli-Kette der Länge n mit der Treffer-Wahrscheinlichkeit p genau k Treffer vorkommen, ist $B_{n;p}(k)=\binom{n}{k} \cdot p^k \cdot (1-p)^{n-k}$

Wahrscheinlichkeitsverteilung

Die Funktion, deren Zuordnungsvorschrift einer Bernoulli-Kette der Länge n jeder Trefferzahl k die zugehörige Wahrscheinlichkeit zuweist, heißt Wahrscheinlichkeitsverteilung bzw. hier speziell Binomialverteilung.

Für n=5 und p= $\frac{2}{5}$ sieht die Verteilung beispielsweise so aus:

k	$B_{5;\frac{2}{5}}(k)$
0	$0.07776$
1	$0.2592$
2	$0.3456$
3	$0.2304$
4	$0.0768$
5	$0.01024$

Stellt man die Verteilung graphisch dar, so erhält man:

Der gewichtete Mittelwert, der im Zusammenhang mit Wahrscheinlichkeitsrechnung als Erwartungswert $\mu$ bezeichnet wird, ist hier

$\mu= 0\cdot B_{5;\frac{2}{5}}(0) +1\cdot B_{5;\frac{2}{5}}(1)+2\cdot B_{5;\frac{2}{5}}(2)+3\cdot B_{5;\frac{2}{5}}(3)+4\cdot B_{5;\frac{2}{5}}(4)+5\cdot B_{5;\frac{2}{5}}(5)$ oder kurz geschrieben: $\mu= \sum_{k=0}^5 k \cdot B_{5;\frac{2}{5}}(k)$

In der Rechnung ergibt sich:

$\mu= \sum_{k=0}^5 k \cdot B_{5;\frac{2}{5}}(k)=2$

Das ist kein Zufall. Man kann zeigen: Es gilt für den

Erwartungswert einer $B_{n;p}$ -verteilten Zufallsvariable: $\mu=n\cdot p$

Den Beweis für die Gültigkeit der Formel kannst du hier einblenden.

Beweis wieder ausblenden

Beweis der Formel $\mu=n \cdot p$

Allgemein ist der Erwartungswert einer Zufallsvariable $X$ definiert als $\mu=\sum_{k=0}^{n} x_k \cdot P(X=x_k)$

$x_k$ ist dabei der k-te von n Werten, den die Zufallsvariable $X$ annehmen kann. In unserem Fall ist $x_k=k$ , da die Zufallsvariable für die Anzahl der Treffer steht und somit die Werte von 0 bis n annehmen kann.

Somit gilt für eine $B_{n;p}$ -verteilte Zufallsvariable $X$ : $\mu=\sum_{k=0}^{n} k \cdot P(X=k)= \sum_{k=0}^{n} k \cdot \binom{n}{k} \cdot p^k \cdot (1-p)^{n-k}$

Ausschreiben des Binomialkoeffizienten ergibt $\sum_{k=0}^{n} k \cdot \frac{n!}{k!\cdot (n-k)!} \cdot p^k \cdot (1-p)^{n-k}$

Der erste Summand kann weggelassen werden, da er für $k=0$ zu $0$ wird: $\sum_{k=1}^{n} k \cdot \frac{n!}{k!\cdot (n-k)!} \cdot p^k \cdot (1-p)^{n-k}$

Das vordere $k$ kann mit der Fakultät $k!$ im Nenner gekürzt werden: $\sum_{k=1}^{n} \frac{n!}{(k-1)!\cdot (n-k)!} \cdot p^k \cdot (1-p)^{n-k}$

Der letzte Summand der Summe (der Summand mit $k=n$ ), wird vor die Summe gezogen, also der Summand $\frac{n!}{(n-1)!\cdot 0!} \cdot p^n \cdot (1-p)^0 = n \cdot p^n$ (Beachte: $0!=1$ und $(1-p)^0=1$ ).

Damit läuft $k$ nur noch von $1$ bis $n-1$ und es verbleibt insgesamt: $n \cdot p^n + \sum_{k=1}^{n-1} \frac{n!}{(k-1)!\cdot (n-k)!} \cdot p^k \cdot (1-p)^{n-k}$

Nun kann man aus dem ganzen Ausdruck $n\cdot p$ ausklammern: $n\cdot p \cdot \Big(p^{n-1}+\sum_{k=1}^{n-1} \frac{(n-1)!}{(k-1)!\cdot (n-k)!} \cdot p^{k-1} \cdot (1-p)^{n-k} \Big)$

In der Summe lassen wir das $k$ nun statt von $1$ bis $n-1$ von $0$ bis $n-2$ laufen. Damit der Ausdruck sich nicht ändert, muss jedes $k$ durch $k+1$ ersetzt werden:

$n\cdot p \cdot \Big(p^{n-1}+\sum_{k=0}^{n-2} \frac{(n-1)!}{((k+1)-1)!\cdot (n-(k+1))!} \cdot p^{(k+1)-1} \cdot (1-p)^{n-(k+1)} \Big)$

Ohne Klammern geschrieben verbleibt: $n\cdot p \cdot \Big(p^{n-1}+\sum_{k=0}^{n-2} \frac{(n-1)!}{k!\cdot (n-k-1)!} \cdot p^{k} \cdot (1-p)^{n-k-1} \Big)$

Nun ziehen wir den Summand $p^{n-1}$ wieder in die Summe hinein: $n\cdot p \cdot \Big(\sum_{k=0}^{n-1} \frac{(n-1)!}{k!\cdot (n-k-1)!} \cdot p^{k} \cdot (1-p)^{n-k-1} \Big)$

Überprüfung: Der Summand für $k=n-1$ ist $\frac{(n-1)!}{(n-1)!\cdot (n-(n-1)-1)!} \cdot p^{n-1} \cdot (1-p)^{n-(n-1)-1}=$ $\frac{1}{1\cdot 0!} \cdot p^{n-1} \cdot (1-p)^{0}=p^{n-1},$ also tatsächlich der Summand, der soeben in die Summe gezogen wurde.

Der Ausdruck $\frac{(n-1)!}{k!\cdot (n-k-1)!}$ entspricht dem Binomialkoeffizient $\binom{n-1}{k}$ , also wird aus

$n\cdot p \cdot \Big(\sum_{k=0}^{n-1} \frac{(n-1)!}{k!\cdot (n-k-1)!} \cdot p^{k} \cdot (1-p)^{n-k-1} \Big)$ der Ausdruck $n\cdot p \cdot \Big(\sum_{k=0}^{n-1} \binom{n-1}{k} \cdot p^{k} \cdot (1-p)^{n-k-1} \Big)$

In $n\cdot p \cdot \Big(\sum_{k=0}^{n-1} \binom{n-1}{k} \cdot p^{k} \cdot (1-p)^{n-k-1} \Big)$ entspricht die Summe der Summe aller Wahrscheinlichkeiten einer $B_{n-1;p}$ -verteilten Zufallsvariable und ist somit $1$ .

Also verbleibt für den Erwartungswert $E(X)=\mu=n\cdot p$ .

Beweis ausblenden

Der Erwartungswert einer binomialverteilten Zufallsvariable liegt in der Nähe des Wertes, der in der Wahrscheinlichkeitsverteilung die höchste Wahrscheinlichkeit hat. In unserem Beispiel ist sogar genau bei der 2 die höchste Wahrscheinlichkeit vorzufinden.

Eine Zufallsvariable ist beispielsweise eine Variable, die bei einem mehrstufigen Zufallsexperiment für die Anzahl der Treffer steht.

So könnte eine Zufallsvariable X für die Anzahl der geworfenen Sechser stehen, wenn man 4 mal würfelt. Diese Zufallsvariable wäre $B_{4;\frac{1}{6}}$ -verteilt.

Beispielaufgabe zur Binomialverteilung

Ein Glücksrad, bei dem die Trefferwahrscheinlichkeit 15% beträgt, wird 20 Mal gedreht.

Berechne den Erwartungswert.
Bestimme die Wahrscheinlichkeit dafür, dass der Spieler genau 3 Mal gewinnt.
Bestimme die Wahrscheinlichkeit dafür, dass der Spieler höchstens 10 Mal gewinnt.
Bestimme die Wahrscheinlichkeit dafür, dass der Spieler mindestens 4 Mal gewinnt.

Lösung:

Die Zufallsvariable X sei die Anzahl der Treffer und ist $B_{20;\frac{3}{20}}$ -verteilt.

$\mu=n\cdot p=20\cdot \frac{3}{20}= 3$
$P(X=3)=B_{20;\frac{3}{20}}(3)=0.2428288961492419$
$P(X\le 10)=\sum_{k=0}^{10} B_{20;\frac{3}{20}}(k)=0.9999613672517918$
$P(X\ge4)=1-P(X\le3)=1-\sum_{k=0}^{3} B_{20;\frac{3}{20}}(k)= 0.35227482584329694$

Standardabweichung

Die Form einer Binomialverteilung entspricht einer sogenannten Glockenkurve: einem Maximum in der Mitte, an den Rändern abflachend zur Null, insgesamt tatsächlich aber in der Form einer Glocke.

Für unser obiges Beispiel ist die Glockenkurve in rot eingezeichnet:

Die Extremstelle der Glockenkurve liegt bei $\mu$ , die Wendestellen bei $\mu\pm \sigma$ . Dieses $\sigma$ heißt Standardabweichung und hat für eine Binomialverteilung den Wert $\sigma=\sqrt{n\cdot p \cdot (1-p)}$

In unserem Beispiel mit $n=5$ und $p=\frac{2}{5}$ beträgt sie beispielsweise $\sigma=\sqrt{5\cdot \frac{2}{5} \cdot (1-\frac{2}{5})}= 1.0954451150103321$ Somit liegen die Wendestellen ungefähr bei $2+1.1=3.1$ und $2-1.1=0.9$

Die Extremstelle liegt bei $5\cdot \frac{2}{5}=2$ .

$\mu=2$

$\mu-\sigma=0.9$

$\mu+\sigma=3.1$

Die Standardabweichung $\sigma$ ist hilfreich, um mit ihnen die Sigma-Regeln zu formulieren:

So beträgt die Wahrscheinlichkeit, dass die Trefferzahl im Intervall $[\mu-\sigma;\mu+\sigma]$ liegt, etwa 68 %. Bei unserem Beispiel also zwischen $0.9$ und $3.1$ .

Ebenso kann man eine Regel für $2\sigma$ und $3\sigma$ angeben:

Intervall	Wahrscheinlichkeit	Fläche im Diagramm
$[\mu-\sigma ; \mu+\sigma]$	68,3%
$[\mu-2\sigma;\mu+2\sigma]$	95,4%
$[\mu-3\sigma;\mu+3\sigma]$	99,7%