Stochastik Simulationen Gesetz der großen Zahlen Binomialverteilung Normalverteilung Tabellenkalkulation Testen Schätzen
Pfad: Startseite / Fächer / Mathematik / Stochastik / Schätzen
Autor: mk
28.11.2009 14:45:49
1186
Schätzen

Beispiel 1 mit Binomialverteilung

Gegeben ist eine Bernoullikette der Länge n = 100. Die Trefferwahrscheinlichkeit p ist unbekannt. Ein Experiment ergibt H = 18 Treffer.

Gesucht ist ein Intervall für p d.h p ∈ [p1 ; p2], das mit einer Wahrscheinlichkeit von 0,90 angenommen wird.

Zur Lösung überlegen wir uns, dass sicher p1 < 0,18 < p2 gilt. Aber wie klein sollte nun p1 gewählt werden? Nun, wir wollen das Risiko, dass p < p1 gilt und trotzdem H = 18 oder noch ungünstiger H > 18 auftritt, höchstens 0,05 werden lassen. 0,05 deshalb, weil die Wahrscheinlicheit, Fehler zu machen, gleichmäßig auf die linke und rechte Seite verteilt werden soll. Jetzt lautet also die Teilaufgabe: Für welches p1 gilt gerade P(X>=18) = 0,05? Die Tabelle für die summierte Binomialverteilung liefert P(X>=18) = 0,0100 für p = 0,1. Das ist besser als wir es brauchen. Weiter entnimmt man der Tabelle P(X>=18) = 0,4006 für p = 1/6. Das ist viel zu schlecht. Leider kommt man nun mit der Tabelle nicht weiter. Mit Hilfe einer Tabellenkalkulation und der Funktion Binomvert kann man folgende Tabelle erstellen:

p           P(X>=18)
0,10        0,010007279
0,11        0,024379332
0,12        0,051053365
0,13        0,094215647
0,14        0,156269604
0,15        0,236723084
0,16        0,331914995
0,17        0,435698312
 1/6        0,400592558
0,110       0,024379332
0,111       0,026416736
0,112       0,028582094
0,113       0,030880058
0,114       0,033315223
0,115       0,035892110
0,116       0,038615148
0,117       0,041488661
0,118       0,044516851
0,119       0,047703782
0,120       0,051053365

Man liest ab, dass p1 = 0,119 ein guter Wert für die linke Grenze wäre.

Nun könnte natürlich der wahre Wert p auch größer als 0,18 sein und trotzdem die absolute Häufigkeit H = 18 oder sogar H < 18 eintreten. Auch hier wählen wir p2 so, dass das mit einer Wahrscheinlichkeit von höchstens 0,05 eintritt.

p        P(X<=18)
0,20        0,362087084
0,21        0,274768185
0,22        0,200888316
0,23        0,141545111
0,24        0,096155560
0,25        0,063011417
0,26        0,039853951
0,27        0,024342931

0,250        0,063011417
0,251        0,060285532
0,252        0,057657162
0,253        0,055123908
0,254        0,052683369
0,255        0,050333152
0,256        0,048070874
0,257        0,045894162
0,258        0,043800660
0,259        0,041788029

Zusammengefasst kann man sagen: Wenn man p aus dem Intervall [0,119 ; 0,256] wählt, so muss man nur in etwa 10% der Fälle bei dem Testergebnis H = 18 mit einem zufälligen Irrtum rechnen.

Rechnung mit Normalverteilung

Wieder ist p1 gesucht mit P(X>=18) <= 0,05. Die Tabelle für die Normalverteilung enthält

Φ(1,64) = 0,9495
Φ(1,65) = 0,9505

Wir wissen daher, dass P(X>=18) ≈ 1 - Φ(1,65) <= 0,05 für

(17,5 -100*p1)/√(100*p1*(1-p1)) >= 1,65

Wir suchen also das größte p1, das diese Ungleichung erfüllt. Mit Geogebra sieht das so aus:

Geogebra

Geogebra hat also p1 etwa zu 0,12 bestimmt. Diese Wurzelgleichung kann man auch - mühsam - durch Quadrieren lösen. Dabei ist zu bedenken, dass wie üblich die Lösungen an der ursprünglichen Gleichung getestet werden müssen. Im vorliegenden Fall hat die quadratische Gleichung die beiden Lösungen p11 ≈ 0,246 und p12 ≈ 0,121158... . die erste Lösung fällt allein schon deshalb aus, weil 17,5 - 24,6.. negativ wird. Die zweite Lösung wurde auch von Geogebra gefunden.

Was verändert sich an den Überlegungen, wenn man p2 sucht mit P(X<=18) <= 0,05 ?

Wir erhalten die Ungleichung

(18,5 -100*p2)/√(100*p2*(1-p2)) <= -1,65

Diese Ungleichung hat die Lösung p2 = 0,257111.. .

Konfidenzintervall mit der Tabellenkalkulation

Lässt man die Stetigkeitskorrektur fallen, so kann man mit einer Gleichung beide Grenzen berechnen.

Das immer gleiche Vorgehen (z.B. LS S.239/240) beim Bestimmen eines Vertrauensintervalls lässt sich in einem Rechenblatt einer Tabellenkalkulation zusammenfassen.

Rechenblatt Vertrauensintervall.ods, Vertrauensintervall.xls

Links

Valid XHTML 1.0!