![]() |
||
| Stochastik |
Simulationen
Gesetz der großen Zahlen
Binomialverteilung
Normalverteilung
Tabellenkalkulation
Testen
|
|
|
Schätzen |
Gegeben ist eine Bernoullikette der Länge n = 100. Die Trefferwahrscheinlichkeit p ist unbekannt. Ein Experiment ergibt H = 18 Treffer.
Gesucht ist ein Intervall für p d.h p ∈ [p1 ; p2], das mit einer Wahrscheinlichkeit von 0,90 angenommen wird.
Zur Lösung überlegen wir uns, dass sicher p1 < 0,18 < p2 gilt. Aber wie klein sollte nun p1 gewählt werden? Nun, wir wollen das Risiko, dass p < p1 gilt und trotzdem H = 18 oder noch ungünstiger H > 18 auftritt, höchstens 0,05 werden lassen. 0,05 deshalb, weil die Wahrscheinlicheit, Fehler zu machen, gleichmäßig auf die linke und rechte Seite verteilt werden soll. Jetzt lautet also die Teilaufgabe: Für welches p1 gilt gerade P(X>=18) = 0,05? Die Tabelle für die summierte Binomialverteilung liefert P(X>=18) = 0,0100 für p = 0,1. Das ist besser als wir es brauchen. Weiter entnimmt man der Tabelle P(X>=18) = 0,4006 für p = 1/6. Das ist viel zu schlecht. Leider kommt man nun mit der Tabelle nicht weiter. Mit Hilfe einer Tabellenkalkulation und der Funktion Binomvert kann man folgende Tabelle erstellen:
p P(X>=18) 0,10 0,010007279 0,11 0,024379332 0,12 0,051053365 0,13 0,094215647 0,14 0,156269604 0,15 0,236723084 0,16 0,331914995 0,17 0,435698312 1/6 0,400592558 0,110 0,024379332 0,111 0,026416736 0,112 0,028582094 0,113 0,030880058 0,114 0,033315223 0,115 0,035892110 0,116 0,038615148 0,117 0,041488661 0,118 0,044516851 0,119 0,047703782 0,120 0,051053365
Man liest ab, dass p1 = 0,119 ein guter Wert für die linke Grenze wäre.
Nun könnte natürlich der wahre Wert p auch größer als 0,18 sein und trotzdem die absolute Häufigkeit H = 18 oder sogar H < 18 eintreten. Auch hier wählen wir p2 so, dass das mit einer Wahrscheinlichkeit von höchstens 0,05 eintritt.
p P(X<=18) 0,20 0,362087084 0,21 0,274768185 0,22 0,200888316 0,23 0,141545111 0,24 0,096155560 0,25 0,063011417 0,26 0,039853951 0,27 0,024342931 0,250 0,063011417 0,251 0,060285532 0,252 0,057657162 0,253 0,055123908 0,254 0,052683369 0,255 0,050333152 0,256 0,048070874 0,257 0,045894162 0,258 0,043800660 0,259 0,041788029
Zusammengefasst kann man sagen: Wenn man p aus dem Intervall [0,119 ; 0,256] wählt, so muss man nur in etwa 10% der Fälle bei dem Testergebnis H = 18 mit einem zufälligen Irrtum rechnen.
Wieder ist p1 gesucht mit P(X>=18) <= 0,05. Die Tabelle für die Normalverteilung enthält
Φ(1,64) = 0,9495 Φ(1,65) = 0,9505
Wir wissen daher, dass P(X>=18) ≈ 1 - Φ(1,65) <= 0,05 für
(17,5 -100*p1)/√(100*p1*(1-p1)) >= 1,65
Wir suchen also das größte p1, das diese Ungleichung erfüllt. Mit Geogebra sieht das so aus:

Geogebra hat also p1 etwa zu 0,12 bestimmt. Diese Wurzelgleichung kann man auch - mühsam - durch Quadrieren lösen. Dabei ist zu bedenken, dass wie üblich die Lösungen an der ursprünglichen Gleichung getestet werden müssen. Im vorliegenden Fall hat die quadratische Gleichung die beiden Lösungen p11 ≈ 0,246 und p12 ≈ 0,121158... . die erste Lösung fällt allein schon deshalb aus, weil 17,5 - 24,6.. negativ wird. Die zweite Lösung wurde auch von Geogebra gefunden.
Was verändert sich an den Überlegungen, wenn man p2 sucht mit P(X<=18) <= 0,05 ?
Wir erhalten die Ungleichung
(18,5 -100*p2)/√(100*p2*(1-p2)) <= -1,65
Diese Ungleichung hat die Lösung p2 = 0,257111.. .
Lässt man die Stetigkeitskorrektur fallen, so kann man mit einer Gleichung beide Grenzen berechnen.
Das immer gleiche Vorgehen (z.B. LS S.239/240) beim Bestimmen eines Vertrauensintervalls lässt sich in einem Rechenblatt einer Tabellenkalkulation zusammenfassen.
Vertrauensintervall.ods,
Vertrauensintervall.xls