Statistik I — bis jetzt K 1 Einf ¨ K 2 Beschreibende Statistik K 3 Graphiken K 4 Sch ¨atzen K 5 Testen K5 Statistische Tests Beispiel: Exemestane und Brustkrebs
Tamoxifen ¨uber 5 Jahre ist f ¨ur gewisse Frauen mit Brustkrebseine Standardbehandlung. Wissenschaftler haben eineneue Behandlung vorgeschlagen:2 bis 3 Jahre Tamoxifen und danach Exemestane. In einer Doppelblindstudie von Coombes et al sind fol-gende Resultate berichtet worden (NEJM 350(11) 1081-92).
4742 Patientinnen insgesamt2362 bekamen nach 2 bis 3 Jahren Exemestane2380 bekamen noch Tamoxifen
Zeigen diese Resultate, dass die Behandlung mitExemestane besser ist?
5.1 Statistische Tests im allgemeinen
z.B. Hilft Vitamin C gegen Erk ¨altungen?
Ist der neue Ferrari schneller als der alte?
Sind finnische Sch ¨uler besser als deutsche?
• Warum werden statistische Tests durchgef ¨uhrt?
• Wann werden statistische Tests durchgef ¨uhrt?
• Wie werden statistische Tests durchgef ¨uhrt?
• Wer f ¨uhrt statistische Tests durch?
• Welche Folgen haben statistische Tests?
Terminologie f ¨ ur Test-Theorie
Teststatistik (Pr ¨ufgr ¨oße)Verteilung der Teststatistik
Testniveau αAnnahmebereich/AblehnungsbereichEntscheidungsregel (kritischer Wert)
G ¨utefunktion (beim Test eines Parameters)g(θ) = P (H0 verwerfen |θ der wahre Parameter)
Statistische Testprozeduren Studie entwerfen Daten holen Daten organisieren
H ¨aufigkeitstabellen, Histogramme usw. Resultate zusammenfassen Teststatistik mit erwarteten Werten vergleichen Signifikanz der Teststatistik
PH (Teststatistik > beobachtete Wert der Statistik)
(Im allgemeinen sucht man die Wahrscheinlichkeit des Wer-tebereichs, worin alle Werte eine kleinere Wahrschein-lichkeit als der beobachtete Wert haben.)
Traditionelle Deutung(nach Fisher nur als Richtlinie, aber . . . ):
p-Wert > 0.05 ⇒ H0 sollte nicht verworfen werden
p-Wert < 0.05 ⇒ H0 kann vielleicht verworfen werden
p-Wert < 0.01 ⇒ H0 kann verworfen werden
Vieles h ¨angt von den nachfolgenden Wirkungen ab, wieman p-Werte interpretiert. z.B. 5.2 Binomial Test (eine Stichprobe) Nullhypothese Teststatistik Verteilung unter H0 Annahmebereich Ablehnungsbereich Typ I Fehler (Test-Niveau)
Das Test-Niveau wird f ¨ur einen diskreten Test selten genau
α sein. Eine M ¨oglichkeit ist ein randomisierter Test: falls
R = a oder R = b, akzeptiert man H0 mit Wahrschein-lichkeiten, die so gew ¨ahlt sind, dass das Test-Niveau = α.
Das wird mathematisch genau sein, ist aber in der Praxis
Alternativhypothese Typ II Fehler utefunktion Binomial Test Beispiel Außersinnliche Wahrnehmung Farbe einer Karte erraten (cf. u.a. Jung und Pauli) Nullhypothese Teststatistik Verteilung unter H0 Annahmebereich Ablehnungsbereich Typ I Fehler (Test-Niveau)
p-Wert von R = 5 Alternativhypothese Typ II Fehler utefunktion Binomial Test (zwei Stichproben) Nullhypothese Teststatistik Verteilung unter H0
E[T ] = 0, V [T ] = p(1 − p)(1/n1 + 1/n2)
Annahmebereich Ablehnungsbereich Typ I Fehler (Test-Niveau) Alternativhypothese Typ II Fehler utefunktion
Oder wir nehmen an, dass n1, n2 groß genung sind, dassdie Normalapproximation gilt. Dann haben wir:
X/n1 ∼ N (p, p(1−p)/n1) und Y /n2 ∼ N (p, p(1−p)/n2)
⇒ T = X/n1 − Y /n2 ∼ N(0, p(1 − p)(1/n1 + 1/n2))
SUISSE HIPPODROME D'AVENCHES PRIX KAPRICE D'ECAJEUL Départ à l'Autostart CHF 8'000 2350 mètres. .- alloués par la SECF et Suisse Trot. Pour chevaux de 5 à 10 ans inscrits au Stud-Book du Trotteur Français, n'ayant pas gagné CHF 80'000 1 QUINCY DU MARTZA* Entrées: 15 (12 part.)3420, 1710, 1140, 760, 380, 190 PRIX DE CABOURG CHF 8'000 2400 mètres. .- alloués par la
ANTERIOR LUMBAR INTERBODY FUSION (ALIF) Anterior Lumbar Interbody Fusion is a surgical procedure where the spine is accessed through the abdomen and is typically combined with a posterior approach. The procedure begins with a 3 to 5 inch abdominal incision. The abdominal contents are enclosed in a large sack (peritoneum) which is moved to the side, allowing access to the spine. A portion