Anzahl der Beobachtungen, Frequenzen und kumulative Frequenzen in den diversen Kategorien.
Graphische Darstellung der Zahlen, z.B. in Balkengraphiken für die diversen Gruppen.
Hier bekommt man als Ergebnis, wie sehr die beobachtete Frequenz schwanken kann, wenn man mehrere Stichproben aus derselben Population nehmen würde.
Beispiel: Ein Ereignis tritt in einer Gruppe von 40 Beobachtungen 8 mal auf. Die Frequenz ist dan 8/40 = 0,2 mit SD 0,063. Das 95%-Konfidenzintervall liegt zwischen 0,076 und 0,323, also eine ziemliche Spanne. Ist die untersuchte mit 400 zehnmal so groß und tritt das Ereignis immer noch mit einer Frequenz von 0,2 (SD= 0,02) auf, dann ist der 95%-Konfidenzintervall jetzt zwischen 0,161 und 0,239, also erheblich schmäler.
Ganz grob gesagt: es wird überprüft, wie sehr die beobachteten Zahlen von den Zahlen differieren, die man anhand der Zeilensummen, Spaltensummen und Gesamtsumme erwarten würde. Aus diesen Differenzen wird die statistische Kenngröße Chi-quadrat berechnet. Zu dem muss man die Anzahl der Freiheitsgrade (degrees of freedom, d.f. oder df) berücksichtigen. Diese Anzahl ist (Anzahl Zeilen - 1)*(Anzahl Spalten - 1). Für die übliche Vierfeldertafel ist die Anzahl der Freiheitsgrade als (2-1)*(2-1) = 1. Aus diesen beiden Zahlen ergibt sich der p-Wert, entweder aus einer Tabelle oder berechnet mit einem entsprechenden Programm.
Beispiel
Fall | Kontrolle | Summe | |
Ja | 102 | 82 | 184 |
Nein | 90 | 126 | 216 |
Summe | 192 | 208 | 400 |
Daraus berechnet man folgende Erwartungswerte
Fall | Kontrolle | Summe | |
Ja | 88,32 | 95,62 | 184,00 |
Nein | 103,68 | 112,32 | 216,00 |
Summe | 192,00 | 208,00 | 400,00 |
Anschließend kommen die Chi-quadrat-Beitragswerte für die einzelnen Zellen
Fall | Kontrolle | Summe | |
Ja | 2,119 | 1,956 | 4,075 |
Nein | 1,805 | 1,666 | 3,471 |
Summe | 3,924 | 3,622 | 7,546 |
Chi-quadrat ist also 7,546 mit 1 Freiheitsgrad. Daraus resultiert ein p-Wert von 0,006.
Die Wahrscheinlichkeit, dass die Fall- und Kontrollgruppe aus einer und derselben großen Gesamtheit (Population) stammen bez. des Auftretens des untersuchten Ereignisses ist 0,6% und damit äußerst gering. In statistischer Sprache ausgedrückt: der Unterschied ist eindeutig signifikant, weil der übliche Signifikanzschranke von 0,05 deutlich unterschritten wird.
Man sollte sich aber angewöhnen die Korrektur nach Yates an zu wenden, vor allem bei kleinen Zahlen. Dabei wird der Chi-quadrat-Beitrag jeder Zelle um 0,5 reduziert. Im Beispiel beträgt der Chi-quadrat-Wert dann 5,546 mit d.f. = 1 mit entsprechendem p-Wert 0,0185. Das Ergebnis ist immer noch signifikant.
Hierbei wird das Auftreten eines Ereignisses oder Merkmals in den Gruppen ausgedrückt in Quotienten. Die Differenz der Quotienten und deren Konfidenzintervall werden berechnet und statistisch getestet. Diese Methode hat gegenüber die Vierfeldertafel den Vorteil, dass man neben dem p-Wert auch noch eine Aussage über die Streuung des Unterschiedes zwischen den Gruppen bekommt. Ganz einfach kann man das schon auf einem Blick sehen: schließt der 95%-Konfidenzintervall den Wert 0 ein, dann ist der Unterschied nicht signifikant. Aus dem statistischen Test der Null-Hypothese bekommt man auch einen p-Wert.