2 f ( 2 ) Chi-Square Distribution: df=10, df=30, df=50 df = 10 df = 30 df = 50 Chi-2-fördelningen
l Steg: Formulera noll- och alternativhypoteser Beräkna frekvenser (antal) som skulle förväntas om nollhypotesen är sann – förväntat antal (expected counts) Notera faktiska observerade frekvenser (antal) Använd differenser mellan förväntade och observerade antal för att räkna ut värdet på Chi-2 statistikan: Jämför värdet på Chi-2 statistikan med kritiska värden från Chi-2 fördelningen (med C-1 frihetsgrader) för att testa nollhypotesen. (Eller jämför p-värdet med önskad signifikansnivå.) Chi-2-test av “Goodness of Fit”
Exempel De första 13 veckorna på säsongen hade lördagskvällarna TV-tittare mellan kl 20 och 21 fördelat sig enligt följande SVT 1:28% SVT 2: 25% TV 3:18% TV 4: 29 %(OBS! Påhittade siffror)
Exempel (forts) Efter en TV-tablåomläggning togs ett stickprov om 300 hushåll och följande tittarsiffror erhölls SVT 1:70 hushåll (23,33%) SVT 2: 89 hushåll (29,67%) TV 3:46 hushåll (15,33%) TV 4: 95 hushåll (31,67%) Har TV-tablå omläggningen förändrat tittarmönstret?
Exempel (forts) Hypoteser: H 0 : Ingen skillnad, dvs p SVT1 =0,28, p SVT2 =0,25, p TV3 =0,18, p TV4 =0,29 H A : Skillnad Teststatistika: ”Beslutsregel”/Kritiskt värde: Om är större än = 7,82 så förkastas H 0.
Exempel (forts) Observation: Observerad frekvensFörväntad frekvens SVT *0,28 = 84 SVT *0,25 = 75 TV TV Totalt300
Exempel (forts) Slutsats: Tillsvidare behåller vi nollhypotesen (dvs att TV-tablåomläggningen inte medfört någon skillnad i tittarmönstret) eftersom vi ej har tillräckligt empiriskt stöd för att förkasta den då det observerade värdet är mindre än det kritiska värdet.
Analys av kontingenstabeller Chi-2-test av Oberoende
Noll- och alternativhypoteser: H 0 : De två “klassificerande” variablerna är oberoende av varandra H A : De två “klassificerande” variablerna är inte oberoende Chi-2-teststatistika för oberoende: Frihetsgrad: df=(R-1)(C-1) Förväntat antal: E ij = (rad i total)(kolumn j total)/n Händelserna A och B är oberoende om: P(AUB) = P(A)P(B) Därför är: E ij = (rad i total)(kolumn j total)/n Analys av kontingenstabeller Chi-2-test av Oberoende
Exempel (OBS! Påhittade siffror) Finns det något beroende mellan behandlingsmetod av ungdomsbrottslingar och återfallsmönster? Försök: 100 får behandling A och 100 får behandling B. (Vi antar att det slumpats till behandling.) Uppföljning sker 5 år senare. ”Ungdomsbrottslingarna” klassificeras då som: Återföll inom 6 mån. Återföll inom 1 år (men efter 6 mån). Återföll inom 5 år (men efter 1 år). Återföll ej inom 5 år.
Exempel (forts) Hypoteser: H 0 : Behandlingsmetod och återfallsmönster är oberoende. H A : Behandlingsmetod och återfallsmönster är inte oberoende. Teststatistika: ”Beslutsregel”/ Kritiskt värde: Om är större än så förkastas H 0.
Exempel (forts) Observation: Observerade frekvenser ABTotalt 6 mån eller innan30 60 Efter 6 mån men innan 1 år Efter 1 år men innan 5 år Ej inom 5 år Totalt
Exempel (forts) Förväntade frekvenser = (radtotal*kolumntotal)/n ABTotalt 6 mån eller innan(100*60)/200 = Efter 6 mån men innan 1 år 22,5 45 Efter 1 år men innan 5 år 17,5(35*100)/200 = 17,5 35 Ej inom 5 år30 60 Totalt
Exempel (forts) Slutsats: Nollhypotesen förkastas eftersom det observerade värdet på teststatistikan 12,39 är större än det kritiska värdet 11,34. Det verkar alltså som om behandlingsmetod och återfallsmönster är beroende. Däremot säger testet inget om vilken metod som är bättre…