Grundläggande statstik, ht 09, AN1 F9 Analys av frekvenstabeller Hittills har vi analyserat eller jämfört 2 grupper avseende variabler på intervall- eller kvotskala. Om man vill jämföra 3 eller flera grupper, kan ibland variansanalys användas. (KW 15.2) Hur gör vi om våra mätvärden är på nominalskala och vi kanske har mer än 2 grupper? Ex. spelar färgen någon roll? På ett daghem studeras om barnen föredrar leksaker av en viss färg. Man skaffar identiska klossar men av olika färg, och studerar vilken färg barnen helst vill ha. Försöket upprepas 90 gånger
Grundläggande statstik, ht 09, AN2 F9 Analys av frekvenstabeller (forts) FärgO=antal valE=Förväntat antal val Om H0 sann Röd3630 Grön2330 Blå3130 Summa90 H 0 : Alla färger lika populära, d.v.s. Färgen saknar betydelse vid val av leksak H 1 : Färgen har betydelse vid val av leksak Resultat
Grundläggande statstik, ht 09, AN3 F9 Analys av frekvenstabeller (forts) Vi observerar skillnaderna O - E. Beror dessa på slumpen? Eller… Vi behöver en testfunktion med känd fördelning. = 0 alltid. Går alltså inte att använda. Använd i stället som är 2 -fördelad med r – 1 frihetsgrader, r = antalet rader i tabellen. Beslutsregel: Förkasta H 0 för stora värden på 2 Varför?
Grundläggande statstik, ht 09, AN4 F9 Analys av frekvenstabeller (forts) Om vi bara har 2 kategorier, t ex leksaker av trä eller plast, blir testet identiskt med ett Z-test av 1 - 2 = 0. så har Z ² en –fördelning med 1 frihetsgrad. Krav för att använda -test 1.Ingen förväntad frekvens < 1 2.Högst 20% av de förväntade frekvenserna < 5