Chitvå-test Regression forts. Förelasning 7 Chitvå-test Regression forts. Detta är en mall för att göra PowerPoint presentationer. Du skriver in din rubrik på första sidan. För att skapa nya sidor, tryck Ctrl+M. Skriv sedan in din text. Om du vill ha fast datum, eller ändra författarnamn, gå in under Visa, Sidhuvud och Sidfot. Vill du använda hörnet med loggan över en utfallande bild, gå in på Bildbakgrund och kopiera. Klistra sedan in på den sida du vill ha den.
Analys av enkla frekvenstabeller Ofta analyserar man frekvenstabeller med hjälp av diagram. Är skillnaden statistiskt signifikant? Exempel: Antal personer som föredrar att handla i olika matbutiker (stickprov n=120, siffror påhittade) Statistiska metoder 2012
Analys av enkla frekvenstabeller Hypotesprövning H0: Det finns ingen signifikant skillnad mellan antalen i olika kategorierna: Ha: Det finns skillnad Marknad Antal Förväntad Willys 37 30 Lidl 28 30 Netto 12 30 ICA 43 30 För varje observerad frekvens O, kan man definiera förväntade frekvensen E under nollhypotesen som totalvärde S dividerad med antalet kategorier K Statistiska metoder 2012
Analys av enkla frekvenstabeller Givet en envägsindelad frekvenstabell och de förväntade frekvenser är större än 5, använd chitvå-statistiken med K-1 frihetsgrader vid hypotesprövningen: Rita fördelningen Kritiska området=alltid högra svansen Om vi är i det kritiska området Förkastar H0 Statistiska metoder 2012
Analys av enkla frekvenstabeller MINITAB: Använd StatTablesChi-Square Goodness-of-fit-test Test Contribution Category Observed Proportion Expected to Chi-Sq Willys 37 0,25 30 1,6333 Lidl 28 0,25 30 0,1333 Netto 12 0,25 30 10,8000 ICA 43 0,25 30 5,6333 N DF Chi-Sq P-Value 120 3 18,2 0,000 Statistiska metoder 2012
Analys av korstabeller Blodgrupp Sverige USA A 43 66 B 38 72 AB 11 23 O 8 19 Hypotesprövning H0: Fördelning i radkategorierna beror på kolumnkategorier Ha: Fördelningen är samma för alla kolumnkategorier Exempel: Antal personer med en viss blodgrupp (USA och Sverige) Skillnad mellan två länder? Statistiska metoder 2012
Analys av korstabeller Skatta marginala frekvenser och totalsumman För varje observerad frekvens O, definiera en förväntad frekvens E som produkten av motsvarande marginala frekvenser dividerade med totalsumman. Statistiska metoder 2012
Analys av korstabeller Givet en tvåvägsindelad frekvenstabell och de förväntade frekvenser är alla större än 5 förutom kanske 20% och ingen förväntad frekvens är mindre än 1, använd chitvå-statistiken med (R-1)(K-1) frihetsgrader vid hypotesprövningen: Om vi är i det kritiska området Förkastar H0 Statistiska metoder 2012
Analys av korstabeller MINITAB:Stat Tables Chi-Square test Sverige USA Total 1 43 66 109 38,93 70,07 0,426 0,237 2 38 72 110 39,29 70,71 0,042 0,023 3 11 23 34 12,14 21,86 0,108 0,060 4 8 19 27 9,64 17,36 0,280 0,155 Total 100 180 280 Chi-Sq = 1,331; DF = 3; P-Value = 0,722 Statistiska metoder 2012
Regression Vi antar att följande modell gäller: εi – slumpfel, normalfördelad med okända variansen σ2 Det är alltså ett statistiskt samband, fel: Felaktiga mätningar En eller flera viktiga variabler saknas i modellen Statistiska metoder 2012
Regression Exempel: Ålder och vikt av barn under 3 år. Två olika stickprov olika bilder (innebär att εi är olika) Anpassade regressionsekvationer är mycket lika! Hur mycket ska koefficienterna variera från ett stickprov till ett annat? Konfidensintervall behövs! Statistiska metoder 2012
Regression-utskriften Regression Analysis: Vikt2 versus Ålder The regression equation is Vikt2 = 4,86 + 3,62 Ålder Predictor Coef SE Coef T P Constant 4,8586 0,1766 27,51 0,000 Ålder 3,6226 0,1047 34,58 0,000 S = 0,894781 R-Sq = 92,4% R-Sq(adj) = 92,3% Analysis of Variance Source DF SS MS F P Regression 1 957,61 957,61 1196,06 0,000 Residual Error 98 78,46 0,80 Total 99 1036,07 Statistiska metoder 2012
Regression Hypotesprövning H0: b=0 H1 b≠0 Använd T-statistik med n-2 frihetsgrader vid hypotesprövning Konfidensintervall: Statistiska metoder 2012
Prediktion Kan vi prediktera utfall för de nya observationer? Ex.1 Vilken är genomsnittlig vikt av flickor som är 1 år gamla? Ex 2 I vilket intervall ligger genomsnittlig vikt av flickor som är ett år gamla? Konfidensinterval Ex3 I vilket interval vikt för en valfri flicka som är 1 år gammal Prediktionsinterval Predicted Values for New Observations New Obs Fit SE Fit 99% CI 99% PI 1 8,4813 0,1013 (8,2151; 8,7475) (6,1157; 10,8468) Values of Predictors for New Observations Obs Ålder 1 1,00 Statistiska metoder 2012
Läsa hemma Kapitel 8 Kompendiet Statistiska metoder 2012