Presentation laddar. Vänta.

Presentation laddar. Vänta.

1 Förelasning 7 Chitvå-test Regression forts.. 2 Statistiska metoder 2012 Analys av enkla frekvenstabeller Ofta analyserar man frekvenstabeller med hjälp.

Liknande presentationer


En presentation över ämnet: "1 Förelasning 7 Chitvå-test Regression forts.. 2 Statistiska metoder 2012 Analys av enkla frekvenstabeller Ofta analyserar man frekvenstabeller med hjälp."— Presentationens avskrift:

1 1 Förelasning 7 Chitvå-test Regression forts.

2 2 Statistiska metoder 2012 Analys av enkla frekvenstabeller Ofta analyserar man frekvenstabeller med hjälp av diagram.  Är skillnaden statistiskt signifikant? Exempel: Antal personer som föredrar att handla i olika matbutiker (stickprov n=120, siffror påhittade)

3 Analys av enkla frekvenstabeller Hypotesprövning H 0 : Det finns ingen signifikant skillnad mellan antalen i olika kategorierna: H a : Det finns skillnad 3 Statistiska metoder 2012 MarknadAntalFörväntad Willys3730 Lidl2830 Netto1230 ICA 4330 För varje observerad frekvens O, kan man definiera förväntade frekvensen E under nollhypotesen som totalvärde S dividerad med antalet kategorier K

4 Analys av enkla frekvenstabeller Givet en envägsindelad frekvenstabell och de förväntade frekvenser är större än 5, använd chitvå-statistiken med K-1 frihetsgrader vid hypotesprövningen: Rita fördelningen Kritiska området=alltid högra svansen Om vi är i det kritiska området  Förkastar H 0 4 Statistiska metoder 2012

5 Analys av enkla frekvenstabeller MINITAB: Använd Stat  Tables  Chi-Square Goodness- of-fit-test 5 Statistiska metoder 2012 Test Contribution Category Observed Proportion Expected to Chi-Sq Willys 37 0, ,6333 Lidl 28 0, ,1333 Netto 12 0, ,8000 ICA 43 0, ,6333 N DF Chi-Sq P-Value ,2 0,000

6 Analys av korstabeller Hypotesprövning H 0 : Fördelning i radkategorierna beror på kolumnkategorier H a : Fördelningen är samma för alla kolumnkategorier Exempel: Antal personer med en viss blodgrupp (USA och Sverige)  Skillnad mellan två länder? 6 Statistiska metoder 2012 Blodgrupp SverigeUSA A4366 B3872 AB1123 O819

7 Analys av korstabeller Skatta marginala frekvenser och totalsumman För varje observerad frekvens O, definiera en förväntad frekvens E som produkten av motsvarande marginala frekvenser dividerade med totalsumman. 7 Statistiska metoder 2012

8 Analys av korstabeller Givet en tvåvägsindelad frekvenstabell och de förväntade frekvenser är alla större än 5 förutom kanske 20% och ingen förväntad frekvens är mindre än 1, använd chitvå-statistiken med (R-1)(K-1) frihetsgrader vid hypotesprövningen: Om vi är i det kritiska området  Förkastar H 0 8 Statistiska metoder 2012

9 Analys av korstabeller MINITAB:Stat  Tables  Chi-Square test 9 Statistiska metoder 2012 Sverige USA Total ,93 70,07 0,426 0, ,29 70,71 0,042 0, ,14 21,86 0,108 0, ,64 17,36 0,280 0,155 Total Chi-Sq = 1,331; DF = 3; P-Value = 0,722

10 Regression Vi antar att följande modell gäller: ε i – slumpfel, normalfördelad med okända variansen σ 2 Det är alltså ett statistiskt samband, fel:  Felaktiga mätningar  En eller flera viktiga variabler saknas i modellen 10 Statistiska metoder 2012

11 Regression Exempel: Ålder och vikt av barn under 3 år. Två olika stickprov  olika bilder (innebär att ε i är olika) Anpassade regressionsekvationer är mycket lika!  Hur mycket ska koefficienterna variera från ett stickprov till ett annat?  Konfidensintervall behövs! 11 Statistiska metoder 2012

12 Regression-utskriften Regression Analysis: Vikt2 versus Ålder The regression equation is Vikt2 = 4,86 + 3,62 Ålder Predictor Coef SE Coef T P Constant 4,8586 0, ,51 0,000 Ålder 3,6226 0, ,58 0,000 S = 0, R-Sq = 92,4% R-Sq(adj) = 92,3% Analysis of Variance Source DF SS MS F P Regression 1 957,61 957, ,06 0,000 Residual Error 98 78,46 0,80 Total ,07 12 Statistiska metoder 2012

13 Regression Hypotesprövning H 0 : b=0 H 1 b≠0 Använd T-statistik med n-2 frihetsgrader vid hypotesprövning Konfidensintervall: 13 Statistiska metoder 2012

14 Prediktion Kan vi prediktera utfall för de nya observationer?  Ex.1 Vilken är genomsnittlig vikt av flickor som är 1 år gamla?  Ex 2 I vilket intervall ligger genomsnittlig vikt av flickor som är ett år gamla? Konfidensinterval  Ex3 I vilket interval vikt för en valfri flicka som är 1 år gammal Prediktionsinterval Predicted Values for New Observations New Obs Fit SE Fit 99% CI 99% PI 1 8,4813 0,1013 (8,2151; 8,7475) (6,1157; 10,8468) Values of Predictors for New Observations New Obs Ålder 1 1,00 14 Statistiska metoder 2012

15 Läsa hemma Kapitel 8 Kompendiet 15 Statistiska metoder 2012


Ladda ner ppt "1 Förelasning 7 Chitvå-test Regression forts.. 2 Statistiska metoder 2012 Analys av enkla frekvenstabeller Ofta analyserar man frekvenstabeller med hjälp."

Liknande presentationer


Google-annonser