Föreläsning 7 (Kajsa Fröjd) Korstabeller och Chi-tvåtest Kap 2.5, Man har två kvalitativa variabler som man vill gemensamt undersöka. 1
Korstabell Förklarande variabeln som kolumnvariabel. Respondvariabeln som radvariabel. Ex. (s.151) Äktenskap är bra för karriären för män enligt vissa studier. Nedan finns data från en studie på 8235 män som stödjer det påståendet. Civilstånd är förklarande variabel. Jobbnivå är respondvariabel. Civilstånd JobbnivåSingelGiftSkildÄnklingTotalt Totalt
Vilken korstabell är lämplig? A-vitamin eller placebo gavs till barn (1-6 år) i ett U-land. Efter ett år hade 101 av dött i A-vitamingruppen och 130 av barn dött i placebogruppen. 1.Övre 2.Undre DödLevandeTotalt Vitamin A Placebo Totalt Vitamin APlaceboTotalt Död Levande Totalt
Marginalfördelning Marginalfördelningar kallas de enskilda fördelningarna för den förklarande variabeln och för respondvariabeln. Ex. 4 Civilstånd JobbnivåSingelGiftSkildÄnklingTotalt Totalt
Vilket bild visar marginalfördelningen för hälsotillståndet efter ett år? 1.Den vänstra 2.Den högra Vitamin APlaceboTotalt Död Levande Totalt
Beräkning av marginalfördelning Marginalfördelning för Civilstånd: % singlar: 337/8235=0.041 % gifta: 7730/8235=0.939 % skilda: 126/8235=0.015 % änklingar: 42/8235= Civilstånd JobbnivåSingelGiftSkildÄnklingTotalt Totalt
Betingade fördelningar Marginalfördelningar berättar om de kvalitativa variablerna men säger ingenting om deras samband tillvarandra. Betingade fördelningar är bra för att betrakta samband mellan de kvalitativa variablerna. 7
Beräkning av betingad fördelning Ange den betingade fördelningen för jobbnivå för en man som är singel. % Jobbnivå 1|Singel: 58/337 = % Jobbnivå 2|Singel: 222/337 = % Jobbnivå 3|Singel: 50/337 = % Jobbnivå 4|Singel: 7/337 = Civilstånd JobbnivåSingelGiftSkildÄnklingTotalt Totalt
Betingade fördelningar De fyra betingade fördelningarna för jobbnivå givet mannens civilstånd är: 9
Betingad fördelning De betingade fördelningarna för den förklarande variabeln givet de olika värdena på respondvariabeln är oftast de intressantaste (dvs de vi har betraktat i exemplen). (Det finns naturligtvis även betingade fördelningar för respondvariabeln givet olika värden på förklaringsvariabeln.) 10
Vilket är den betingade fördelningen för hälso- tillståndet för barn som fick vitamin A? 1.101/12 890, 101/ /12 209, 130/ /12 079, 120/ /12 991, 12890/ Vitamin APlaceboTotalt Död Levande Totalt
Störande (lurking) variabler Man bör vara försiktig med vilka slutsatser man drar när man observerar statistiska samband mellan variabler. I extrema fall kan det samband man observerar vändas till det motsatta när man tar hänsyn till ytterligare variabler. Detta är Simpsons paradox. 12
Vilket sjukhus är det bättre? 13
Men om vi även vet om patientens tillstånd innan operationen... 14
Chi-två test kan användas för att: 15
Chi-två test för att testa samband mellan två kvalitativa variabler 16
Förväntade frekvenser under nollhypotesen 17 Civilstånd JobbnivåSingelGiftSkildÄnklingTotalt Totalt
Vad är det förväntade antalet levande barn efter ett år, givet att de får placebo? *2496/ *12209/ *130/ *24969/ Vitamin APlaceboTotalt Död Levande Totalt
Chi-två test 19
Vi testar om det finns något samband mellan civilstånd och jobbnivå. 20
Forts... 21
22 Chi-Square Test: Singel; Gift; Skild; Änkling Expected counts are printed below observed counts Chi-Square contributions are printed below expected counts Singel Gift Skild Änkling Total ,08 896,44 14,61 4,87 9,158 0,562 0,010 2, , ,05 64,86 21,62 13,575 0,681 0,407 0, , ,30 38,10 12,70 26,432 1,474 0,441 0, ,55 517,21 8,43 2,81 10,722 0,482 0,243 0,504 Total Chi-Sq = 67,397; DF = 9; P-Value = 0,000 2 cells with expected counts less than 5.
Hur många frihetsgrader är det? 1.En 2.Två 3.Tre 4.Fyra 23
Gissa ifall det finns stöd för ett samband mellan A-vitamin och hälsotillstånd? 1.Ja 2.Nej 24 Vitamin APlaceboTotalt Död Levande Totalt
Finns det stöd på signifikansnivån 0.05 för ett samband mellan A-vitamin och hälsotillstånd? 1.Ja 2.Nej 3.Vet inte Chi-Square Test: Vitamin A; Placebo Expected counts are printed below observed counts Chi-Square contributions are printed below expected counts Vitamin A Placebo Total ,08 111,92 2,746 2, , ,08 0,025 0,027 Total Chi-Sq = 5,721; DF = 1; P-Value = 0,017 25
Tillräcklig stickprovsstorlek 26
Är stickprovet tillräckligt stort för att Chi-två testet ska vara lämpligt? 27 1.Ja 2.Nej 3.Vet inte
Är stickprovet tillräckligt stort för att Chi-två testet ska vara lämpligt? 1.Ja 2.Nej 3.Vet inte 28 Vitamin APlaceboTotalt Död Levande Totalt