Föreläsning 7 (Kajsa Fröjd) Korstabeller och Chi-tvåtest Kap 2.5, Två/flera populationer och en kvalitativ variabel (”The first model” i Moore) 2.En population och två kvalitativa variabler (”The second model” i Moore) 1
Korstabeller 2
Exempel: Civilstånd/jobbnivå för män (s.151/-) Äktenskap är bra för karriären för män enligt vissa studier. Nedan finns data från en studie på 8235 män uppsatt i en korstabell. Civilstånd är förklarande variabel. Jobbnivå är respondvariabel. *Här är det en population (män) och två kvalitativa variabler (Jobbnivå och Civilstånd). När man konstruerar en korstabell bör: Den förklarande variabeln vara kolumnvariabel. Respondvariabeln vara radvariabel. Civilstånd JobbnivåSingelGiftSkildÄnklingTotalt Totalt
Ange en lämplig korstabell Ex: A-vitamin och överlevnad (s.546/503) A-vitamin eller placebo gavs till barn (1-6 år) i ett U-land. Efter ett år hade 101 av dött i A-vitamingruppen och 130 av barn dött i placebogruppen. 1.Övre 2.Undre *Här är det två populationer (A-vitamin-barnen och placebo-barnen) och en kvalitativ variabel med två utfall (död/levande). DödLevandeTotalt Vitamin A Placebo Totalt Vitamin APlaceboTotalt Död Levande Totalt
Ange en lämplig korstabell Ex: Bakgrundsmusik och vinval (s.548/505 ) I en studie spelades antingen fransk dragspelsmusik, italiensk strängmusik eller ingen musik alls i en affär på Nordirland. Man registrerade antalet franska, italienska samt övriga viner som såldes vid de olika bakgrundsljuden. 1.Övre 2.Undre * Här är det tre populationer (ingen musik, fransk och italiensk) och en kvalitativ variabel (franskt vin/italienskt vin/övrigt). 5 Musik VinIngenFranskItalienskTotalt Franskt Italienskt Övrigt Totalt Vin MusikFransktItaliensktÖvrigtTotalt Ingen Fransk Italiensk Totalt
Marginalfördelning (s. 151/123) Marginalfördelningar kallas de enskilda fördelningarna för den förklarande variabeln och för respondvariabeln. Ex. 6 Civilstånd JobbnivåSingelGiftSkildÄnklingTotalt Totalt
Vilken plot visar marginalfördelningen för hälsotillståndet efter ett år? 1.Den vänstra 2.Den högra Vitamin APlaceboTotalt Död Levande Totalt
Exempel: Civilstånd/jobbnivå för män Fråga: Beräkna marginalfördelningen för civilstånd. Lösn: Marginalfördelning för Civilstånd: % singlar: 337/8235 =0.041 % gifta: 7730/8235 = % skilda: 126/8235 = % änklingar: 42/8235 = Civilstånd JobbnivåSingelGiftSkildÄnklingTotalt Totalt
Ange marginalfördelningen för bakgrundsmusik Ex: Bakgrundsmusik och vinval 1.Ingen musik: 30/84 Fransk musik: 39/75 Italiensk musik:30/84 2.Ingen musik: 84/243 Fransk musik: 75/243 Italiensk musik: 84/243 2.Ingen musik: 99/243 Fransk musik: 31/243 Italiensk musik: 113/243 9 Musik VinIngenFranskItalienskTotalt Franskt Italienskt Övrigt Totalt
Betingade fördelningar (s.154/126) Marginalfördelningar berättar om de kvalitativa variablerna men säger ingenting om deras samband till varandra. Betingade fördelningar är bra för att betrakta samband mellan de kvalitativa variablerna. De betingade fördelningarna för respondvariabeln givet de olika värdena på den förklarande variabeln är oftast de intressantaste. (Det finns naturligtvis även betingade fördelningar för den förklarande variabeln givet olika värden på responsvariabeln.) 10
Exempel på betingade fördelningar De fyra betingade för- delningarna för jobbnivå givet de fyra olika civilstånden ⇒ 11 Civilstånd JobbnivåSingelGiftSkildÄnklingTotalt Totalt
Exempel: Civilstånd/jobbnivå för män Fråga: Ange den betingade fördelningen för jobbnivå givet att han är singel. Lösn: Den betingade fördelningen för jobbnivå givet att han är singel: % Jobbnivå 1|Singel: 58/337 = % Jobbnivå 2|Singel: 222/337 = % Jobbnivå 3|Singel: 50/337 = % Jobbnivå 4|Singel: 7/337 = Civilstånd JobbnivåSingelGiftSkildÄnklingTotalt Totalt
Ange den betingade fördelningen för hälsotillståndet för barn som fick vitamin A 1.Död: 101/12 890, Levande: 101/ Död: 130/12 209, Levande: 130/ Död: 130/12 079, Levande: 120/ Död: 101/12 991, Levande: 12890/ Vitamin APlaceboTotalt Död Levande Totalt
Ange fördelningen för vinval för de som får höra på italiensk strängmusik 1.Franskt vin: 30/84, Italienskt: 11/84, Övr: 43/84 2.Franskt vin: 30/243, Italienskt: 19/243, Övr: 35/243 3.Franskt vin: 30/84, Italienskt: 19/84, Övr: 35/84 (Obs. Notera att orden ”den betingade givet” inte står med men att det är den som menas.) 14 Musik VinIngenFranskItalienskTotalt Franskt Italienskt Övrigt Totalt
Störande (lurking) variabler Man bör vara försiktig med vilka slutsatser man drar när man observerar statistiska samband mellan variabler. I extrema fall kan det samband man observerar vändas till det motsatta när man tar hänsyn till ytterligare variabler. Detta är Simpsons paradox. 15
Vilket sjukhus är det bättre? 16
Men om vi även vet om patientens tillstånd innan operationen... 17
Chi-två test (s.510/552) 18
Chi-två test versus ”vanligt” z-test för att testa om två proportioner är lika (s.545/502) 19
För Chi-två-testet behövs de förväntade frekvenserna under nollhypotesen 20 Civilstånd JobbnivåSingelGiftSkildÄnklingTotalt Totalt
Ange det förväntade antalet överlevande barn efter ett år om de får placebo *2496/ *12209/ *130/ *24969/ Vitamin APlaceboTotalt Död Levande Totalt
Chi-två test 22
Exempel: Civilstånd/jobbnivå för män 23
24
25 Chi-Square Test: Singel; Gift; Skild; Änkling Expected counts are printed below observed counts Chi-Square contributions are printed below expected counts Singel Gift Skild Änkling Total ,08 896,44 14,61 4,87 9,158 0,562 0,010 2, , ,05 64,86 21,62 13,575 0,681 0,407 0, , ,30 38,10 12,70 26,432 1,474 0,441 0, ,55 517,21 8,43 2,81 10,722 0,482 0,243 0,504 Total Chi-Sq = 67,397; DF = 9; P-Value = 0,000 2 cells with expected counts less than 5.
Hur många frihetsgrader är det? 1.En 2.Två 3.Tre 4.Fyra 26
Gissa ifall det finns stöd för ett samband mellan A-vitamin och hälsotillstånd? 1.Ja 2.Nej 27 Vitamin APlaceboTotalt Död Levande Totalt
Finns det stöd på signifikansnivån 0.05 för ett samband mellan A-vitamin och hälsotillstånd? 1.Ja 2.Nej 3.Vet inte Chi-Square Test: Vitamin A; Placebo Expected counts are printed below observed counts Chi-Square contributions are printed below expected counts Vitamin A Placebo Total ,08 111,92 2,746 2, , ,08 0,025 0,027 Total Chi-Sq = 5,721; DF = 1; P-Value = 0,017 28
Tillräcklig stickprovsstorlek 29
Är stickprovet tillräckligt stort för att Chi- två testet ska vara lämpligt? 30 1.Ja 2.Nej 3.Vet inte
Är stickprovet tillräckligt stort för att Chi- två testet ska vara lämpligt? 1.Ja 2.Nej 3.Vet inte 31 Vitamin APlaceboTotalt Död Levande Totalt
Frivillig uppgift. Ex: Bakgrundsmusik och vinval Fråga: Testa om vinval har ett samband med bakgrundsmusik. Ange också om kriterierna är uppfyllda för att chi-två-testet ska vara lämpligt att använda. 32 Musik VinIngenFranskItalienskTotalt Franskt Italienskt Övrigt Totalt