Presentation laddar. Vänta.

Presentation laddar. Vänta.

Föreläsning 7 (Kajsa Fröjd) Korstabeller och Chi-tvåtest Kap 2.5, 9.1-9.2 1.Två/flera populationer och en kvalitativ variabel (”The first model” i Moore)

Liknande presentationer


En presentation över ämnet: "Föreläsning 7 (Kajsa Fröjd) Korstabeller och Chi-tvåtest Kap 2.5, 9.1-9.2 1.Två/flera populationer och en kvalitativ variabel (”The first model” i Moore)"— Presentationens avskrift:

1 Föreläsning 7 (Kajsa Fröjd) Korstabeller och Chi-tvåtest Kap 2.5, 9.1-9.2 1.Två/flera populationer och en kvalitativ variabel (”The first model” i Moore) 2.En population och två kvalitativa variabler (”The second model” i Moore) 1

2 Korstabeller 2

3 Exempel: Civilstånd/jobbnivå för män (s.151/-) Äktenskap är bra för karriären för män enligt vissa studier. Nedan finns data från en studie på 8235 män uppsatt i en korstabell. Civilstånd är förklarande variabel. Jobbnivå är respondvariabel. *Här är det en population (män) och två kvalitativa variabler (Jobbnivå och Civilstånd). När man konstruerar en korstabell bör: Den förklarande variabeln vara kolumnvariabel. Respondvariabeln vara radvariabel. Civilstånd JobbnivåSingelGiftSkildÄnklingTotalt 158874158955 2222392770204239 350239634102490 4753374551 Totalt33777301264233 3

4 Ange en lämplig korstabell Ex: A-vitamin och överlevnad (s.546/503) A-vitamin eller placebo gavs till barn (1-6 år) i ett U-land. Efter ett år hade 101 av 12 991 dött i A-vitamingruppen och 130 av 12209 barn dött i placebogruppen. 1.Övre 2.Undre *Här är det två populationer (A-vitamin-barnen och placebo-barnen) och en kvalitativ variabel med två utfall (död/levande). DödLevandeTotalt Vitamin A10112 89012 991 Placebo13012 07912 209 Totalt24124 96925 200 Vitamin APlaceboTotalt Död101130241 Levande12 89012 07924 969 Totalt12 99112 20925 200 4

5 Ange en lämplig korstabell Ex: Bakgrundsmusik och vinval (s.548/505 ) I en studie spelades antingen fransk dragspelsmusik, italiensk strängmusik eller ingen musik alls i en affär på Nordirland. Man registrerade antalet franska, italienska samt övriga viner som såldes vid de olika bakgrundsljuden. 1.Övre 2.Undre * Här är det tre populationer (ingen musik, fransk och italiensk) och en kvalitativ variabel (franskt vin/italienskt vin/övrigt). 5 Musik VinIngenFranskItalienskTotalt Franskt30393099 Italienskt1111931 Övrigt4335 113 Totalt847584243 Vin MusikFransktItaliensktÖvrigtTotalt Ingen30114384 Fransk3913575 Italiensk30193584 Totalt9931113243

6 Marginalfördelning (s. 151/123) Marginalfördelningar kallas de enskilda fördelningarna för den förklarande variabeln och för respondvariabeln. Ex. 6 Civilstånd JobbnivåSingelGiftSkildÄnklingTotalt 158874158955 2222392770204239 350239634102490 4753374551 Totalt3377730126428235

7 Vilken plot visar marginalfördelningen för hälsotillståndet efter ett år? 1.Den vänstra 2.Den högra Vitamin APlaceboTotalt Död101130241 Levande12 89012 07924 969 Totalt12 99112 20925 200 7

8 Exempel: Civilstånd/jobbnivå för män Fråga: Beräkna marginalfördelningen för civilstånd. Lösn: Marginalfördelning för Civilstånd: % singlar: 337/8235 =0.041 % gifta: 7730/8235 = 0.939 % skilda: 126/8235 = 0.015 % änklingar: 42/8235 =0.005 8 Civilstånd JobbnivåSingelGiftSkildÄnklingTotalt 158874158955 2222392770204239 350239634102490 4753374551 Totalt3377730126428235

9 Ange marginalfördelningen för bakgrundsmusik Ex: Bakgrundsmusik och vinval 1.Ingen musik: 30/84 Fransk musik: 39/75 Italiensk musik:30/84 2.Ingen musik: 84/243 Fransk musik: 75/243 Italiensk musik: 84/243 2.Ingen musik: 99/243 Fransk musik: 31/243 Italiensk musik: 113/243 9 Musik VinIngenFranskItalienskTotalt Franskt30393099 Italienskt1111931 Övrigt4335 113 Totalt847584243

10 Betingade fördelningar (s.154/126) Marginalfördelningar berättar om de kvalitativa variablerna men säger ingenting om deras samband till varandra. Betingade fördelningar är bra för att betrakta samband mellan de kvalitativa variablerna. De betingade fördelningarna för respondvariabeln givet de olika värdena på den förklarande variabeln är oftast de intressantaste. (Det finns naturligtvis även betingade fördelningar för den förklarande variabeln givet olika värden på responsvariabeln.) 10

11 Exempel på betingade fördelningar De fyra betingade för- delningarna för jobbnivå givet de fyra olika civilstånden ⇒ 11 Civilstånd JobbnivåSingelGiftSkildÄnklingTotalt 158874158955 2222392770204239 350239634102490 4753374551 Totalt3377730126428235

12 Exempel: Civilstånd/jobbnivå för män Fråga: Ange den betingade fördelningen för jobbnivå givet att han är singel. Lösn: Den betingade fördelningen för jobbnivå givet att han är singel: % Jobbnivå 1|Singel: 58/337 = 0.172 % Jobbnivå 2|Singel: 222/337 = 0.659 % Jobbnivå 3|Singel: 50/337 = 0.148 % Jobbnivå 4|Singel: 7/337 = 0.208 12 Civilstånd JobbnivåSingelGiftSkildÄnklingTotalt 158874158955 2222392770204239 350239634102490 4753374551 Totalt3377730126428235

13 Ange den betingade fördelningen för hälsotillståndet för barn som fick vitamin A 1.Död: 101/12 890, Levande: 101/12 991 2.Död: 130/12 209, Levande: 130/12 209 3.Död: 130/12 079, Levande: 120/12 209 4.Död: 101/12 991, Levande: 12890/12 991 13 Vitamin APlaceboTotalt Död101130241 Levande12 89012 07924 969 Totalt12 99112 20925 200

14 Ange fördelningen för vinval för de som får höra på italiensk strängmusik 1.Franskt vin: 30/84, Italienskt: 11/84, Övr: 43/84 2.Franskt vin: 30/243, Italienskt: 19/243, Övr: 35/243 3.Franskt vin: 30/84, Italienskt: 19/84, Övr: 35/84 (Obs. Notera att orden ”den betingade............. givet” inte står med men att det är den som menas.) 14 Musik VinIngenFranskItalienskTotalt Franskt30393099 Italienskt1111931 Övrigt4335 113 Totalt847584243

15 Störande (lurking) variabler Man bör vara försiktig med vilka slutsatser man drar när man observerar statistiska samband mellan variabler. I extrema fall kan det samband man observerar vändas till det motsatta när man tar hänsyn till ytterligare variabler. Detta är Simpsons paradox. 15

16 Vilket sjukhus är det bättre? 16

17 Men om vi även vet om patientens tillstånd innan operationen... 17

18 Chi-två test (s.510/552) 18

19 Chi-två test versus ”vanligt” z-test för att testa om två proportioner är lika (s.545/502) 19

20 För Chi-två-testet behövs de förväntade frekvenserna under nollhypotesen 20 Civilstånd JobbnivåSingelGiftSkildÄnklingTotalt 1 58 39.08 874 896.44 15 14.61 8 4.87 955 2 222 173.47 3927 3979.05 70 64.86 20 21.62 4239 3 50 101.90 2396 2337.30 34 38.10 10 12.70 2490 4 7 22.55 533 517.21 7 8.43 4 2.81 551 Totalt3377730126428235

21 Ange det förväntade antalet överlevande barn efter ett år om de får placebo 1.12079*2496/25200 2.241*12209/25200 3.12079*130/25200 4.12209*24969/25200 21 Vitamin APlaceboTotalt Död101130241 Levande12 89012 07924 969 Totalt12 99112 20925 200

22 Chi-två test 22

23 Exempel: Civilstånd/jobbnivå för män 23

24 24

25 25 Chi-Square Test: Singel; Gift; Skild; Änkling Expected counts are printed below observed counts Chi-Square contributions are printed below expected counts Singel Gift Skild Änkling Total 1 58 874 15 8 955 39,08 896,44 14,61 4,87 9,158 0,562 0,010 2,011 2 222 3927 70 20 4239 173,47 3979,05 64,86 21,62 13,575 0,681 0,407 0,121 3 50 2396 34 10 2490 101,90 2337,30 38,10 12,70 26,432 1,474 0,441 0,574 4 7 533 7 4 551 22,55 517,21 8,43 2,81 10,722 0,482 0,243 0,504 Total 337 7730 126 42 8235 Chi-Sq = 67,397; DF = 9; P-Value = 0,000 2 cells with expected counts less than 5.

26 Hur många frihetsgrader är det? 1.En 2.Två 3.Tre 4.Fyra 26

27 Gissa ifall det finns stöd för ett samband mellan A-vitamin och hälsotillstånd? 1.Ja 2.Nej 27 Vitamin APlaceboTotalt Död 101 119.08 130 111.92 241 Levande 12 890 12 872.92 12 079 12 097.08 24 969 Totalt12 99112 20925 200

28 Finns det stöd på signifikansnivån 0.05 för ett samband mellan A-vitamin och hälsotillstånd? 1.Ja 2.Nej 3.Vet inte Chi-Square Test: Vitamin A; Placebo Expected counts are printed below observed counts Chi-Square contributions are printed below expected counts Vitamin A Placebo Total 1 101 130 231 119,08 111,92 2,746 2,922 2 12890 12079 24969 12871,92 12097,08 0,025 0,027 Total 12991 12209 25200 Chi-Sq = 5,721; DF = 1; P-Value = 0,017 28

29 Tillräcklig stickprovsstorlek 29

30 Är stickprovet tillräckligt stort för att Chi- två testet ska vara lämpligt? 30 1.Ja 2.Nej 3.Vet inte

31 Är stickprovet tillräckligt stort för att Chi- två testet ska vara lämpligt? 1.Ja 2.Nej 3.Vet inte 31 Vitamin APlaceboTotalt Död 101 119.08 130 111.92 241 Levande 12 890 12 872.92 12 079 12 097.08 24 969 Totalt12 99112 20925 200

32 Frivillig uppgift. Ex: Bakgrundsmusik och vinval Fråga: Testa om vinval har ett samband med bakgrundsmusik. Ange också om kriterierna är uppfyllda för att chi-två-testet ska vara lämpligt att använda. 32 Musik VinIngenFranskItalienskTotalt Franskt30393099 Italienskt1111931 Övrigt4335 113 Totalt847584243


Ladda ner ppt "Föreläsning 7 (Kajsa Fröjd) Korstabeller och Chi-tvåtest Kap 2.5, 9.1-9.2 1.Två/flera populationer och en kvalitativ variabel (”The first model” i Moore)"

Liknande presentationer


Google-annonser