732G81 Statistik för internationella civilekonomer isak.hietala@liu.se Föreläsning 9 732G81 Statistik för internationella civilekonomer isak.hietala@liu.se
Dagens föreläsning Ändlig population Urval OSU Systematiskt urval Klusterurval Stratifierat urval Allokeringar Chi-två-test Exempel på attitydfråga (1-5) Koppling till hypotesprövning för andelar 732G81
Ändlig population När använda dessa beräkningar? Kursboken föreslår (som tumregel) att när 𝑛 𝑁 >10 % så bör beräkningar för ändlig population användas. Men, om populationsstorleken (N) är känd så är det lika bra att använda beräkningar för ändlig population. Vi detaljstuderar ändlighetskorrektionen: 1− 𝑛 𝑁 732G81
Urval Obundet slumpmässigt urval (OSU), systematiskt urval OSU har diskuterats mycket under kursen och är den (i teorin) enklaste urvalsmetoden. Systematiskt urval kan ses som en variant på OSU. Urvalsenheterna väljs periodiskt ur en urvalsram. Dock finns det rent praktiska problem med OSU: Kan vara svårt, dyrt och tidsödande att upprätta en urvalsram med alla enheter i populationen Inte bra vid heterogena populationer 732G81
Urval Klusterurval För att komma undan problematiken med upprättandet av urvalsram kan klusterurval användas. Med denna metodik väljs hela grupper (kluster) av element ut samtidigt. Detta kan i teorin utföras i hur många steg som helst, men i praktiken brukar det genomföras i två eller tre steg. Grupperna kan t.ex. väljas ut med hjälp av OSU och stratifierat urval. Grupperna förutsätts vara heterogena och spegla målpopulationen. 732G81
Urval Stratifierat urval, allokering Om en heterogen population består av flera homogena delpopulationer kan stratifierat urval med fördel användas. Hur stora urval som bör dras från de olika delpopulationerna kan bestämmas med hjälp av allokering. Dessa allokeringar brukar göras med hjälp av förhandsinformation om populationerna, t.ex. i form av en tidigare studie. 732G81
Urval Olika urvalstyper, exempel Vi återgår till uppgift 8.1 från kompendiet. Förutsättningar kring antaganden i uppgift 1. Antagandet om normalfördelning, CGS eller populationen är normalfördelad. Kapitel 11 i kursboken för icke-parametriska metoder. 732G81
Urval Stratifierat urval, allokering Exempel Man vill med hjälp av personliga intervjuer undersöka den egna studietiden (utöver schemalagd tid) bland studenter vid Campus Valla. Dessa intervjuer kommer att ske under normal arbetstid, och man har valt att använda fakulteter som stratum (tekniska fakulteten med 8 000 studenter och filosofiska fakulteten / utbildningsvetenskap med 10 000 studenter). En liten pilotstudie görs. Där framkommer att standardavvikelsen för TekFak är 4 timmar och för FilFak/UV är den 3 timmar. På grund av att TekFak har mer schemalagd tid tar det längre tid att intervjua dessa studenter, och eftersom tid är pengar kostar det i snitt dubbelt så mycket att göra en intervju med en TekFak- student. Man har tänkt sig att totalt intervjua 300 studenter, hur många ska väljas från de olika fakulteterna med hjälp av optimal allokering? 732G81
Chi-två-test Exempel attitydfråga En attitydfråga (1-5) fick följande fördelning: Ett chi-två-test utfördes i Minitab. 1 2 3 4 5 Kvinnor 21 17 15 12 13 Män 18 19 Chi-Square Test: 1; 2; 3; 4; 5 Expected counts are printed below observed counts 1 2 3 4 5 Total 1 21 17 15 12 13 78 17,12 16,17 15,70 14,74 14,27 2 15 17 18 19 17 86 18,88 17,83 17,30 16,26 15,73 Total 36 34 33 31 30 164 Chi-Sq = 3,004; DF = 4; P-Value = 0,557 Tänk på: Hypotesformulering Kontrollera förväntade värden Kritiskt tabellvärde = 9.488 med alpha = 0.05 732G81
Chi-två-test Exempel attitydfråga Föregående exempel var inga konstigheter, men ibland kan man stöta på patrull. 1 2 3 4 5 Kvinnor 7 30 6 Män 9 41 Chi-Square Test: 1; 2; 3; 4; 5 Expected counts are printed below observed counts 1 2 3 4 5 Total 1 1 7 30 6 7 51 2,30 7,35 32,62 4,59 4,14 2 4 9 41 4 2 60 2,70 8,65 38,38 5,41 4,86 Total 5 16 71 10 9 111 Chi-Sq = 6,243; DF = 4; P-Value = 0,182 5 cells with expected counts less than 5. 732G81
Chi-två-test Exempel attitydfråga Logisk sammanslagning kan användas. I detta fall kan logisk sammanslagning vara av betyg 1 och 2 respektive betyg 4 och 5. 1 - 2 3 4 - 5 Kvinnor 8 30 13 Män 41 6 Chi-Square Test: 1 - 2; 3; 4 - 5 Expected counts are printed below observed counts 1 - 2 3 4 - 5 Total 1 8 30 13 51 9,65 32,62 8,73 2 13 41 6 60 11,35 38,38 10,27 Total 21 71 19 111 Chi-Sq = 4,775; DF = 2; P-Value = 0,092 Kritiskt tabellvärde = 5,991 732G81
Chi-två-test Exempel andelar Ibland går det inte att använda sig av logisk sammanslagning. I ett sådant här fall kan det vara lämpligt att analysera andelar i stället. Dessa kan bestämmas utifrån frågeställning. Ja Nej Vet ej Kvinnor 63 52 1 Män 72 31 2 732G81
Chi-två-test Exempel andelar Faktum är att chi-två-test ger (ungefär) samma p-värde som för andelstest vid 2x2-tabell. Ja Nej Kvinnor 63 52 Män 72 31 Chi-Square Test: Ja; Nej Expected counts are printed below observed counts Ja Nej Total 1 63 52 115 71,22 43,78 2 72 31 103 63,78 39,22 Total 135 83 218 Chi-Sq = 5,269; DF = 1; P-Value = 0,022 Test and CI for Two Proportions Sample X N Sample p 1 63 115 0,547826 2 72 103 0,699029 Difference = p (1) - p (2) Estimate for difference: -0,151203 Test for difference = 0 (vs not = 0): Z = -2,33 P-Value = 0,020 732G81
Övriga frågor? Skillnad mellan skattning av medelvärde och totalmängd.