Klusterurval, forts.
Variansberäkningar i urvalet: Notera: ”t”et i och ändrar inte värde utan är en fast beteckning medan ”i”et i och ändrar värde från kluster till kluster
Enstegs klusterurval Urval görs endast av kluster (PSU). I varje utvalt kluster ”mäts” alla element (SSU) mi = Mi Två fall: Alla kluster är lika stora, dvs. M1 = M2 = … = MN = M M0 = N ∙ M dvs. är känd om N är känd. 2. Olika stora kluster. M0 behöver inte vara känd, och är det endast om alla Mi är kända.
Fall 1: Utgå från OSU av kluster eftersom vi här observerar samtliga element i varje kluster i urvalet. där Även här utnyttjas att samtliga element i varje kluster observeras
Också (självklart) väntevärdesriktig Exempel: En myndighet för månadsvis loggbok över alla besökare. Loggboken består av sidor med 30 rader vardera där varje rad används för att skriva in en besökare. Bland annat antecknas tidpunkt när besökaren anländer och tidpunkt när besökaren lämnar myndigheten En viss månad har loggboken precis 55 fulltecknade sidor. Man gör ett OSU av 3 sidor och observerar de tider varje besökare på var och en av de tre sidorna har uppehållit sig vid myndigheten. Således: Ett enstegs klusterurval av 3 kluster där alla 55 kluster i populationen är lika stora.
Summerade uppehållstider ( ti ) i minuter Resultat Sida ( i ) Summerade uppehållstider ( ti ) i minuter 1 1305 2 1407 3 1288
Urvalsvikter: Urvalet är därmed självvägt!
Fall 2: (Fortfarande OSU av kluster) dvs. samma som vid Fall 1 men förutsätter att alla Mi är kända
Urvalsvikterna är också desamma och även här är alltså urvalet självvägt. Betrakta dock Vad kan vara skillnaden mellan Fall1 och 2 för denna varians? Hur kan vi skatta populationsmedeltalet om inte alla Mi är kända?
Kvotskattning Populationsmedeltalet kan skrivas dvs. som en populationskvot. Motsvarande urvalskvot blir men kan också skrivas
Urvalskvoten blir därmed en alternativ skattning av populationsmedeltalet: Teorin för kvotskattningar från OSU kan användas här
Kvotskattningen är som vanlig inte väntevärdesriktig Om klusterstorlekarna varierar mycket Kvotskattningen har lägre varians än den väntevärdesriktiga skattningen. Kvotskattning av t kan göras om M0 är känd: Exempel: I ett bostadsområde finns 18 flerfamiljshus med varierande antal lägenheter i varje hus. Man vill undersöka andelen lägenheter (egentligen hushåll), som är anslutna till ett visst kabel-TV-nät. Ett OSU av 5 hus görs därför och i varje hus undersöks samtliga lägenheter. Enstegs klusterurval enligt Fall 2. N = 18, n =5
Antal anslutna lägenheter Resultat Hus (kluster) ( i ) Antal lägenheter ( Mi ) Antal anslutna lägenheter ( ti ) 1 16 12 2 22 19 3 15 4 30 25 5 17
95% konfidensintervall för andelen anslutna lägenheter: Väntevärdesriktig skattning kan inte användas här eftersom vi inte har kunskap om antalet lägenheter i varje hus. Antag dock att vi vet att det finns totalt 380 lägenheter i området.
Tvåstegs klusterurval Som regel görs ett OSU av mi element från kluster i ; i S Väntevärdesriktiga skattningar: Härledningar av såväl teoretisk som skattad varians är komplicerade!
Urvalsvikter: Urvalet blir självvägt om
Kvotskattningar: Om M0 är känd:
Urvalsdimensionering Variansanalys: SSTO har M0 – 1 frihetsgrader, SSB har N – 1 frihetsgrader och SSW har M0 – N frihetsgrader Justerad förklaringsgrad: utgör ett mått på heterogeniteten mellan olika kluster. Ju högre Ra2 desto mer olika är klustren (ur medelvärdessynkvinkel)
I det enklaste fallet med lika stora kluster gäller då Låt c1 vara kostnaden för att välja ut ett kluster och c2 kostanden för att älja ut och undersöka ett element i ett kluster Totalkostnad blir För en fix totalkostnad C blir då optimala värden på n och m
Justerad förklaringsgrad kan uppskattas från tidigare undersökningar (eller en pilotstudie) För en stor population kan vi approximera Om nu klusterstorlekarna är olika stora (vilket är normalfallet) så utgår vi från genomsnittlig totalkostnad Välj