Presentation laddar. Vänta.

Presentation laddar. Vänta.

Klusterurval, forts.. Variansberäkningar i urvalet: Notera: ”t”et i och ändrar inte värde utan är en fast beteckning medan ”i”et i och ändrar värde från.

Liknande presentationer


En presentation över ämnet: "Klusterurval, forts.. Variansberäkningar i urvalet: Notera: ”t”et i och ändrar inte värde utan är en fast beteckning medan ”i”et i och ändrar värde från."— Presentationens avskrift:

1 Klusterurval, forts.

2 Variansberäkningar i urvalet: Notera: ”t”et i och ändrar inte värde utan är en fast beteckning medan ”i”et i och ändrar värde från kluster till kluster

3 Enstegs klusterurval Urval görs endast av kluster (PSU). I varje utvalt kluster ”mäts” alla element (SSU)  m i = M i Två fall: 1. Alla kluster är lika stora, dvs. M 1 = M 2 = … = M N = M M 0 = N ∙ M dvs. är känd om N är känd. 2.Olika stora kluster. M 0 behöver inte vara känd, och är det endast om alla M i är kända.

4 Fall 1: Utgå från OSU av kluster eftersom vi här observerar samtliga element i varje kluster i urvalet. där Även här utnyttjas att samtliga element i varje kluster observeras

5 Exempel: En myndighet för månadsvis loggbok över alla besökare. Loggboken består av sidor med 30 rader vardera där varje rad används för att skriva in en besökare. Bland annat antecknas tidpunkt när besökaren anländer och tidpunkt när besökaren lämnar myndigheten En viss månad har loggboken precis 55 fulltecknade sidor. Man gör ett OSU av 3 sidor och observerar de tider varje besökare på var och en av de tre sidorna har uppehållit sig vid myndigheten. Således: Ett enstegs klusterurval av 3 kluster där alla 55 kluster i populationen är lika stora. Också (självklart) väntevärdesriktig

6 Resultat Sida ( i )Summerade uppehållstider ( t i ) i minuter

7 Urvalsvikter: Urvalet är därmed självvägt!

8 Fall 2: (Fortfarande OSU av kluster) men förutsätter att alla M i är kända dvs. samma som vid Fall 1

9 Urvalsvikterna är också desamma och även här är alltså urvalet självvägt. Betrakta dock Vad kan vara skillnaden mellan Fall1 och 2 för denna varians? Hur kan vi skatta populationsmedeltalet om inte alla M i är kända?

10 Kvotskattning Populationsmedeltalet kan skrivas dvs. som en populationskvot. Motsvarande urvalskvot blir men kan också skrivas

11 Urvalskvoten blir därmed en alternativ skattning av populationsmedeltalet: Teorin för kvotskattningar från OSU kan användas här 

12 Kvotskattningen är som vanlig inte väntevärdesriktig Om klusterstorlekarna varierar mycket  Kvotskattningen har lägre varians än den väntevärdesriktiga skattningen. Kvotskattning av t kan göras om M 0 är känd: Exempel: I ett bostadsområde finns 18 flerfamiljshus med varierande antal lägenheter i varje hus. Man vill undersöka andelen lägenheter (egentligen hushåll), som är anslutna till ett visst kabel-TV-nät. Ett OSU av 5 hus görs därför och i varje hus undersöks samtliga lägenheter. Enstegs klusterurval enligt Fall 2. N = 18, n =5

13 Resultat Hus (kluster) ( i ) Antal lägenheter ( M i ) Antal anslutna lägenheter ( t i )

14 95% konfidensintervall för andelen anslutna lägenheter: Väntevärdesriktig skattning kan inte användas här eftersom vi inte har kunskap om antalet lägenheter i varje hus. Antag dock att vi vet att det finns totalt 380 lägenheter i området.

15 Tvåstegs klusterurval Som regel görs ett OSU av m i element från kluster i ; i  S Väntevärdesriktiga skattningar: Härledningar av såväl teoretisk som skattad varians är komplicerade!

16 Urvalsvikter: Urvalet blir självvägt om

17 Kvotskattningar: Om M 0 är känd:

18 Urvalsdimensionering Variansanalys: SSTO har M 0 – 1 frihetsgrader, SSB har N – 1 frihetsgrader och SSW har M 0 – N frihetsgrader Justerad förklaringsgrad: utgör ett mått på heterogeniteten mellan olika kluster. Ju högre R a 2 desto mer olika är klustren (ur medelvärdessynkvinkel)

19 I det enklaste fallet med lika stora kluster gäller då Låt c 1 vara kostnaden för att välja ut ett kluster och c 2 kostanden för att älja ut och undersöka ett element i ett kluster  Totalkostnad blir För en fix totalkostnad C blir då optimala värden på n och m

20 Justerad förklaringsgrad kan uppskattas från tidigare undersökningar (eller en pilotstudie)  För en stor population kan vi approximera Om nu klusterstorlekarna är olika stora (vilket är normalfallet) så utgår vi från genomsnittlig totalkostnad Välj


Ladda ner ppt "Klusterurval, forts.. Variansberäkningar i urvalet: Notera: ”t”et i och ändrar inte värde utan är en fast beteckning medan ”i”et i och ändrar värde från."

Liknande presentationer


Google-annonser