Klusterurval, forts..

Slides:



Advertisements
Liknande presentationer
Punkt- och intervallskattning Felmarginal
Advertisements

Inferens om en population Sid
Om undersökningen Läsanvisningar för resultatdiagrammen
Den nya avfallslagen / avfallstransporter
Talföljder formler och summor
Icke-linjära modeller:
Likheter/Skillnader?.
Mats Nyfjäll Statisticon
F3 Matematikrep Summatecknet Potensräkning Logaritmer Kombinatorik.
FL4 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
Inledning Vi har valt mikrovågsugnen som tekniskpryl.
Ruttplanering Vad är det??.
Ellära Fysik 1 / A Översiktlig beskrivning av en del av innehållet i Ellära – Fysik A För djupare studier hänvisar jag till kurslitteratur som finns.
Marknaden – ett enkelt exempel Varian kap 1
Numeriska beräkningar i Naturvetenskap och Teknik
1 Logikprogrammering ons 11/9 David Hjelm. 2 Repetition Listor är sammansatta termer. De består av en ordnad mängd element. Elementen i en lista kan vara.
Användande av hjälpinformation: Kvotskattning
Tidsvärde – definition och härledning Maria Börjesson 27 november 2009, 1.
ERGONOMI Vad är det?.
1 Sårbarhetsanalyser av vägnät - gjort sedan förra mötet Referensgruppsmöte 16 november 2009.
Nytt golv av finaste furu
FL8 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
FL10 732G81 Linköpings universitet.
FL9 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
FL5 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
732G22 Grunder i statistisk metodik
Inferens om en ändlig population Sid
Jämförelse av två populationer Sid
Kapitel 5 Stickprovsteori Sid
732G22 Grunder i statistisk metodik
FL2 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
732G22 Grunder i statistisk metodik
F11 Olika urvalsmetoder, speciellt obundet slumpmässigt urval (OSU)
Pointers. int a=5; int f(int b) { a--; b++; return b; } int main() { int a=3; printf("%d,",f(a)); printf("%d",a); return 0; }
Tillämpad statistik Naprapathögskolan
Felkalkyl Ofta mäter man inte direkt den storhet som är den intressanta, utan en grundläggande variabel som sedan används för att beräkna det som man är.
Skattningens medelfel
Helmjölk eller pulvermjölk med högre mjölkpris?
Anslutningspris för fiber till villa
732G81 Statistik för internationella civilekonomer
SCB:s medborgarundersökning Nackas resultat med jämförelser Genomförd 19 september – 8 november personer svarade (av 1500)
Föreläsning 81 Sampling och urval Ofta möter vi påståenden av typen “4.5 miljoner svenskar såg VM-finalen i fotboll”, “en svensk tolvåring väger i genomsnitt.
DNA-bevis För jämförelser mellan biologiska spår (blod, hår, saliv, hudrester, andra kroppsvätskor, mm.) och prov från en misstänkt förövare av ett brott.
Stratifierat urval OSU är tillämpbart för (ram)populationer där ett slumpmässigt valt element är “representativt” för hela populationen Om man på förhand.
Logikprogrammering 21/10 Binära träd
FL7 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
Egenskaper för punktskattning
Alternativ till  2-test
FL6 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
Simulering Introduktion Exempel: Antag att någon kastar tärning
Föreläsning 7 Fysikexperiment 5p Poissonfördelningen Poissonfördelningen är en sannolikhetsfördelning för diskreta variabler som är mycket.
Hur bra är modellen som vi har anpassat?
Förvaringsfallet igen, hur angriper vi problemet?
Övningsexempel till Kapitel 7 Ex 1. BRÄNNBOLLSDILEMMAT ! En person funderar över hur man bäst uppskattar 28 meter. Av erfarenhet vet han att hans steglängd,
Föreläsning 11732G26 Surveymetosik med uppsats Urvalsvikter vid dragning med återläggning av PSU Vid urval utan återläggning: Använd analogin med Q i här:
Konditon Upplevelsen av ett motionspass påverkas vilken intensitet träningen har. Man kan dela upp konditionsträning i två delar: Högintensiv träning och.
Fysikexperiment, 5p1 Random Walk 36 försök med Random walk med 1000 steg. Beräknad genomsnittlig räckvidd är  1000  32. Visualisering av utfallsrum.
Några allmänna räkneregler för sannolikheter
732G22 Grunder i statistisk metodik
© Anders Broberg, Lena Kallin Westin, 2007 Datastrukturer och algoritmer Föreläsning 14.
1 Fler uträkningar med normalfördelningstabell Låt X vara Nf(170,5). Beräkna Lösning:
Grundläggande statistik, ht 09, AN
Grundläggande statistik, ht 09, AN1 F6 Slumpmässigt urval 1. Population där X är diskret med fördelningen p(x). Medelvärdet μ och variansen σ². Observationer:
1 Icke-linjär regression Sid (i kapitel 16.1)
Statistisk inferensteori. Inledning Den statistiska inferensteorin handlar i huvudsak om att dra slutsatser från ett slumpmässigt urval (sannolikhetsurval)
Betingade sannolikheter. 2 Antag att vi kastar en tärning och noterar antalet prickar som kommer upp. Låt A vara händelsen ”udda antal prickar”, dvs.
Regression Har långa högre inkomst?. Världsrekord på engelska milen.
Enkel Linjär Regression. 1 Introduktion Vi undersöker relationer mellan variabler via en matematisk ekvation. Motivet för att använda denna teknik är:
X 5.2 Tabeller och diagram Frekvenstabell
Utfall Enkät Säsongen 2014/2015
Presentationens avskrift:

Klusterurval, forts.

Variansberäkningar i urvalet: Notera: ”t”et i och ändrar inte värde utan är en fast beteckning medan ”i”et i och ändrar värde från kluster till kluster

Enstegs klusterurval Urval görs endast av kluster (PSU). I varje utvalt kluster ”mäts” alla element (SSU)  mi = Mi Två fall: Alla kluster är lika stora, dvs. M1 = M2 = … = MN = M M0 = N ∙ M dvs. är känd om N är känd. 2. Olika stora kluster. M0 behöver inte vara känd, och är det endast om alla Mi är kända.

Fall 1: Utgå från OSU av kluster eftersom vi här observerar samtliga element i varje kluster i urvalet. där Även här utnyttjas att samtliga element i varje kluster observeras

Också (självklart) väntevärdesriktig Exempel: En myndighet för månadsvis loggbok över alla besökare. Loggboken består av sidor med 30 rader vardera där varje rad används för att skriva in en besökare. Bland annat antecknas tidpunkt när besökaren anländer och tidpunkt när besökaren lämnar myndigheten En viss månad har loggboken precis 55 fulltecknade sidor. Man gör ett OSU av 3 sidor och observerar de tider varje besökare på var och en av de tre sidorna har uppehållit sig vid myndigheten. Således: Ett enstegs klusterurval av 3 kluster där alla 55 kluster i populationen är lika stora.

Summerade uppehållstider ( ti ) i minuter Resultat Sida ( i ) Summerade uppehållstider ( ti ) i minuter 1 1305 2 1407 3 1288

Urvalsvikter: Urvalet är därmed självvägt!

Fall 2: (Fortfarande OSU av kluster) dvs. samma som vid Fall 1 men förutsätter att alla Mi är kända

Urvalsvikterna är också desamma och även här är alltså urvalet självvägt. Betrakta dock Vad kan vara skillnaden mellan Fall1 och 2 för denna varians? Hur kan vi skatta populationsmedeltalet om inte alla Mi är kända?

Kvotskattning Populationsmedeltalet kan skrivas dvs. som en populationskvot. Motsvarande urvalskvot blir men kan också skrivas

Urvalskvoten blir därmed en alternativ skattning av populationsmedeltalet: Teorin för kvotskattningar från OSU kan användas här 

Kvotskattningen är som vanlig inte väntevärdesriktig Om klusterstorlekarna varierar mycket  Kvotskattningen har lägre varians än den väntevärdesriktiga skattningen. Kvotskattning av t kan göras om M0 är känd: Exempel: I ett bostadsområde finns 18 flerfamiljshus med varierande antal lägenheter i varje hus. Man vill undersöka andelen lägenheter (egentligen hushåll), som är anslutna till ett visst kabel-TV-nät. Ett OSU av 5 hus görs därför och i varje hus undersöks samtliga lägenheter. Enstegs klusterurval enligt Fall 2. N = 18, n =5

Antal anslutna lägenheter Resultat Hus (kluster) ( i ) Antal lägenheter ( Mi ) Antal anslutna lägenheter ( ti ) 1 16 12 2 22 19 3 15 4 30 25 5 17

95% konfidensintervall för andelen anslutna lägenheter: Väntevärdesriktig skattning kan inte användas här eftersom vi inte har kunskap om antalet lägenheter i varje hus. Antag dock att vi vet att det finns totalt 380 lägenheter i området.

Tvåstegs klusterurval Som regel görs ett OSU av mi element från kluster i ; i  S Väntevärdesriktiga skattningar: Härledningar av såväl teoretisk som skattad varians är komplicerade!

Urvalsvikter: Urvalet blir självvägt om

Kvotskattningar: Om M0 är känd:

Urvalsdimensionering Variansanalys: SSTO har M0 – 1 frihetsgrader, SSB har N – 1 frihetsgrader och SSW har M0 – N frihetsgrader Justerad förklaringsgrad: utgör ett mått på heterogeniteten mellan olika kluster. Ju högre Ra2 desto mer olika är klustren (ur medelvärdessynkvinkel)

I det enklaste fallet med lika stora kluster gäller då Låt c1 vara kostnaden för att välja ut ett kluster och c2 kostanden för att älja ut och undersöka ett element i ett kluster  Totalkostnad blir För en fix totalkostnad C blir då optimala värden på n och m

Justerad förklaringsgrad kan uppskattas från tidigare undersökningar (eller en pilotstudie)  För en stor population kan vi approximera Om nu klusterstorlekarna är olika stora (vilket är normalfallet) så utgår vi från genomsnittlig totalkostnad Välj