Kapitel 5 Stickprovsteori Sid 125-150
Metoder för stickprovsdragning Obundet Slumpmässigt Urval (OSU) Alla enheter i populationen har samma sannolikhet att bli utvalda Någon slumpgenerator kan användas för att slumpmässigt dra enheter från en urvalsram Exempel: Vi är intresserade av att undersöka vilket parti svenska folket skulle rösta på om det var val i dag. Hur skulle vi kunna dra ett OSU för att undersöka detta?
Stratifierat urval Populationen delas upp i homogena grupper (strata) OSU dras från varje stratum Alla enheter har en känd sannolikhet att bli utvald Bättre precision i skattningar jämfört med OSU om stratifieringsvariabeln är relaterad till den variabel man är intresserad av att mäta Bra om vi är intresserade av att jämföra olika grupper Exempel: Vi är intresserade av att undersöka hur stor andel av invånarna i Linköping som har förtroende för grundskolan. Hur skulle vi kunna dra ett stratifierat urval för att undersöka detta?
Felkällor vid stickprovsdragningar Målpopulation Den population vi vill undersöka Rampopulation De enheter i populationen som ingår i urvalsramen Övertäckning Enheter i rampopulationen som inte tillhör målpopulationen Undertäckning Enheter i målpopulationen som saknas i rampopulationen Replikat Samma enhet ingår flera gånger i rampopulationen Bortfall Slumpmässigt bortfall Systematiskt bortfall
Väntevärdesriktiga skattningar Populationsparametrar Beskrivande mått för populationen Parametrar vi vill dra slutsats om Stickprovsstatistikor (skattningar) Skattningar av populationsparametrar Baserade på stickprov Väntevärdesriktig skattning Om medelvärdet för skattningen (i alla möjliga stickprov) är densamma som populationsparametern är skattningen väntevärdesriktig! Medelfel Standardavvikelsen för skattningen
Samplingfördelning Sannolikhetsfördelning för stickprovsstatistikan för alla möjliga stickprov av en viss storlek Hur ofta kommer vårt (tex) stickprovsmedelvärde att hamna nära populationsmedelvärdet, om vi skulle dra många OSU ur samma population? Exempel: Ett företag har 6 anställda (vilka utgör populationen) med följande arbetserfarenhet (i år): 2 4 6 6 7 8 Vi är intresserade av att skatta den genomsnittliga arbetserfarenheten på företaget. Vi drar ett OSU på två anställda. De stora talens lag Ju större stickprov vi drar, desto mer lika blir stickprovsstatistikorna populationsparametrarna
Centrala gränsvärdesatsen Samplingfördelningen för summor eller medelvärden av n oberoende slumpvariabler med samma fördelning är approximativt normalfördelad om n är tillräckligt stort Samplingfördelningen för summor och medelvärden som beräknats på stora stickprov blir approximativt normalfördelad oavsett vilken fördelning populationen har Tumregel: n ≥ 30 Om n inte är tillräckligt stort måste populationen vara normalfördelad för att samplingfördelningen ska vara normalfördelad
Exempel Vid ett OSU av 40 bilar av en viss modell fann man att den genomsnittliga bensinförbrukningen var 0.51 på landsväg. Försäljaren påstår att den genomsnittliga förbrukningen är 0.45 och att standardavvikelsen är 0.15. Vad är sannolikheten att få en genomsnittsförbrukning på 0.51 eller högre om den sanna genomsnittsförbrukningen är 0.45 och standardavvikelsen är 0.15? På ovanstående bilar gjordes också en säkerhetskontroll där 34 st klarade sig utan anmärkning. Vad är sannolikheten att högst 85% av bilarna i stickprovet klarar sig utan anmärkning om den sanna andelen är 95% vilket försäljaren påstår?