Kvantitativ metod (Intro) Vad är statistik? När kan man använda statistiska metoder? De olika stegen i en statistisk undersökning –Problemformulering (syfte / frågeställningar) –Planering –Datainsamling –Analys (mer om detta i förel. ”Deskription och enkät” och ”Samband och inferens) –Rapportering (mer om detta i förel. ”Bearbetning och presentation av data”) Olika sätt att göra ett slumpmässigt urval Feltyper Definition av olika statistiska begrepp
2 Vad är statistik? Wikipedia: Statistik är en gren inom tillämpad matematik som sysslar med insamling, utvärdering, analys och presentation av data eller information. Resultatet, som också kallas statistik, presenteras ofta i numerisk form, tabeller eller diagram, och används dels för att visa hur något är befattat för tillfället, dels ibland som ett verktyg för att via induktion förutsäga framtida händelser. Statistik används inom många vetenskapliga discipliner, från naturvetenskap till humaniora.
Statistiska metoder används för att: sammanfatta samlade erfarenheter göra förutsägelser dra slutsatser fatta beslut då informationen är osäker. Statistikerns roll är att INSAMLA, BEARBETA och TOLKA data.
Statistik består av: Ett antal tekniker Regler för när, var och hur dessa tekniker skall användas (metodologi) Statistikämnets uppkomst och utveckling är nära förknippat med behov inom andra discipliner.
Varför ska ni kunna statistik? Evidensbaserad praktik Tolka de resultat som presenteras i undersökningar Ha ett kritiskt förhållningssätt till det som publiceras Utvärdering
En statistisk undersöknings olika steg: Problemformulering (syfte/frågeställningar) Planering Datainsamling Analys Rapportering
Problemformulering
Problemformulering… Arbetet måste utgå från ett genuint kunskapsintresse Formulera ett problem/problemområde Arbetet styrs sedan av ett syfte Ur syftet härleds en eller ett par frågeställningar
I samband med problemformuleringen kan det vara lämpligt att ge en precis definition av undersökningens målpopulation. Detta innebär en avgränsning av den mängd enheter som undersökningen skall avse. –Avgränsningen måste vara så precis att vi alltid vet om en individ (undersökningsenhet tillhör populationen eller inte).
Syfte… leda till ny kunskap i någon bemärkelse, inte uppfinna hjulet på nytt intresseväckande problematiserande förhållningssätt, inte befästande tillräckligt smalt för att kunna leda tillräckligt långt genomförbart, avgränsat
Exempel Problemområde: Frukostvanor Syfte: Att jämföra frukostvanor hos kvinnor och män på läkarutbildningen på Umeå universitet. Frågeställningar: Kartlägga läkarstudenternas frukostvanor? Finns det någon skillnad mellan kvinnor och män?
Planering av en undersökning
Vid planering bestämmer man sig bl.a. för: Vilka data som skall samlas in Hur dessa data skall samlas in, dvs. val av datainsamlingsmetod - Totalundersökning eller urvalsundersökning -Typ av urval vid urvalsundersökning -Val av mätmetod och mätinstrument -Osv. Hur eventuellt bortfall skall hanteras Hur data skall analyseras Hur resultatet skall redovisas
Att tänka på….. Vad kan bli svårt pga. etiska skäl? Vad säger personuppgiftslagen? Behövs tillstånd av myndigheter, vårdnadshavare, personal mm. Hur skall data förvaras, vilka skall få ta del av dem?
Variabel: egenskap som ”mäts” hos individerna Ex: kön, civilstånd, ålder, inkomst …
Kan man mäta allt? Hur kan man mäta stress, intelligens, smärta, osv? Tilldela begreppen en mätprocess och ett mått. Detta kallas för operationalisering. Ex. Intelligens – IQ-test – IQ
Mätnivåer (skalnivåer) Nominal –Endast klassificering Ordinal –Klassificering och rangordning Kvot –Klassificering, rangordning, ekvidistans och absolut nollpunkt
Observera att mätnivån bestäms av vilken typ av information mätningen ger oss. Mätnivån har bl.a. betydelse för vilken typ av beräkningar/analys som är meningsfull (medelvärde eller median, stapeldiagram eller histogram, korrelation eller Chi2-test ?) (Mer om detta i föreläsningarna som handlar om Analys, dvs Deskription och enkät, samt Samband och inferens.)
När, vem och vad som undersöks påverkar kvaliteten på en undersökning. Det finns olika sätt att bedöma kvaliteten. Två begrepp som vi kommer att använda i samband med detta är: Reliabilitet –Stabilitet, är måttet stabilt över tid? –Intern reliabilitet, mäter måtten samma sak? Validitet – Mäter mätinstrumentet vad det avser att mäta –Hög validitet förutsätter hög reliabilitet
Datainsamling
population Population Stickprov, urval INFERENS = Dra slutsatser från data om hela populationen utifrån ett stickprov Data, observationer
Undersökningar Observationsstudie Vid en deskriptiv(beskrivande) undersökning försöker man beskriva ett förhållande eller ett händelseförlopp. Experimentella studier Vid en analytisk undersökning försöker man klarlägga orsakssamband och förklara varför verkligheten ser ut som den gör.
Grundläggande begrepp Population*: Grupp av individer vi vill undersöka. Urvalsram: Förteckning över populationen som man gör sitt urval ifrån. Totalundersökning: Alla enheter i populationen undersöks. Urvalsundersökning: En delmängd av populationen väljs ut och undersöks. * Ibland används ordet målpopulation istället för population
Urvalsundersökningar Urvalsundersökning Stor population Snabbare & billigare Bättre mätmetod, fler & mer detaljerade frågor Förstörande prov Totalundersökning Liten population Intresse för små delgrupper av populationen
Slumpmässiga urval (sannolikhetsurval) Definition: –Varje element i populationen skall ha en känd inklusionssannolikhet och denna skall vara större än 0. Varför slumpmässigt urval? –Vill vi utifrån ett urval dra slutsatser om en hel population, och dessutom få ett mått på hur säkra våra slutsatser är, måste urvalet vara slumpmässigt.
Ex. icke-slumpmässiga urval Alla enheter i populationen har inte samma chans att komma med i urvalet. Detta leder till att det blir svårt att generalisera resultaten till hela populationen Bekvämlighetsurval- enkelt & snabbt Snöbollsurval- grupper som är svåra att nå Självvalda urval - ex. medicinska under-sökningar & internet
Det finns olika sätt att göra slumpmässiga urval på, t.ex: Obundet slumpmässigt urval (OSU) Systematiskt urval Klusterurval Stratifierat urval
Obundet slumpmässigt urval, OSU Vid varje dragning av en enhet har de i populationen kvarvarande enheterna samma sannolikhet att bli valda Vid OSU av n enheter har alla möjliga kombinationer av n enheter samma chans att bli valda
Systematiskt urval Gör en lista över enheterna. Välj t ex var 10:e med slumpmässig start bland de 10 första. Om urvalsramen är ”slumpmässigt” ordnad är detta ”likvärdigt” med OSU. Risk för stora fel om det finns periodicitet i urvalsramen Skäl: Enklare än ett OSU, Ramproblem, Kostnader…
Klusterurval (gruppurval) Dela in populationen i heterogena delpopulationer (kluster). Ett antal sådana kluster väljs slumpmässigt. Samtliga enheter inom ett kluster undersöks. Skäl: Enklare än ett OSU, Ramproblem, Geografisk spridning, Kostnader
Stratifierat urval Dela in populationen i homogena delpopulationer (strata). Välj med OSU ett antal enheter i varje strata. Skäl: –Säkerställa att de olika jämförelse-grupperna finns representerade i urvalet.
Feltyper
Kvalitet och felkällor Urvalsfel Täckningsfel Bortfallsfel Mätfel Bearbetningsfel
Urvalsfel uppstår när man studerar ett urval istället för en hel population. Möjligt att uppskatta om urvalet görs korrekt.
Täckningsfel uppstår då rampopulationen inte sammanfaller med målpopulationen - Undertäckning - Övertäckning
Bortfallsfel uppstår exempelvis då inte alla utdelade enkäter blivit besvarade - Individbortfall (hela enkäten obesvarad) - Partiellt bortfall (delar av enkäten obesvarad)
Mätfel –Mätfel som beror på respondenten –Mätfel som beror på intervjuaren –Mätfel som beror på mätmetoden –Mätfel som beror på frågeformuläret
Bearbetningsfel –Kodningsfel –Inmatningsfel –Datorbearbetningsfel
Det totala felet: Totala felet = urvalsfel + täckningsfel + bortfallsfel + mätfel + bearbetningsfel