STATISTISK METODIK 1. INLEDNING / VAD ÄR STATISTIK? 2. UNDERSÖKNINGSMETODIK 3. DESKRIPTION 4. SAMBAND
1. VAD ÄR STATISTIK? ”Siffror, tabeller??” METODLÄRA ägnad åt insamling, bearbetning, beskrivning och analys av data. En vetenskap som har kunskapsbildning som mål. Den vetenskapliga diciplinen statistik anger metoder och tekniker för att skaffa sig kunskap. KUNSKAPSBILDNING PÅ EMPIRISK VÄG Att skaffa sig kunskap genom observationer.
Hypotetiskt deduktiv metod. HypotesUtsaga Observation Tankevärld Verklighet Försöker förutsäga vad som kommer att hända om hypotesen stämmer 2 ” Dialog med verkligheten” Deduktion - logiskt giltigt argument (Prediktiv inferens) Induktion (Induktiv inferens)
Statistiska metoder används för att sammanfatta samlade erfarenheter göra förutsägelser dra slutsatser fatta beslut då informationen är osäker. Statistikerns roll är att INSAMLA, BEARBETA och TOLKA data.
Statistik består av Ett antal tekniker Regler för när, var och hur dessa tekniker skall användas (metodologi) Statistikämnets uppkomst och utveckling är nära förknippat med behov inom andra dicipliner.
Grundläggande begrepp Population: Grupp av individer vi vill undersöka. Totalundersökning: Alla enheter i populationen undersöks. Urvalsundersökning: En delmängd av populationen väljs ut och undersöks. Variabel: Egenskap hos enheterna i populationen.
2.UNDERSÖKNINGSMETODIK Hur utförs en statistisk undersökning? 2.1 Problemformulering 2.2 Planering 2.3 Datainsamling 2.4 Analys 2.5 Rapportering
Undersökningar Vid en deskriptiv (beskrivande) undersökning försöker man beskriva ett förhållande eller ett händelseförlopp. Vid en analytisk undersökning försöker man klarlägga orsakssamband och förklara varför verkligheten ser ut som den gör. Experimentella / Icke experimentella
2.1 Problemformulering Vad är syftet? Precisera undersökningsproblemet Definiera undersökningens variabler, dvs vad ska undersökas. Definiera undersökningens population, dvs vilka skall undersökas. Vilken population vill vi dra slutsatser om?
2.2 Planering Total- eller urvalsundersökning? Typ av urval vid urvalsundersökning Hur skall variablerna mätas? Val av mätmetod och mätinstrument. Hur bortfall ska hanteras Hur data ska analyseras Hur resultaten ska presenteras
2.3 Datainsamling Datainsamlingen måste vara anpassad till den teori man har om problemområdet. Operationalisering av en variabel innebär en beskrivning av hur man skall gå till väga för att kunna göra mätningen. Operationalisering innebär att mätregler definieras.
En latent variabel är en egenskap som ej är direkt observerbar. En indikator är en observerbar variabel som används vid mätning av en latent variabel. Flerindikatormodellen är en modell för begrepp som behöver flera indikatorer.
Urvalsram I idealfallet en förteckning över alla enheter som ingår i målpopulationen. Detta är i praktiken svårt att uppnå. Den population som definieras av den faktiska ramen kallas undersökningspopulation. De enheter som ingår i ramen kallas urvalsenheter. Alla enheter ingår endast en gång i ramen.
Urvalsmetoder Varför urvalsundersökning? Hur ska vi göra vårt urval så vi kan generalisera till hela populationen? Sannolikhetsurval: Urvalsenheterna väljs med hjälp av någon slumpmekanism. För varje enhet är sannolikheten för att inkluderas i urvalet känd.
Olika typer av sannolikhetsurval OSU Obundet slumpmässigt urval: Varje enhet i populationen har samma chans att ingå i urvalet. Systematiskt urval: Gör en lista över enheterna. Välj t ex var 10:e med slumpmässig start bland de 10 första.
Stratifierat urval: Dela in populationen i homogena delpopulationer (strata). Välj med OSU ett antal enheter i varje strata. Klusterurval: Dela in populationen i heterogena delpopulationer (kluster). Välj slumpmässigt ett antal kluster.
Statistisk inferens Syftet med statistisk inferens är att utifrån ett urval uttala sig om en population. Teorin för den statistiska inferensen bygger på att urvalen är sannolikhetsurval. Om urvalen ej är sannolikhetsurval kan vi inte göra generaliseringar utanför den grupp av individer vi har undersökt.
Mätning De egenskaper (variabler) hos enheterna som vi är intresserade av skall tilldelas mätvärden (variabelvärden) med hjälp av något mätinstrument. Mätfel är skillnaden mellan erhållet värde och sant värde. Reliabilitet och Validitet.
Mätnivåer Nominal- klassificering Ordinal- klassificering, rangordning Intervall- klassificering, rangordning, ekvidistans Kvot- klassificering, rangordning, ekvidistans, absolut nollpunkt
Mätnivån bestäms av vilken typ av information mätningen ger oss. Mätnivån har betydelse för vilken typ av beräkningar som är meningsfulla. T ex kan vi inte använda medelvärde vid nominaldata. Vad är medelfärg eller genomsnittskön?
Mätmetoder Bokföring Direkt observation Postenkät Gruppenkät Besöksenkät Telefonintervju Besöksintervju
Konstruktion av frågeformulär och intervjuer. Utformningen bestämmer i hög grad vilken kvalitet på data som erhålles. Frågeformulärets disposition, frågeformuleringar och introduktionsbrev är viktiga aspekter. Mer om detta under moment 3.
2.4 och 2.5 Analys och Rapportering Återstoden av kursen kommer i hög grad att handla om analys av vårt datamaterial. Vi kommer också att diskutera hur man bäst presenterar sina resultat. (Tabeller, diagram). I den vetenskapliga rapporten bör det dessutom finnas uppgifter om datakvalitet, felkällor och bortfall.
Kvalitetsredovisning Syfte och användning: För vilket syfte och för vilken användning har data producerats? Definitioner: Hur begrepp och variabler är definierade. Jämförbarhet med annan statistik: T ex inom samma ämnesområde. Jämförbarhet i tiden Aktualitet
Kvalitet och felkällor Täckningsfel Bortfallsfel Mätfel Bearbetningsfel Urvalsfel: Uppstår när man studerar ett urval istället för en hel population. Möjligt att uppskatta om urvalet görs korrekt.
Bortfall Bortfallsorsaker Konsekvenser: Vid bortfall måste man räkna med systematiska fel. Åtgärder på förhand: God utbildning, noggrann planering, påminnelsebrev. Studium av bortfallseffekter.