Kent W. Nilsson Falun 2019 02 19
Att tänka statistiskt Förr, kunskap baserades på auktoriteter; Kungen, krykan m.m. Industriell- och teknisk revolution De som inte har möjlighet och kunskap att ta till sig och värdera nya ”fynd” kommer att hamna i ett utanförskap i samhällsutvecklingen Mer eller mindre ”sanna” budskap sprider sig fort idag mellan människor och kulturer
Att tänka statistiskt Det verkar som om kön bestämmer hur mycket man tittar på TV. Kvinnor i USA ser upp till 50% mer TV än män…… Det verkar som om musiksmak (Rockmusik) är starkt signifikant relaterat till tonårsgraviditeter… Mjukglass är farligt. Det finns ett starkt signifikant samband mellan hög mjukglass-försäljning och högt antal våldtäkter…..
Mål -. Undersökningsplanering och slutledning - Mål - Undersökningsplanering och slutledning - Statistiska begrepp och metoder
En statistisk undersökning börjar som regel med att man har någon tanke eller idé, kanske en hypotes, som man vill pröva.
Planering Datainsamling Studiedesign Databearbetning Presentation
Planering - Litteraturgenomgång - Databaser - Syfte * preciserat syfte * ev hypoteser man vill pröva
Studiedesign - Tidigt stadium - Kvantitativ eller kvalitativ - Forskningsetiska frågor man kan komma att ställas inför
Databearbetning -. Deskriptiv statistik -. Statistisk inferens - Databearbetning - Deskriptiv statistik - Statistisk inferens - Statistisk analys - Tolka sina resultat
Undersökningstyper Experimentet - Kliniska försöket Observationsstudie Tvärsnittsstudie (exempel följer) Retrospektiv studie (exempel följer) Prospektiv studie (exempel följer) Kohortstudie
Exempel på tvärsnittsstudie Tidpunkt A Population A Analys Resultat
Exempel på upprepad tvärsnittsstudie Population A Population B Population C Resultat 1 2 3 Tidpunkt Tidpunkt Tidpunkt
Exempel på Retrospektiv studie Exposition Fall Kontroller (lungcancer) (ej lungcancer) Rökare 170 60 Icke-rökare 30 190 Totalt 200 250
Exempel på Prospektiv studie Lungcancer Ej lungcancer Totalt Rökare 20 480 500 Icke-rökare 2 798 800
Exempel på kohortstudie Population A Population A Population A Resultat 1 2 3 Tidpunkt Tidpunkt Tidpunkt
Kontrollgrupp Matchade kontroller Läkemedelprövning - Placebo Dubbelblindförsök Trippelblind studie
Exempel på kontrollgrupp, fall-kontrollstudie Högt kolesterol (Fall) Fettintag Resultat Fettintag Normalt kolesterol (kontroller)
Exempel på ej randomiserad studie Vårdc A Ryggont Psykosocial behandling Resultat Vårdc B Ryggont Traditionell behandling Resultat
Exempel på randomiserad studie Population Randomisering Experiment grupp Kontroll grupp Mätning före Mätning före Intervention Intervention / Placebo Mätning efter Mätning efter
Bortfall successiv jämförelse Svarat direkt Svarat efter påminnelse Bortfall 1 2 3 N= 500 150 100 50 200 50% 15% 10% 5% 20% >25% Andel rökare 10% 15% 20% 25%
Grundbegrepp
Grundbegrepp Individ Population Variabel - Kvantitativ eller numerisk - Kvalitativ eller kategori - Dikotom - Diskret - Kontinuerlig
Mätskalor Nominal-skala Ordinal-skala Intervall-skala Kvot-skala Skaltyp Nominal-skala Ordinal-skala Intervall-skala Kvot-skala Nominalskala (klassificering enbart) Ordinalskala (ordning) Intervallskala (ordning + differens) Kvotskala (ordning + differens + kvot) Kvalitativ variabel Kvantitativ variabel
Deskriptiv statistik
Mätskalor
Svarsalternativ Hur mår Du just nu? Mycket bra Bra Ganska bra Varken bra eller dåligt Ganska dåligt Mycket dåligt Bra Dåligt Mycket bra Mycket dåligt Mycket bra Mycket dåligt
Exempel på skalor Oftast ordinal-skala vid attityder eller åsikter Index VAS-skalan Likert skalan Antal svarsalternativ
Hur mäter man det man avser att mäta? Validitet = Att man mäter vad man avser att mäta Reliabilitet = Hur precist man mäter det man avser att mäta från gång till gång
Diagram Stolpdiagram Histogram Frekvenspolygon Summapolygon Cirkeldiagram Stapeldiagram - Grupperade staplar Linjediagram
Stolpdiagram
Histogram
Stolpdiagram
Genomsnitts- värden & spridningsmått
Genomsnittsvärden Aritmetiska medelvärdet (eller medelvärdet) Exempel
Medianen Exempel
Typvärdet Exempel Datanivå Nominalskala Ordinalskala Intervallskala Kvotskala Medelvärde x x Median x x x Typvärde x x x x
Symmetrisk fördelning - Aritmetiskt medelvärde och median är lika Positivt sned fördelning - Medelvärdet är högre än medianen Negativt sned fördelning - Medelvärdet alltid lägre än medianen
Symmetrisk fördelning
Positivt sned fördelning
Negativt sned fördelning
Spridningsmått Standardavvikelsen Exempel
Kvintil - 5 lika stora delar Percentil - 100 lika stora delar Kvartilavståndet q3– q1 - “skalat bort” de 25% högsta och de 25% lägsta värdena
Variationsvidden q1 = 22,4 kg/m2 q2 = 24,0 kg/m2 q3 = 25,6 kg/m2 Exempel q1 = 22,4 kg/m2 q2 = 24,0 kg/m2 q3 = 25,6 kg/m2
Korrelation och regression
Regression - Prediktera - förutsäga Korrelation - Hur starkt sambandet är Exempel Pojke nr 1 2 3 4 5 6 7 8 9 10 Dagar 41 33 20 28 46 17 3 9 39 45 Poäng 88 72 38 32 60 59 10 21 65 98
Spridningsdiagram (scatter plot) - Spridningsdiagram (scatter plot) - Positivt samband eller positiv korrelation Exempel
Spridningsdiagram (scatter plot) - Spridningsdiagram (scatter plot) - Negativt samband eller negativ korrelation Exempel
Spridningsdiagram (scatter plot) - Linjär regression * regressionslinje Exempel
Linjens skärningspunkt med y-axeln kallas interceptet Linjens lutning kallas regressionskoefficient
Prediktion Två krav måste uppfyllas Prediktionen kan bara gälla inom det variationsområde som studerats Prediktionen är meningsfull enbart om det finns ett högt linjärt samband mellan de studerade variablerna
Korrelationskoefficienten, som betecknas r, kan som högst anta värdet +1 och som lägst värdet –1 - Då r är nära +1 innebär det ett starkt positivt samband - Då r är nära –1 innebär det ett starkt negativt samband - Då r är nära 0 innebär det ett svagt linjärt samband
Spridningsdiagram med tillhörande korrelationskoefficienter
Orsakssamband — skensamband
Rangkorrelation -1 rs 1 Spearmans rangkorrelations- koefficient -rs Spearmans (rho) -1 rs 1
Statistisk analys
Vad är en hypotesprövning?
Icke parade statistiska test - Att jämföra grupper
Parvisa statistiska test - Att jämföra inom gruppen
Nollhypotesen, H0 Mothypotesen, H1
Signifikansnivå () - Av tradition används tre nivåer 5%, 1% resp 0,1% Testfunktion p-värde (p value) (probability=sannolikhet) Exempel Om signifikansnivån är 5% har resultatet angetts som p <0,05 eller * (enstjärnig signifikans) Om den är 1% har resultatet angetts som p >0,01 eller ** (tvåstjärnig signifikans) Om den är 0,1% har resultatet angetts som p <0,001 eller *** (trestjärnig signifikans)
Typ I- och typ II-fel vid hypotesprövning + H0 falsk H0 sann Verkligheten H0 förkastas accepteras
Datorns roll i statistiken - massignifikans Hypotesprövande (förklarande) Hypotesgenererande (beskrivande)
Hypotesprövning vid kvantitativa variabler – intro….
Normalfördelning Gaussfördelningen (Gaussian distribution) Fördelning av en variabel, enskilda värden Fördelning av en variabel, klassbredd 5
Exempel på normalfördelningar
Signifikant skilda fördelningar SD1 SD2
Ej signifikant skilda fördelningar SD1 SD2
Ytor under normalfördelningskurva
Standardiserad normalfördelning Varje normalfördelad variabel kan transformeras till en standardiserad normalfördelad variabel, z
Medelvärdenas fördelning Fördelningar för variabel resp stickprovsmedelvärde vid normalfördelning
Hypotesprövning med hjälp av normalfördelning – t-test Kritiska värdet - Kritiska området är ytan under testfunktionens kurva, som innehåller de värden för vilka nollhypotesen förkastas * frihetsgrader (degrees of freedom, df)
Tvåsidigt test, signifikansnivå 5%, t-fördelning på 2,5% (p =0,025)
t-fördelningen ser ut ungefär som normalfördelningen, men är något flackare. Dessutom beror den av antalet observationer i stickprovet (n). Ju högre n är desto närmare normal-fördelningen ligger t-fördelningen. normalfördelning t-fördelning
Konfidensintervall Konfidensintervall (confidence interval) - Sannolikheten kan vara olika 90%, 95%, 99% eller något annat * den mest använda är 95% vi talar då om ett 95% konfidensintervall
Ej normalfördelad variabel - stora stickprov Ej normalfördelad variabel - små stickprov - Wilcoxons rangsummetest - Mann-Whitneys U-test
Sammanfattning - jämförelse av medelvärden
1. Stickprovets storlek 2. Den faktiska skillnaden mellan medelvärdena 3. Standardavvikelsernas storlek 4. Korrekt studiedesign 5. Rätt testmetod
Meta analys
Meta-analys Studie 1 Studie 2 Studie 3 Studie 4 Kombinerade resultat
Bevispyramiden Idéer, ledarartiklar Djurforskning Fall-kontrollstudier Fall-serier Fall-rapport Kohort-studier Idéer, ledarartiklar Djurforskning Laboratorie-experiment Randomiserade dubbelblind-studier Meta-analyser, systematiska översikter
Meta-analys – MAO-A + dålig uppväxtmiljö = Kriminalitet??? Meta-analysis pooling results across studies. Summary correlations between measures of childhood maltreatment and mental health are presented separately in the low- vs high-activity MAOA genotype groups. CI indicates confidence interval. Squares and % weight indicate the size of each study's contribution to the summary correlations indicated by diamonds. (a) Forest plot of correlations between childhood maltreatment and mental health, as a function of MAOA genotype group in five independent studies. (b) Forest plot of the interaction effect based on differences in correlations between childhood maltreatment and mental health observed in low- vs high-activity MAOA genotype groups in five independent studies. Kim-Cohen et al., 2006
Meta-analys - Streptokinase-behandling vid MI
Meta-analys - Streptokinase-behandling vid MI
Fallgropar med meta-analys 1. Det är sällan att resultat från olika studier stämmer överens därför krävs det större antal patienter att få konklusiva resultat. 2. Om författare är intresserade att få fram vissa specifika resultat, kan de välja studier som förstärker deras påstående (bias). 3. Studier med positiva resultat publiceras oftare är de med negativa, ett större antal studier med svagt positiva resultat kan ge intryck att en viss behandling är överlägsen en annan.
Tack för er uppmärksamhet!