Kent W. Nilsson Falun 2019 02 19.

Slides:



Advertisements
Liknande presentationer
Tillämpad statistik Naprapathögskolan
Advertisements

Grundläggande Biostatistik
Genomgång - biostatistik Fråga 1 I en liten undersökning efterfrågades uppgifter om ålder hos 20 personer med högt blodtryck se tabell a)Beräkna.
Föreläsning 8 732G81. Kapitel 8 Inferens om en ändlig population Sid
Regiongemensam elevenkät 2016 Skolrapport Fjordskolan ÅK2.
Experimentdesign och statistik Håkan Rydin Evolutionsbiologiskt centrum växtekologi Medan ni väntar – fundera över: Varför använder biologer statistik?
Deskription. Individer och variabler Individer, undersökningsobjekt – De vi undersöker. De vi gör mätningar på. Kan vara människor, men kan också vara.
Introduktion. Exempel: Till ett försök med bantningsmedlet Bantomid anmälde sig 14 personer frivilligt, alla med övervikt. De delades slumpmässigt in.
En sak i taget 1. Mata in data 2. Förbered data för beräkningar 3. Beräkna 1. Börja med att testa din hypotes 2. Därefter titta på ev bakomliggande faktorer.
Deskription + enkät Mätnivån styr hur man kan analysera data Tabeller – frekvenstabeller Diagram – cirkeldiagram, stapeldiagram, histogram, boxplot Beskrivande.
Hypotesprövning. Statistisk hypotesprövning och hypotetisk-deduktiv metod Hypotetisk-deduktiv metod: –Hypotes: Alla svanar är vita. –Empirisk konsekvens:
Så kan det låta! … Mätinstrumentets reliabilitet och validitet ökades avsevärt genom en pilotstudie och för att nå bästa generaliserbarhet valdes ett representativt.
Regiongemensam elevenkät 2016 Skolrapport Öjersjö Brunns skola ÅK5.
Bearbetning och presentation Repetition… Kodning av svaren Rapportskrivning Olika feltyper.
Repetition av Chi2-test Kap 6, Kodning av svaren Kap 10, Olika feltyper Kap 12, Rapportskrivning.
1 Utvärdering och tolkning: MBA Program Admission Policy Rektorn vid ett stort universitet vill höja standarden på de som antas till deras populära MBA-program.
Regiongemensam enkät i förskola och familjedaghem 2016
Regiongemensam enkät i förskola och familjedaghem 2016
Kap 4 - Statistik.
Regiongemensam enkät i förskola och familjedaghem 2016
Regiongemensam enkät i förskola och familjedaghem 2016
Regiongemensam enkät i förskola och familjedaghem 2016
Regiongemensam enkät i förskola och familjedaghem 2016
Regiongemensam enkät i förskola och familjedaghem 2016
Regiongemensam enkät i förskola och familjedaghem 2016
Regiongemensam enkät i förskola och familjedaghem 2016
Regiongemensam enkät i förskola och familjedaghem 2016
Regiongemensam enkät i förskola och familjedaghem 2016
Regiongemensam enkät i förskola och familjedaghem 2016
Regiongemensam enkät i förskola och familjedaghem 2016
Regiongemensam enkät i förskola och familjedaghem 2016
Regiongemensam enkät i förskola och familjedaghem 2016
Regiongemensam enkät i förskola och familjedaghem 2016
Regiongemensam enkät i förskola och familjedaghem 2016
Regiongemensam enkät i förskola och familjedaghem 2016
Regiongemensam enkät i förskola och familjedaghem 2016
Regiongemensam enkät i förskola och familjedaghem 2016
Regiongemensam enkät i förskola och familjedaghem 2016
Regiongemensam enkät i förskola och familjedaghem 2016
Regiongemensam enkät i förskola och familjedaghem 2016
Regiongemensam enkät i förskola och familjedaghem 2016
Regiongemensam enkät i förskola och familjedaghem 2016
Regiongemensam enkät i förskola och familjedaghem 2016
Kvalitetsmätningen hösten 2017
Regiongemensam enkät i förskola och familjedaghem 2016
Regiongemensam elevenkät 2016
Regiongemensam enkät i förskola och familjedaghem 2016
Regiongemensam enkät i förskola och familjedaghem 2016
Regiongemensam enkät i förskola och familjedaghem 2016
Regiongemensam elevenkät 2016
Regiongemensam enkät i förskola och familjedaghem 2016
Regiongemensam enkät i förskola och familjedaghem 2016
Regiongemensam enkät i förskola och familjedaghem 2016
Regiongemensam enkät i förskola och familjedaghem 2016
Relation mellan variabler – samvariation, korrelation, regression
Vad ingår kursen? i korta drag
Ung Cancer - Medlemsundersökning 2017, Närstående
SFI/SFX 2018 i Stockholms län
Regiongemensam elevenkät 2016
Regiongemensam enkät i förskola och familjedaghem 2016
Regiongemensam elevenkät 2018
Regiongemensam elevenkät 2016
Regiongemensam elevenkät 2016
Regiongemensam enkät i förskola och familjedaghem 2016
Grundläggande begrepp
IQs Alkoholindex 2018.
Regiongemensam enkät i förskola och familjedaghem 2016
Regiongemensam enkät i förskola och familjedaghem 2016
Regiongemensam enkät i förskola och familjedaghem 2016
Regiongemensam enkät i förskola och familjedaghem 2016
Presentationens avskrift:

Kent W. Nilsson Falun 2019 02 19

Att tänka statistiskt Förr, kunskap baserades på auktoriteter; Kungen, krykan m.m. Industriell- och teknisk revolution De som inte har möjlighet och kunskap att ta till sig och värdera nya ”fynd” kommer att hamna i ett utanförskap i samhällsutvecklingen Mer eller mindre ”sanna” budskap sprider sig fort idag mellan människor och kulturer

Att tänka statistiskt Det verkar som om kön bestämmer hur mycket man tittar på TV. Kvinnor i USA ser upp till 50% mer TV än män…… Det verkar som om musiksmak (Rockmusik) är starkt signifikant relaterat till tonårsgraviditeter… Mjukglass är farligt. Det finns ett starkt signifikant samband mellan hög mjukglass-försäljning och högt antal våldtäkter…..

Mål -. Undersökningsplanering och slutledning - Mål - Undersökningsplanering och slutledning - Statistiska begrepp och metoder

En statistisk undersökning börjar som regel med att man har någon tanke eller idé, kanske en hypotes, som man vill pröva.

Planering Datainsamling Studiedesign Databearbetning Presentation

Planering - Litteraturgenomgång - Databaser - Syfte * preciserat syfte * ev hypoteser man vill pröva

Studiedesign - Tidigt stadium - Kvantitativ eller kvalitativ - Forskningsetiska frågor man kan komma att ställas inför

Databearbetning -. Deskriptiv statistik -. Statistisk inferens - Databearbetning - Deskriptiv statistik - Statistisk inferens - Statistisk analys - Tolka sina resultat

Undersökningstyper Experimentet - Kliniska försöket Observationsstudie Tvärsnittsstudie (exempel följer) Retrospektiv studie (exempel följer) Prospektiv studie (exempel följer) Kohortstudie

Exempel på tvärsnittsstudie Tidpunkt A Population A Analys Resultat

Exempel på upprepad tvärsnittsstudie Population A Population B Population C Resultat 1 2 3 Tidpunkt Tidpunkt Tidpunkt

Exempel på Retrospektiv studie Exposition Fall Kontroller (lungcancer) (ej lungcancer) Rökare 170 60 Icke-rökare 30 190 Totalt 200 250

Exempel på Prospektiv studie Lungcancer Ej lungcancer Totalt Rökare 20 480 500 Icke-rökare 2 798 800

Exempel på kohortstudie Population A Population A Population A Resultat 1 2 3 Tidpunkt Tidpunkt Tidpunkt

Kontrollgrupp Matchade kontroller Läkemedelprövning - Placebo Dubbelblindförsök Trippelblind studie

Exempel på kontrollgrupp, fall-kontrollstudie Högt kolesterol (Fall) Fettintag Resultat Fettintag Normalt kolesterol (kontroller)

Exempel på ej randomiserad studie Vårdc A Ryggont Psykosocial behandling Resultat Vårdc B Ryggont Traditionell behandling Resultat

Exempel på randomiserad studie Population Randomisering Experiment grupp Kontroll grupp Mätning före Mätning före Intervention Intervention / Placebo Mätning efter Mätning efter

Bortfall successiv jämförelse Svarat direkt Svarat efter påminnelse Bortfall 1 2 3 N= 500 150 100 50 200 50% 15% 10% 5% 20% >25% Andel rökare 10% 15% 20% 25%

Grundbegrepp

Grundbegrepp Individ Population Variabel - Kvantitativ eller numerisk - Kvalitativ eller kategori - Dikotom - Diskret - Kontinuerlig

Mätskalor Nominal-skala Ordinal-skala Intervall-skala Kvot-skala Skaltyp Nominal-skala Ordinal-skala Intervall-skala Kvot-skala Nominalskala (klassificering enbart) Ordinalskala (ordning) Intervallskala (ordning + differens) Kvotskala (ordning + differens + kvot) Kvalitativ variabel Kvantitativ variabel

Deskriptiv statistik

Mätskalor

Svarsalternativ Hur mår Du just nu?  Mycket bra Bra   Ganska bra  Varken bra eller dåligt  Ganska dåligt  Mycket dåligt Bra  Dåligt         Mycket bra Mycket dåligt Mycket bra Mycket dåligt

Exempel på skalor Oftast ordinal-skala vid attityder eller åsikter Index VAS-skalan Likert skalan Antal svarsalternativ

Hur mäter man det man avser att mäta? Validitet = Att man mäter vad man avser att mäta Reliabilitet = Hur precist man mäter det man avser att mäta från gång till gång

Diagram Stolpdiagram Histogram Frekvenspolygon Summapolygon Cirkeldiagram Stapeldiagram - Grupperade staplar Linjediagram

Stolpdiagram

Histogram

Stolpdiagram

Genomsnitts- värden & spridningsmått

Genomsnittsvärden Aritmetiska medelvärdet (eller medelvärdet) Exempel

Medianen Exempel

Typvärdet Exempel Datanivå Nominalskala Ordinalskala Intervallskala Kvotskala Medelvärde x x Median x x x Typvärde x x x x

Symmetrisk fördelning - Aritmetiskt medelvärde och median är lika Positivt sned fördelning - Medelvärdet är högre än medianen Negativt sned fördelning - Medelvärdet alltid lägre än medianen

Symmetrisk fördelning

Positivt sned fördelning

Negativt sned fördelning

Spridningsmått Standardavvikelsen Exempel

Kvintil - 5 lika stora delar Percentil - 100 lika stora delar Kvartilavståndet q3– q1 - “skalat bort” de 25% högsta och de 25% lägsta värdena

Variationsvidden q1 = 22,4 kg/m2 q2 = 24,0 kg/m2 q3 = 25,6 kg/m2 Exempel q1 = 22,4 kg/m2 q2 = 24,0 kg/m2 q3 = 25,6 kg/m2

Korrelation och regression

Regression - Prediktera - förutsäga Korrelation - Hur starkt sambandet är Exempel Pojke nr 1 2 3 4 5 6 7 8 9 10 Dagar 41 33 20 28 46 17 3 9 39 45 Poäng 88 72 38 32 60 59 10 21 65 98

Spridningsdiagram (scatter plot) - Spridningsdiagram (scatter plot) - Positivt samband eller positiv korrelation Exempel

Spridningsdiagram (scatter plot) - Spridningsdiagram (scatter plot) - Negativt samband eller negativ korrelation Exempel

Spridningsdiagram (scatter plot) - Linjär regression * regressionslinje Exempel

Linjens skärningspunkt med y-axeln kallas interceptet Linjens lutning kallas regressionskoefficient

Prediktion Två krav måste uppfyllas Prediktionen kan bara gälla inom det variationsområde som studerats Prediktionen är meningsfull enbart om det finns ett högt linjärt samband mellan de studerade variablerna

Korrelationskoefficienten, som betecknas r, kan som högst anta värdet +1 och som lägst värdet –1 - Då r är nära +1 innebär det ett starkt positivt samband - Då r är nära –1 innebär det ett starkt negativt samband - Då r är nära 0 innebär det ett svagt linjärt samband

Spridningsdiagram med tillhörande korrelationskoefficienter

Orsakssamband — skensamband

Rangkorrelation -1 rs 1 Spearmans rangkorrelations- koefficient -rs Spearmans  (rho) -1 rs 1

Statistisk analys

Vad är en hypotesprövning?

Icke parade statistiska test - Att jämföra grupper

Parvisa statistiska test - Att jämföra inom gruppen

Nollhypotesen, H0 Mothypotesen, H1

Signifikansnivå () - Av tradition används tre nivåer 5%, 1% resp 0,1% Testfunktion p-värde (p value) (probability=sannolikhet) Exempel Om signifikansnivån är 5% har resultatet angetts som p <0,05 eller * (enstjärnig signifikans) Om den är 1% har resultatet angetts som p >0,01 eller ** (tvåstjärnig signifikans) Om den är 0,1% har resultatet angetts som p <0,001 eller *** (trestjärnig signifikans)

Typ I- och typ II-fel vid hypotesprövning +  H0 falsk  H0 sann Verkligheten H0 förkastas accepteras

Datorns roll i statistiken - massignifikans Hypotesprövande (förklarande) Hypotesgenererande (beskrivande)

Hypotesprövning vid kvantitativa variabler – intro….

Normalfördelning Gaussfördelningen (Gaussian distribution) Fördelning av en variabel, enskilda värden Fördelning av en variabel, klassbredd 5

Exempel på normalfördelningar

Signifikant skilda fördelningar SD1 SD2

Ej signifikant skilda fördelningar SD1 SD2

Ytor under normalfördelningskurva

Standardiserad normalfördelning Varje normalfördelad variabel kan transformeras till en standardiserad normalfördelad variabel, z

Medelvärdenas fördelning Fördelningar för variabel resp stickprovsmedelvärde vid normalfördelning

Hypotesprövning med hjälp av normalfördelning – t-test Kritiska värdet - Kritiska området är ytan under testfunktionens kurva, som innehåller de värden för vilka nollhypotesen förkastas * frihetsgrader (degrees of freedom, df)

Tvåsidigt test, signifikansnivå 5%, t-fördelning på 2,5% (p =0,025)

t-fördelningen ser ut ungefär som normalfördelningen, men är något flackare. Dessutom beror den av antalet observationer i stickprovet (n). Ju högre n är desto närmare normal-fördelningen ligger t-fördelningen. normalfördelning t-fördelning

Konfidensintervall Konfidensintervall (confidence interval) - Sannolikheten kan vara olika 90%, 95%, 99% eller något annat * den mest använda är 95% vi talar då om ett 95% konfidensintervall

Ej normalfördelad variabel - stora stickprov Ej normalfördelad variabel - små stickprov - Wilcoxons rangsummetest - Mann-Whitneys U-test

Sammanfattning - jämförelse av medelvärden

1. Stickprovets storlek 2. Den faktiska skillnaden mellan medelvärdena 3. Standardavvikelsernas storlek 4. Korrekt studiedesign 5. Rätt testmetod

Meta analys

Meta-analys Studie 1 Studie 2 Studie 3 Studie 4 Kombinerade resultat

Bevispyramiden Idéer, ledarartiklar Djurforskning Fall-kontrollstudier Fall-serier Fall-rapport Kohort-studier Idéer, ledarartiklar Djurforskning Laboratorie-experiment Randomiserade dubbelblind-studier Meta-analyser, systematiska översikter

Meta-analys – MAO-A + dålig uppväxtmiljö = Kriminalitet??? Meta-analysis pooling results across studies. Summary correlations between measures of childhood maltreatment and mental health are presented separately in the low- vs high-activity MAOA genotype groups. CI indicates confidence interval. Squares and % weight indicate the size of each study's contribution to the summary correlations indicated by diamonds. (a) Forest plot of correlations between childhood maltreatment and mental health, as a function of MAOA genotype group in five independent studies. (b) Forest plot of the interaction effect based on differences in correlations between childhood maltreatment and mental health observed in low- vs high-activity MAOA genotype groups in five independent studies. Kim-Cohen et al., 2006

Meta-analys - Streptokinase-behandling vid MI

Meta-analys - Streptokinase-behandling vid MI

Fallgropar med meta-analys 1. Det är sällan att resultat från olika studier stämmer överens därför krävs det större antal patienter att få konklusiva resultat. 2. Om författare är intresserade att få fram vissa specifika resultat, kan de välja studier som förstärker deras påstående (bias). 3. Studier med positiva resultat publiceras oftare är de med negativa, ett större antal studier med svagt positiva resultat kan ge intryck att en viss behandling är överlägsen en annan.

Tack för er uppmärksamhet!