Grundläggande Biostatistik Joacim Rocklöv, Lektor Epidemiologi och global hälsa Umeå Universitet
Formell analys Informell data analys Design och mätning Modellbaserad analys Regression Logistisk regression Överlevnadsanalys Konfidensintervall P-värden (enkla tester) Formell analys Hitta misstag Hantera extremvärden Bortfall Informell data analys Lär känna data, tabeller, mått, grafer Hur samlas data in? Mätskalor reliabilitet validitet Design och mätning
Syften.. Skatta prevalens och risker för insjuknande av sjukdom Jämföra utfall av behandling tex läkemedel/rehabiliteringsmetoder Kartlägga riskfaktorer, dvs faktorer som ökar risken för sjukdom Följa förlopp – tillväxtkurvor, etc…
Strategi vid kliniska prövningar - Sample size beräkningar Datainsamling Beskrivande statistik Statistisk analys Inferens - Presentation/publikation
Mätning Variabel Kategorisk Kvantitativ Diskret Kontinuerlig Ordnad Ej ordnad
Grupper av variabler Utfallsvariabler – primära/sekundära Behandlingsvariabler/riskfaktorer – variabler som påverkar utfallet Bakgrundsvariabler – demografiska variabler Förväxlingsvariabler – confounders/inflytelserika men ej intressanta variabler för frågeställningen
Datanivåer (typer av variabler) Kvalitativa variabler = kategorivariabler Kvantitativa variabler = numeriska variabler Nominala variabler Utfallen är kategorier som inte kan rangordnas Ordinala variabler Utfallen är ordnade kategorier Intervall- variabler Kan beräkna differenser men inte kvoter Kvot- variabler Kan beräkna differenser och kvoter Blodtyp Kön Yrke Rökning (ja/nej) VAS-skalan Betyg Självskattad hälsa, smärta Rökning (nej, lite, mycket) Temperatur Mätt i C° F° K° Längd Vikt, ålder Rökning (antal cigaretter per dag)
Variabel Kategorier Typ av variabel Datanivå ID Kön Blodgrupp VIKT Man/Kvinna Kat Nominal Binär Blodgrupp O, A, B, AB VIKT Mätt i kg Kvant Kontinuerlig Rökare Nej, Ja Smärta Obetydlig, Måttlig, Svår, Outhärdlig Ordinal Vårddagar Antal vårdagar Diskret
Orsak verkan samband? x y x påverkar y x y x är associerad med y
Studiedesign Experiment Observationsstudie Tvärsnitts- undersökning Longitudinell undersökning Klinisk prövning Kohortstudie Fall-kontroll studie
Randomiserad kontrollerad studie Behandling Utfall Patienter Randomisering Kontroll/ Placebo Utfall Fler armar kan förekomma
Kohort studie Exponerade Utfall Population Ej exponerade Utfall
Fall kontroll studie Fall Exponerade Kontroller Ej exponerade
Tvärsnitts-studie Mätningar Population Urval
Analys och inferens Skattning av sant medelvärde Sant medelvärde Urvalsmetod Population Urval
Inferens 2: Hypotesprövning Skiljer sig män och kvinnor åt vad avser kroppstemperatur? Report temp_c sex Mean N Std. Deviation Man 36,7248 65 ,38820 Kvinna 36,8855 ,41305 Total 36,8051 130 ,40732 P-värde = 0.024 Slutsats: ?
Statistisk inferens de metoder som används för att utifrån ett stickprov dra slutsatser om en hel population.
Hypotesprövning Vid prövning av behandlingsmetod på två grupper: H0: ingen skillnad mellan grupper HA: skillnad mellan grupper När väljer vi nollhypotesen och när förkastar vi den till fördel för den alternativa hypotesen?
Konfidensintervall Skattningar är osäkra på grund av att vi studerar en del av populationen. Skattningar kan ges med FELMARGINAL. Det kallas KONFIDENSINTERVALL. Konfidensintervallet anges med grad av osäkerhet som kallas konfidensnivå (95%, 99%, etc)
Konfidensintervall intervall som inkluderar det sanna medelvärdet nästan säkert (95%). Kroppstemperatur Konfidensintervallet blir 36.73 – 36.88 Detta intervall inkluderar populationens medelvärde nästan säkert (med 95% konfidens)
P-värde p-värde = sannolikheten för det erhållna utfallet eller extremare under förutsättning att nollhypotesen är sann. Om denna sannolikhet är liten tror vi att nollhypotesen är falsk. Vi förkastar nollhypotesen. Om denna sannolikhet är stor kan vi inte förkasta nollhypotesen.
Praxis för bedömning av p-värden p > 0.05 ingen skillnad (ej signifikant) 0.05>p>0.01 skillnad (signifikant *) 0.01>p>0.001 skillnad (signifikant **) 0.001>p skillnad (signifikant ***)
Typ I och II fel H0: grupp1=grupp2 HA: grupp1≠grupp2 Null Hypothesis is true (H0) Alternative Hypothesis is true (HA) Reject Null Hypothesis Negative Right decision Type 2 error (β) Positive Type 1 error (α) Type 1 error is referred to as false positive Type 2 error is referred to as false negative
Begreppet power – studiens styrka Sannolikheten att kunna påvisa en skillnad mellan grupper (tex behandlingsgrupper) om den finns där Utgör en komponent vid bestämning av studiens storlek Andra komponenter är: Den minsta skillnad vi vill kunna påvisa Risk för ett falskt positivt fynd (alfa-fel) Storleken av spridningen i utfallet Val av metod
Presentation av data Bild Mått Tabell Val styrs av variabeltyp
Lägesmått Medelvärde Median ”Mittersta värdet” 36.8 gr C 36.8 gr C
Variationsmått Standardavvikelse Kvartilavstånd s = 4.13 år (IQR) Variationsvidd (Range) s = 4.13 år q1 = 36.56, q3 = 37.06 IQR= 0.5 grC max =38.22, min = 35.72 VV = 2.5
Grafisk beskrivning: Histogram Referens
Grafisk bild av samband (scatter plot) År styrka i höger och vänster hand associerade?
Grafisk beskrivning: Boxplot
Tabellpresentation
Jämförelse mellan grupper