Medicinsk statistik III Läkarprogrammet, Termin 5 HT 2013

Slides:



Advertisements
Liknande presentationer
Punkt- och intervallskattning Felmarginal
Advertisements

Bedömning av uppfyllelse av miljökvalitetsnormer
Inferens om en population Sid
Leg sjukgymnast, medicine doktor
Talföljder formler och summor
Vattenkemiska data Workshop, maj 2014 Claudia von Brömssen, SLU.
Hej hypotestest!. Bakgrund  Signifikansanalys  Signifikansprövning  Signifikanstest  Hypotesprövning  Hypotestest Kärt barn har många namn Inblandade:
FL4 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
Exempel Utifrån medicinsk erfarenhet är 5% av befolkningen smittade av ett visst virus. Ett nytt test har visat sig ge 80% av de smittade korrekt diagnos.
Vetenskaplig utveckling Läkarprogrammet KI HT 2010 termin 4
Den vetenskapliga artikeln
FL8 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
FL9 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
732G22 Grunder i statistisk metodik
Inferens om en ändlig population Sid
Jämförelse av två populationer Sid
Skånes Universitetssjukhus
Läkarprogrammet – Termin 5, Ht 2013
732G22 Grunder i statistisk metodik
F11 Olika urvalsmetoder, speciellt obundet slumpmässigt urval (OSU)
Olika mått på grad av fetma - Spelar det någon roll hur vi mäter?
Läkarprogrammet – Termin 5, Ht 2013
Vetenskaplig utveckling Läkarprogrammet KI HT 2010 termin 4
Robert Gidehag & Jonas Arnberg. Studiens frågeställningar Övergripande: Är den svenska alkoholpolitiken effektiv på 2000-talet?
Workshop i statistik för medicinska bibliotekarier!
Tillämpad statistik Naprapathögskolan
Vibeke Horstmann, Inst för hälsa, vård, samhälle, Centre for Ageing and Supportive Environments Jämförelse av två behandlingar.
Felkalkyl Ofta mäter man inte direkt den storhet som är den intressanta, utan en grundläggande variabel som sedan används för att beräkna det som man är.
Sammanfatta siffrorna…
Skattningens medelfel
Grundläggande Biostatistik
Förelasning 6 Hypotesprövning
Centrala Gränsvärdessatsen:
FK2002,FK2004 Föreläsning 2.
En mycket vanlig frågeställning gäller om två storheter har ett samband eller inte, många gånger är det helt klart: y x För en mätserie som denna är det.
Binomialsannolikheter ritas i ett stolpdiagram
Egenskaper för punktskattning
Praktisk epidemiologi för allmänläkare
Sannolikhet Stickprov Fördelningar
FL6 732G70 Statistik A Detta är en generell mall för att göra PowerPoint presentationer enligt LiUs grafiska profil. Du skriver in din rubrik,
Simulering Introduktion Exempel: Antag att någon kastar tärning
Föreläsning 7 Fysikexperiment 5p Poissonfördelningen Poissonfördelningen är en sannolikhetsfördelning för diskreta variabler som är mycket.
Linjär regression föreläsning 9
Normalfördelningen och centrala gränsvärdessatsen
Övningsexempel till Kapitel 7 Ex 1. BRÄNNBOLLSDILEMMAT ! En person funderar över hur man bäst uppskattar 28 meter. Av erfarenhet vet han att hans steglängd,
Logistisk regression SCB September 2004 Dan Hedlin, U/MET-S.
F8 Hypotesprövning. Begrepp
F8 Hypotesprövning. Begrepp
Forskningsmetodik Sampling och urval Hypotesprövning Lektion 9
Statistik Lars Valter Fil.lic. Statistik
Fysikexperiment, 5p1 Random Walk 36 försök med Random walk med 1000 steg. Beräknad genomsnittlig räckvidd är  1000  32. Visualisering av utfallsrum.
Läkarprogrammet – Termin 5, VT 2015
732G22 Grunder i statistisk metodik
VetU termin 4 moment 3 Analysera nivåer av kalium och kreatinin Mätningar genomförda på 120 män och 120 kvinnor (tidigare studenter KI) Dagens uppgift:
Läkarprogrammet – Termin 5, VT 2015
Grundläggande statistik, ht 09, AN
Statistiska samband i trafikolyckor Av: Lina Forsberg Hangjin Lee Daniel Leo Carl-Mikael Westman.
Medicinsk statistik Läkarprogrammet HT Medicinsk statistik Varför behöver Ni kunskap i medicinsk statistik? Självständigt arbete Kunna tolka resultat.
SAMBAND. Vi vill undersöka om det finns ett samband mellan tentamensresultat och genomsnittligt antal timmar/dag man studerat. Person ABCDEFGHIJ Timmar/
Medicinsk statistik II Läkarprogrammet T5 HT 2013 Susann Ullén FoU-centrum Skåne Skånes Universitetssjukhus.
Statistik för AT-läkare Robert Hahn, Södertälje sjukhus.
Statistisk hypotesprövning. Test av hypoteser Ofta när man gör undersökningar så vill man ha svar på olika frågor (s.k. hypoteser). T.ex. Stämmer en spelares.
Statistisk inferensteori. Inledning Den statistiska inferensteorin handlar i huvudsak om att dra slutsatser från ett slumpmässigt urval (sannolikhetsurval)
Betingade sannolikheter. 2 Antag att vi kastar en tärning och noterar antalet prickar som kommer upp. Låt A vara händelsen ”udda antal prickar”, dvs.
INFERENS & SAMBAND. population Population Stickprov, urval INFERENS = Dra slutsatser om hela populationen utifrån ett stickprov Data, observationer.
INFERENS & SAMBAND. population Population Stickprov, urval INFERENS = Dra slutsatser från data om hela populationen utifrån ett stickprov Data, observationer.
Samband & Inferens Hypotetisk –deduktiv metod Samband mellan nominal/ordinal-variabler –Chi2-test Samband mellan kvot-varibaler –Korrelationskoefficient.
Enkel Linjär Regression. 1 Introduktion Vi undersöker relationer mellan variabler via en matematisk ekvation. Motivet för att använda denna teknik är:
Grundl. statistik F2, ht09, AN
Grundläggande begrepp
Presentationens avskrift:

Medicinsk statistik III Läkarprogrammet, Termin 5 HT 2013 Jonas Björk E-post: Jonas.Bjork@skane.se

Medicinsk statistik III Mer om statistik för binära utfall Kapitel 12 Dimensionering av studier Statistisk styrka (power) En grupp, två grupper Kontinuerliga och binära utfall Avsnitt 6.4, 8.4 och 10.4 Tolkning av p-värden Statistiska vs. diagnostiska test Avsnitt 9.2 Kapitel 12 Avsnitt 6.4, 8.4, 9.2 och 10.4 Webbplats

Binära utfall Sjuk / frisk Positiv / negativ Reaktion / ingen reaktion ... Dikotomiseringar

Dikotomiseringar Kontinuerliga data 1. Binära utfall Dikotomiseringar Kontinuerliga data CRP > 15 Systoliskt blodtryck >160 mmHg Ordinaldata (data endast möjliga att rangordna) Ex. Klassning av allergisk reaktion +++, ++(+), ++, +(+), +, (+), ?, - Information kastas bort – väsentlig eller ovidkommande?

Binära utfall - Exempel Alarm om glutenallergi bland barn Bland 7 207 skolbarn i åk 6 år 2005-2006 fann man att 212 (2,9%) var glutenintoleranta 1. Hur stor är den statistiska felmarginalen 2. Kan vi vara ”säkra” på att den verkliga andelen glutenintoleranta är över 2%?

Konfidensintervall (KI) kring en uppskattad andel 1. Binära utfall Konfidensintervall (KI) kring en uppskattad andel n = 7 207, a = 212 positiva Prevalens q =a / n = 0,029 = 2,9% Om a  5 och (n – a)  5 kan konfidensintervallet beräknas på följande sätt (asymptotisk = ungefärlig metod): 95% konfidensgrad  c = 1,96, SE = Medelfel (Standard error) Felmarginal ± 0,4% 95% KI: 2,5 - 3,3%

Uppskatta en andel Hur stor ska studien vara? 2. Dimensioneringsberäkningar - en grupp Uppskatta en andel Hur stor ska studien vara? Anta att vi vill skatta en andel q, t.ex. en prevalens eller risk Hur stor studien bör vara bestäms av Andelen q (okänd för oss, men vi kan kanske gissa) Önskad felmarginal F Utnyttja formel för 95% KI, lös ut n:   I boken finns motsvarande formel för ett medelvärde (formel 6.3)

Jämförelse av två andelar 1. Binära utfall Jämförelse av två andelar Två separata (oberoende) grupper: q1 = a1 / n1, q2= a2 / n2 Differens q1 – q2 -Ex. prevalensdifferens, riskdifferens Kvot q1 / q2 -Ex. prevalenskvot, riskkvot (RR = relativ risk) Oddskvot OR = 1 / 2 Odds 1 = q1 / (1 – q1), 2 = q2 / (1 – q2)

Jämförelser av andelar 1. Binära utfall Jämförelser av andelar Randomiserad studie av tamoxifen, strålbehandling och återfall av bröstcancer under fem års uppföljning (Overgaard et al. 1999) Sjukdomsfri överlevnad i grupp 1:q1 = 357 / 686  0,52 = 52% Sjukdomsfri överlevnad i grupp 1:q2 = 276 / 689  0,40 = 40% Vad kan vi säga om skillnaden i sjukdomsfri överlevnad (eller i återfallsrisk)?

Differens mellan två andelar 1. Binära utfall Differens mellan två andelar Randomiserad studie av tamoxifen, strålbehandling och återfall av bröstcancer bland kvinnor Riskdifferens RD (absolut riskreduktion) = 357/ 686 – 276 / 689  0,12 = 12 fler sjukdomsfria per 100 behandlade Medelfel Om a15, (n1 – a1)5, a2 5 och (n2 – a2)5 kan ett 95% KI för RD bildas som 7 – 17 fler per 100

Antal som behöver behandlas NNT = Numbers Needed to Treat 1. Binära utfall Antal som behöver behandlas NNT = Numbers Needed to Treat Från föregående problem: Riskdifferens RD = 357 / 689 – 276 / 686  0,12 = 12 fler sjukdomsfria per 100 behandlade NNT = 1 / RD  1 / 0,12  8,3 vilket innebär att ungefär 8 (8,3) patienter behöver behandlas med kombinationsbehandlingen för att förhindra ett återfall i genomsnitt 95% KI för RD: 0,12 ± 0,052, dvs. 0,068 till 0,172 95% KI för NNT: 6 till 15 patienter behöver behandlas för att förhindra ett återfall i genomsnitt 1 / RD

Kvot mellan två andelar 1. Binära utfall Kvot mellan två andelar Randomiserad studie av tamoxifen, strålbehandling och återfall av bröstcancer bland kvinnor Relativ risk RR = (413 / 689) / (329 / 686)  1,25 ln(RR) = ln(1,25)  0,223 gånger (25%) högre risk om enbart tamoxifen ges Medelfel 95% KI för RR bildas på log-skalan som 1,08 – 1,44 gånger högre risk

Oddskvot (OR) i fall-kontrollundersökningar 1. Binära utfall Oddskvot (OR) i fall-kontrollundersökningar Odds för exponering bland fall: 630/101  6,2 Odds för exponering bland kontroller: 573/158  3,6 70% riskökning bland rökare 95 % KI: 1,3 till 2,3 (30 till 130% riskökning)

2. Dimensioneringsberäkningar - två grupper Statistisk styrka Sannolikheten a priori att H0 kommer att förkastas, givet en viss verklig skillnad mellan de grupper som studeras Sensitiviteten hos det statistiska testet (jämför sensitivitet hos diagnostiska test)

2. Dimensioneringsberäkningar Dimensioneringsberäkningar Två oberoende grupper, medelvärdesjämförelse (Kursboken s. 156)

Dimensionering av två oberoende grupper 2. Dimensioneringsberäkningar Dimensionering av två oberoende grupper

Gruppstorlek vs. effektstorlek 2. Dimensioneringsberäkningar 3. Statistisk styrka Gruppstorlek vs. effektstorlek

Syreupptagningsförmåga Replikera tidigare resultat i en ny studie 2. Dimensioneringsberäkningar Syreupptagningsförmåga Replikera tidigare resultat i en ny studie spooled  8

2. Dimensioneringsberäkningar Dimensioneringsberäkning (enl. 1.) Två oberoende grupper, medelvärdesjämförelse 5% signifikansgräns  k1 = 1.96 80% statistisk styrka  k2 = 0.84 Standardiserad effektstorlek Ex. Syreupptagningsförmåga per grupp

Dimensioneringsberäkningar - Allmänt Redovisas först och främst för primär frågeställning. Minst 80% statistisk styrka är ett vanligt krav om nya data ska samlas in Gör beräkningen under olika antaganden om , s Standardiserad effektstorlek =  / s avgörande Ibland enklare att uppskatta variationskoefficienten (CV=Coefficient of variation, mätt i % av medelvärdet) än standardavvikelsen Ta hänsyn till förväntad deltagandefrekvens Utnyttja tidigare studier inom området! I en överlevnadsanalys är det antal händelser (events) som avgör. Avvägning: Uppföljningstid - Antal patienter

Program för dimensioneringsberäkningar 3 Statistisk styrka Program för dimensioneringsberäkningar PS Power and Sample Size Calculation Enkelt, lätt att använda Kan laddas ned gratis via http://biostat.mc.vanderbilt.edu/twiki/bin/view/Main/ PowerSampleSize G*Power 3 Mer avancerat, något svårare att använda Kan laddas ned gratis via http://www.psycho.uni-duesseldorf.de/abteilungen/aap/gpower3

Diskutera med bänkgrannen... Känslighetsanalys 2. Dimensioneringsberäkningar Diskutera med bänkgrannen... Känslighetsanalys Vad händer med minsta gruppstorlek i exemplet på föregående bilder om Man vill kunna detektera en skillnad som är hälften så stor, dvs  = 5 / 2 = 2,5 ? Standardavvikelsen s är 12 istället för 8 i båda grupperna? 90% statistisk styrka krävs (k2 = 1,28)?

Förklara studiens storlek 3. Statistisk styrka 2. Dimensioneringsberäkningar Förklara studiens storlek Randomiserad studie av tamoxifen, strålbehandling och återfall av bröstcancer Författarna skrev så här i metoddelen: (Overgaard et al. 1999)

Fall-kontrollundersökning Hur många fall och kontroller behövs? 2. Dimensioneringsberäkningar Fall-kontrollundersökning Hur många fall och kontroller behövs? Förväntad OR =1.7 enligt tidigare studie Rökprevalens i den befolkning vi studerar? Utnyttja PS Power Sample Size

Statistiskt vs. Diagnostiskt test 3. Tolkning av p-värden 4. Tolkning av p-värden Statistiskt vs. Diagnostiskt test Statistisk styrka = Sensitivitet Signifikansgräns (; ofta 5%) = 1 - Specificitet (Kursboken, s. 261)

Tolkning av p-värden Modernt förhållningssätt Sifting the evidence – what’s wrong with significance tests? Tolkning av p-värden Modernt förhållningssätt P-värdet bör främst ses som ett index (0-1) som svarar på följande fråga: Vilka belägg mot nollhypotesen finns i insamlade data? Undvik skarp signifikansgräns Ex. p = 0,04 och p =0,06 är två snarlika resultat som båda ger ”måttliga” evidens mot nollhypotesen P-värdet är inte sannolikheten att nollhypotesen är sann: (Sterne & Smith BMJ 2001;322:226-231)

Testets prediktiva värden bestäms av sjukdomsprevalensen 3. Tolkning av p-värden Testets prediktiva värden bestäms av sjukdomsprevalensen

Sannolikheten att H0 är sann FPRP = False Positive Report Probability 3. Tolkning av p-värden Sannolikheten att H0 är sann FPRP = False Positive Report Probability P-värde omkring 0,001 innebär i allmänhet starka belägg för ett samband