Medicinsk statistik III Läkarprogrammet, Termin 5 HT 2013 Jonas Björk E-post: Jonas.Bjork@skane.se
Medicinsk statistik III Mer om statistik för binära utfall Kapitel 12 Dimensionering av studier Statistisk styrka (power) En grupp, två grupper Kontinuerliga och binära utfall Avsnitt 6.4, 8.4 och 10.4 Tolkning av p-värden Statistiska vs. diagnostiska test Avsnitt 9.2 Kapitel 12 Avsnitt 6.4, 8.4, 9.2 och 10.4 Webbplats
Binära utfall Sjuk / frisk Positiv / negativ Reaktion / ingen reaktion ... Dikotomiseringar
Dikotomiseringar Kontinuerliga data 1. Binära utfall Dikotomiseringar Kontinuerliga data CRP > 15 Systoliskt blodtryck >160 mmHg Ordinaldata (data endast möjliga att rangordna) Ex. Klassning av allergisk reaktion +++, ++(+), ++, +(+), +, (+), ?, - Information kastas bort – väsentlig eller ovidkommande?
Binära utfall - Exempel Alarm om glutenallergi bland barn Bland 7 207 skolbarn i åk 6 år 2005-2006 fann man att 212 (2,9%) var glutenintoleranta 1. Hur stor är den statistiska felmarginalen 2. Kan vi vara ”säkra” på att den verkliga andelen glutenintoleranta är över 2%?
Konfidensintervall (KI) kring en uppskattad andel 1. Binära utfall Konfidensintervall (KI) kring en uppskattad andel n = 7 207, a = 212 positiva Prevalens q =a / n = 0,029 = 2,9% Om a 5 och (n – a) 5 kan konfidensintervallet beräknas på följande sätt (asymptotisk = ungefärlig metod): 95% konfidensgrad c = 1,96, SE = Medelfel (Standard error) Felmarginal ± 0,4% 95% KI: 2,5 - 3,3%
Uppskatta en andel Hur stor ska studien vara? 2. Dimensioneringsberäkningar - en grupp Uppskatta en andel Hur stor ska studien vara? Anta att vi vill skatta en andel q, t.ex. en prevalens eller risk Hur stor studien bör vara bestäms av Andelen q (okänd för oss, men vi kan kanske gissa) Önskad felmarginal F Utnyttja formel för 95% KI, lös ut n: I boken finns motsvarande formel för ett medelvärde (formel 6.3)
Jämförelse av två andelar 1. Binära utfall Jämförelse av två andelar Två separata (oberoende) grupper: q1 = a1 / n1, q2= a2 / n2 Differens q1 – q2 -Ex. prevalensdifferens, riskdifferens Kvot q1 / q2 -Ex. prevalenskvot, riskkvot (RR = relativ risk) Oddskvot OR = 1 / 2 Odds 1 = q1 / (1 – q1), 2 = q2 / (1 – q2)
Jämförelser av andelar 1. Binära utfall Jämförelser av andelar Randomiserad studie av tamoxifen, strålbehandling och återfall av bröstcancer under fem års uppföljning (Overgaard et al. 1999) Sjukdomsfri överlevnad i grupp 1:q1 = 357 / 686 0,52 = 52% Sjukdomsfri överlevnad i grupp 1:q2 = 276 / 689 0,40 = 40% Vad kan vi säga om skillnaden i sjukdomsfri överlevnad (eller i återfallsrisk)?
Differens mellan två andelar 1. Binära utfall Differens mellan två andelar Randomiserad studie av tamoxifen, strålbehandling och återfall av bröstcancer bland kvinnor Riskdifferens RD (absolut riskreduktion) = 357/ 686 – 276 / 689 0,12 = 12 fler sjukdomsfria per 100 behandlade Medelfel Om a15, (n1 – a1)5, a2 5 och (n2 – a2)5 kan ett 95% KI för RD bildas som 7 – 17 fler per 100
Antal som behöver behandlas NNT = Numbers Needed to Treat 1. Binära utfall Antal som behöver behandlas NNT = Numbers Needed to Treat Från föregående problem: Riskdifferens RD = 357 / 689 – 276 / 686 0,12 = 12 fler sjukdomsfria per 100 behandlade NNT = 1 / RD 1 / 0,12 8,3 vilket innebär att ungefär 8 (8,3) patienter behöver behandlas med kombinationsbehandlingen för att förhindra ett återfall i genomsnitt 95% KI för RD: 0,12 ± 0,052, dvs. 0,068 till 0,172 95% KI för NNT: 6 till 15 patienter behöver behandlas för att förhindra ett återfall i genomsnitt 1 / RD
Kvot mellan två andelar 1. Binära utfall Kvot mellan två andelar Randomiserad studie av tamoxifen, strålbehandling och återfall av bröstcancer bland kvinnor Relativ risk RR = (413 / 689) / (329 / 686) 1,25 ln(RR) = ln(1,25) 0,223 gånger (25%) högre risk om enbart tamoxifen ges Medelfel 95% KI för RR bildas på log-skalan som 1,08 – 1,44 gånger högre risk
Oddskvot (OR) i fall-kontrollundersökningar 1. Binära utfall Oddskvot (OR) i fall-kontrollundersökningar Odds för exponering bland fall: 630/101 6,2 Odds för exponering bland kontroller: 573/158 3,6 70% riskökning bland rökare 95 % KI: 1,3 till 2,3 (30 till 130% riskökning)
2. Dimensioneringsberäkningar - två grupper Statistisk styrka Sannolikheten a priori att H0 kommer att förkastas, givet en viss verklig skillnad mellan de grupper som studeras Sensitiviteten hos det statistiska testet (jämför sensitivitet hos diagnostiska test)
2. Dimensioneringsberäkningar Dimensioneringsberäkningar Två oberoende grupper, medelvärdesjämförelse (Kursboken s. 156)
Dimensionering av två oberoende grupper 2. Dimensioneringsberäkningar Dimensionering av två oberoende grupper
Gruppstorlek vs. effektstorlek 2. Dimensioneringsberäkningar 3. Statistisk styrka Gruppstorlek vs. effektstorlek
Syreupptagningsförmåga Replikera tidigare resultat i en ny studie 2. Dimensioneringsberäkningar Syreupptagningsförmåga Replikera tidigare resultat i en ny studie spooled 8
2. Dimensioneringsberäkningar Dimensioneringsberäkning (enl. 1.) Två oberoende grupper, medelvärdesjämförelse 5% signifikansgräns k1 = 1.96 80% statistisk styrka k2 = 0.84 Standardiserad effektstorlek Ex. Syreupptagningsförmåga per grupp
Dimensioneringsberäkningar - Allmänt Redovisas först och främst för primär frågeställning. Minst 80% statistisk styrka är ett vanligt krav om nya data ska samlas in Gör beräkningen under olika antaganden om , s Standardiserad effektstorlek = / s avgörande Ibland enklare att uppskatta variationskoefficienten (CV=Coefficient of variation, mätt i % av medelvärdet) än standardavvikelsen Ta hänsyn till förväntad deltagandefrekvens Utnyttja tidigare studier inom området! I en överlevnadsanalys är det antal händelser (events) som avgör. Avvägning: Uppföljningstid - Antal patienter
Program för dimensioneringsberäkningar 3 Statistisk styrka Program för dimensioneringsberäkningar PS Power and Sample Size Calculation Enkelt, lätt att använda Kan laddas ned gratis via http://biostat.mc.vanderbilt.edu/twiki/bin/view/Main/ PowerSampleSize G*Power 3 Mer avancerat, något svårare att använda Kan laddas ned gratis via http://www.psycho.uni-duesseldorf.de/abteilungen/aap/gpower3
Diskutera med bänkgrannen... Känslighetsanalys 2. Dimensioneringsberäkningar Diskutera med bänkgrannen... Känslighetsanalys Vad händer med minsta gruppstorlek i exemplet på föregående bilder om Man vill kunna detektera en skillnad som är hälften så stor, dvs = 5 / 2 = 2,5 ? Standardavvikelsen s är 12 istället för 8 i båda grupperna? 90% statistisk styrka krävs (k2 = 1,28)?
Förklara studiens storlek 3. Statistisk styrka 2. Dimensioneringsberäkningar Förklara studiens storlek Randomiserad studie av tamoxifen, strålbehandling och återfall av bröstcancer Författarna skrev så här i metoddelen: (Overgaard et al. 1999)
Fall-kontrollundersökning Hur många fall och kontroller behövs? 2. Dimensioneringsberäkningar Fall-kontrollundersökning Hur många fall och kontroller behövs? Förväntad OR =1.7 enligt tidigare studie Rökprevalens i den befolkning vi studerar? Utnyttja PS Power Sample Size
Statistiskt vs. Diagnostiskt test 3. Tolkning av p-värden 4. Tolkning av p-värden Statistiskt vs. Diagnostiskt test Statistisk styrka = Sensitivitet Signifikansgräns (; ofta 5%) = 1 - Specificitet (Kursboken, s. 261)
Tolkning av p-värden Modernt förhållningssätt Sifting the evidence – what’s wrong with significance tests? Tolkning av p-värden Modernt förhållningssätt P-värdet bör främst ses som ett index (0-1) som svarar på följande fråga: Vilka belägg mot nollhypotesen finns i insamlade data? Undvik skarp signifikansgräns Ex. p = 0,04 och p =0,06 är två snarlika resultat som båda ger ”måttliga” evidens mot nollhypotesen P-värdet är inte sannolikheten att nollhypotesen är sann: (Sterne & Smith BMJ 2001;322:226-231)
Testets prediktiva värden bestäms av sjukdomsprevalensen 3. Tolkning av p-värden Testets prediktiva värden bestäms av sjukdomsprevalensen
Sannolikheten att H0 är sann FPRP = False Positive Report Probability 3. Tolkning av p-värden Sannolikheten att H0 är sann FPRP = False Positive Report Probability P-värde omkring 0,001 innebär i allmänhet starka belägg för ett samband