Presentation laddar. Vänta.

Presentation laddar. Vänta.

SPSS baserad biostatistik

Liknande presentationer


En presentation över ämnet: "SPSS baserad biostatistik"— Presentationens avskrift:

1 SPSS baserad biostatistik
Bo Hedblad Senior professor Kardiovaskulär epidemiologi IKVM, CRC SUS Malmö Bo Hedblad Biostatistik T10

2 Statistik (av stat, ställning)
Ursprungligen beskrivning av befolkning och politiska förhållanden 1600-talet: studier av födslo- och dödstal 1741 JP Süssmilch. “Die Göttliche Ordnung in den Veränderung des menschlichen Geschlechtes” Bo Hedblad Biostatistik T10

3 Bo Hedblad Biostatistik T10

4 Finns det något fel i denna studie?
73% av olyckorna bland ’hang gliders’ inträffar mellan kl. 11 och 15. Slutsats: Flygningar mellan dessa tidpunkter bör därför förbjudas. Bo Hedblad Biostatistik T10

5 Ett annat exempel. Något fel?
I en studie rapporterades att 68% av olycksfallen på sjukhus inträffade bland patienter över 60 år. Slutsats: Patienter över 60 år har större olycksrisk och bör i större utsträckning få särskild tillsyn. Bo Hedblad Biostatistik T10

6 Methods of Reporting Statistical Results from Medical Research Studies
Stephen D. Walter Department of Clinical Epidemiology and Biostatistics, McMaster University, Hamilton, Ontario, Canada. - One survey concluded ”that statistical knowledge of most doctors is so limited that they cannot be expected to draw the right conclusions from those statistical analyses which are found in papers in most medical journals” (14, p. 3). - By its nature, much of epidemiology, is inherently quantitative, and statistical issues are prominent. Walters SD. Am J Epidemiol 1995; 141: Bo Hedblad Biostatistik T10

7 Bo Hedblad Biostatistik T10

8 Några epidemiologiska grundbegrepp
Population En definierad grupp av individer Individer Oftast detsamma som personer, kan även vara familjer, kommuner, etc Totalundersökning Alla individer i populationen ingår Urvalsundersökning Endast en del (”stickprov”) av totalpopulationen ingår Bo Hedblad Biostatistik T10

9 Population och urval TOTAL POPULATION URVAL ”stickprov” - Patienter
- Individer Deltagare Skillnader? Representativitet? Selektionbias? Icke-deltagare Bo Hedblad Biostatistik T10

10 Population - Urval Representativitet Hur ser bakgrundspopulationen ut?
Hur ser urvalet (”stickprovet”) ut? Hur representativa är resultaten? Bo Hedblad Biostatistik T10

11 Rosvall M, et al. Atherosclerosis 2015; 91: 012809. Epub 2015 Jan 12
n=5530 with lab measures n = 6103 (61%) (17%) (22%) Rosvall M, et al. Atherosclerosis 2015; 91: Epub 2015 Jan 12 Bo Hedblad Biostatistik T10

12 http://www. strobe-statement
Bo Hedblad Biostatistik T10

13 Bo Hedblad Biostatistik T10

14 Bo Hedblad Biostatistik T10

15 SPSS-baserad biostatistik
Bo Hedblad SPSS-baserad biostatistik Bo Hedblad Biostatistik T10

16 Statistical Package for Social Science
SPSS Statistical Package for Social Science Bo Hedblad Biostatistik T10

17 En variabel = en kolumn i ett datablad (Normalt en rad per deltagare)
Variabler En variabel = en kolumn i ett datablad (Normalt en rad per deltagare) Variabler Deltagare = ”id” Bo Hedblad Biostatistik T10

18 Bo Hedblad Biostatistik T10

19 Bo Hedblad Biostatistik T10

20 Obs! Intervall och kvotskala i SPSS: Scale
Olika skaltyper Nivå Informationsmängd en ökar Nominalskala =Klassificering.Jfr. nomenklatur, namn (ex. nummer på fotbollspelare, kön) Ordinalskala Kan rangordnas. Jfr. Ordning, eng. order (ex. betyg: 1-5) Intervallskala Skillnaderna mellan mätvärdena är lika (ex. temperatur i Celsius) Kvotskala Intervallskala med absolut nollpunkt. (ex. ålder, vikt, blodglukos) Obs! Intervall och kvotskala i SPSS: Scale Bo Hedblad Biostatistik T10

21 Vilken information (vilka variabler) har/vill Du samla(-t) eller analysera för varje individ?
Kvalitativa variabler Icke numeriska, innebär (Kategoriska) klassificering (t.ex. kön, civilstånd) Kontinuerliga variabler Numeriska mätvärden, (t.ex. blodtryck, vikt) Diskreta variabler Kvantitativa variabler som bara kan visa vissa värden, (t.ex. antal barn, antal läkarbesök) Kvantitativa Bo Hedblad Biostatistik T10

22 Sammanfattning: Olika skaltyper
VARIABEL KVALITATIVA DATA (kategoriska) KVANTITATIVA DATA (numeriska) NOMINALDATA Utan inbördes ordning ORDINALDATA Med inbördes ordning DISKRETA DATA Kan endast anta vissa värden KONTINUERLIGA DATA Kan anta i princip vilka värden som helst Bo Hedblad Biostatistik T10

23 MÄTKVALITET Bo Hedblad Biostatistik T10

24 Variationskällor. Mätning av diastoliskt blodtryck
FÖRUTSÄTTNING DISTRIBUTION VARIATIONSKÄLLA En patient. En observer. Upprepade observationer vid samma tillfälle på dygnet Mätning En patient. Många observer, vid samma tillfälle på dygnet En patient. En observer. Upprepade observationer, under dygnet Biologi + Mätning Många patienter DBP mmHg 60 70 80 90 100 110 120 130 Bo Hedblad Biostatistik T10 Boe J, et al. Acta Med Scand 1957; 321

25 Några grundbegrepp Precision Mått på reproducerbarhet Motsatsen till ’random errors’ (slumpvisa fel) Validitet Att man verkligen har undersökt det man ville undersöka och ingenting annat. Motsatsen till ’bias’ (systematiska fel) Bo Hedblad Biostatistik T10

26 Validitet och precision
VALIDITET (giltighet) Hög Låg Hög A B PRECISION (tillförlitlighet) Frekvens C D Låg Mått Den blå linjen representerar de sanna värderna Bo Hedblad Biostatistik T10

27 PRECISION - reproducerbarhet
Samma resultat vid upprepade tester? Påverkas av slumpmässiga fel (’random errors’) Intra-observer variation - gör samma undersökare samma bedömning vid olika tillfällen? Inter-observer variation - gör olika undersökare samma bedömning? Överenstämmelsen uttrycks som: - Coefficient of variation (CV (%): SD dividerat med X) - Agreement / Kappa-värden (stat test på agreement) Bo Hedblad Biostatistik T10

28 Beskrivande Statistik
Biostatistik Beskrivande Statistik Analytisk Statistik Grafisk presentation Exempel: Histogram Spridningsmått Exempel: Medelvärde Standardavvikelse Gruppjämförelse Exempel: t-test, F-test CHI-2 Sambandsanalyser Exempel: Korrelationsanalys Regressionsanalys Bo Hedblad Biostatistik T10

29 Beskrivande statistik
Många syften: Sammanfatta resultat Underlag för att bedöma jämförbarhet hos de grupper som studeras generaliserbarhet ev. konsekvenser av bortfall Överblick över datamaterialets sammansättning upptäcka skevheter eller direkta felaktigheter Bo Hedblad Biostatistik T10

30 Hur beskriva data? Tabeller Diagram Text Bo Hedblad Biostatistik T10

31 Hur beskriva kvalitativa eller diskreta variabler?
Antal (procent), n (%) Antal (kumulativ procent) Stolpdiagram Trappstegskurva Typvärde Bo Hedblad Biostatistik T10

32 TABELLER OCH DIAGRAM FÖR ATT BESKRIVA KVALITATIVA VARIABLER
Antal (procent), n (%) Antal (kumulativ procent) Stolpdiagram Bo Hedblad Biostatistik T10

33 Bo Hedblad Biostatistik T10

34 Hur beskriva kvantitativa variabler?
Histogram Box plot Medelvärde Median Bo Hedblad Biostatistik T10

35 TABELLER, DIAGRAM FÖR ATT BESKRIVA KVANTITATIVA VARIABLER
Histogram Outliers, extremvärden Boxplot Bo Hedblad Biostatistik T10

36 Bo Hedblad Biostatistik T10

37 TABELLER, DIAGRAM FÖR ATT BESKRIVA KVANTITATIVA VARIABLER
Boxplot Outliers = O * Extreme outliers (>3 ggr boxens höjd) 1.5 ggr boxens höjd Högsta värde IQR (kvartilavstånd) = Q1 – Q3 Q3 = 75:e percentilen Median Q1 = 25:e percentilen Lägsta värde (eller 1.5 ggr boxens höjd) Bo Hedblad Biostatistik T10

38 Bo Hedblad Biostatistik T10

39 Centralmått Medelvärde (aritmiskt)
Mätvärdena adderas och divideras med antalet mätvärden. Endast vid kvantitativa variabler. Median ’Mittenvärdet’. Det värde som gör att lika många värden är lägre och högre. Bra metod om det finns avvikare (s.k. ’out-liers’) med mycket höga eller låga värden. Typvärde Det mest vanligaste värdet i data. Kan användas i alla data (ordinaldata, diskreta och kontinuerliga data). Bo Hedblad Biostatistik T10

40 TABELLER, DIAGRAM FÖR ATT BESKRIVA KVANTITATIVA VARIABLER
Histogram Typvärde Boxplot Bo Hedblad Biostatistik T10

41 Spridningsmått Kvartil-(percentil) värden
Delar ett material i 4 (100) lika delar. Interkvartilavstånd Skillnaden mellan 1a (25%) och 3e (75%) kvartilgränsen Range (variationsvidd) Avståndet mellan högsta (max) och lägsta (min) värde. Standardavvikelse (SD). SD=√variansen Bo Hedblad Biostatistik T10

42 TABELLER, DIAGRAM FÖR ATT BESKRIVA KVANTITATIVA VARIABLER
SE = SD/√n Error bar 95% konfidensintervallet (CI) Bo Hedblad Biostatistik T10

43 Normalfördelning (Gauss distribution) eller ej
Bo Hedblad Biostatistik T10

44 Normalfördelning eller ej
-2SD Medel +2SD -1SD +1SD Vid normalfördelning: 66% av observationerna inom x±1SD 95% av observationerna inom x±2SD 99% av observationerna inom x±3SD 95% av individerna Bo Hedblad Biostatistik T10

45 Symmetrisk fördelning
Normalfördelningskurva Positiv sned fördelning Normalfördelningskurva Bo Hedblad Biostatistik T10

46 Val av genomsnitts- och spridningsmått hör ihop
Är data symmetriskt fördelade: välj medelvärde och standardavvikelse Är data snedfördelade: välj median och interkvartiler (IQ) alternativt percentiler Om små grupper: överväg spridningsmått som min och max. Bo Hedblad Biostatistik T10

47 Standard deviation (SD) Standard error (SE, medelfel)
SD = mått på genomsnittlig avvikelse från medelvärdet Mått på osäkerheten: anges som konfidensintervall SD = √variansen Standard error (SE, medelfel) SE = mått på osäkerheten i uppskattat medelvärdet för gruppen dvs beskriver medelfelet vid urvalet (stickprovet) SE = SD/√n Bo Hedblad Biostatistik T10

48 Konfidensintervall (CI el KI)
Anger osäkerheten i en punktskattning, ett nmedelvärde, skillnaden mellan två medelvärden, en andel, eller skillnaden mellan två andelar Beräknas utifrån formeln: punktskattningen (x) ± konstant (C) · medelfelet (SE) Konstanten vid olika konfidensgrader: Konfidensgrad 90% ⇒ c=1,64 Konfidensgrad 95% ⇒ c=1,96 Konfidensgrad 99% ⇒ c=2,58 CI av ett medelvärde (x): CI av en andel (q): Bo Hedblad Biostatistik T10

49 Skilj på standardavvikelse (SD) och Standard Error (SE)!
SD och SE uttrycker olika saker Rökare Icke rökare Individer Grupper Bo Hedblad Biostatistik T10

50 Bakgrund: Den akuta effekten av rökning innebär bl. a
Bakgrund: Den akuta effekten av rökning innebär bl.a. ökad puls och ökat blodtryck. Har rökare högre blodtryck än icke rökare? HYPOTES Bo Hedblad Biostatistik T10

51 ICKE RÖKARE RÖKARE Histogram Visar distributionen, medelvärdet och SD
Bo Hedblad Biostatistik T10

52 Testa hypoteser Noll-hypotesen Alternativhypotesen
Fråga: Har rökare högre systoliskt blodtryck än icke-rökare? Två hypoteser kan formuleras: Noll-hypotesen Det finns ingen skillnad i blodtryck mellan rökare och icke-rökare (=H0) Alternativhypotesen Det finns en skillnad (=HA). Ett p-värde räknas fram med ett statistiskt test t.ex. Students t-test. Bo Hedblad Biostatistik T10

53 Hypotestestning Hur stor är sannolikheten att denna skillnad uppkommer av slumpen? Eller: Om man tar 2 stickprov från samma population, hur ofta får man då en sådan skillnad? P-värdet beskriver hur stor sannolikheten är att denna skillnad uppkommit av slumpen Bo Hedblad Biostatistik T10

54 Slumpfynd? P-värde Rökare Icke-rökare Variabel SBP (mmHg) 135 145
DBP (mmHg) 81 88 Total (n) 436 267 703 Bo Hedblad Biostatistik T10

55 Population och stickprov
Deltagare ”Stickprov” Ex. Blodtrycket Medelvärdet i populationen = µ SD i populationen = δ Medelvärdet i stickprovet = (x) Precisionen (SD) i stickprovet = (s) Icke-deltagare Bo Hedblad Biostatistik T10

56 Population och stickprov
Statistisk inferens, statistisk dataanalys och statistisk slutledning: Via att bestämma stickprovets (x) och (s) kan vi förutsäga sannolikheten för överenstämmelse med medelvärdet resp standardavvikelse (δ) i populationen (µ) µ skattas med hjälp av x inferens Stickprovets x beräknas µ okänt Bo Hedblad Biostatistik T10

57 Alternativhypotes (HA)
Urval Urval Variabel Rökare Ej rökare SBP (mmHg) 135 145 DBP (mmHg) 81 88 Total (n) 436 267 HA: PopRök Pop Ej rök 703 SBP Bo Hedblad Biostatistik T10

58 Noll hypotes (H0) SBP SBP Urval Urval Variabel Rökare Ej rökare
Poprök Pop Ej rök Urval Urval SBP Variabel Rökare Ej rökare SBP (mmHg) 135 145 DBP (mmHg) 81 88 Total (n) 436 267 HA: Poprök Pop Ej rök 703 SBP Bo Hedblad Biostatistik T10

59 Blodtrycksnivån är lika, dvs det finns ingen skillnad
H0: Noll hypotes (H0) Poprök Pop Ej rök Urval Urval SBP Variabel Rökare Ej rökare SBP (mmHg) 135 145 DBP (mmHg) 81 88 Total (n) 436 267 HA: Poprök Pop Ej rök Blodtrycksnivån är lika, dvs det finns ingen skillnad H0 säger att slumpen orsakat den observerade skillnaden, våra stickprov kommer från två olika populationer 703 SBP Bo Hedblad Biostatistik T10

60 Variabler Kvantitativa Kvalitativa Normalfördelade mätdata
Snedfördelade mätdata Icke parametriska test Exempel: CHI-2 Parametriska test Exempel: t-test, F-test, Anova Linjär regression Icke parametriska test Exempel: Rangkorrelation Bo Hedblad Biostatistik T10

61 Parametriska och icke-parametriska test
Bygger på antaganden hur data fördelar sig Baseras på observationernas faktiska värde Skattar en effekt för vilken man kan beräkna p-värde och CI (konfidensintervall) Icke-parametriska test Kan användas oberoende hur data fördelar sig Baseras på observationernas ranger Beräknar endast p-värde Bo Hedblad Biostatistik T10

62 Hypotesprövning: Gruppjämförselser
Två grupper av observationer Tre eller fler grupper av observationer Skalnivå Oberoende Beroende Kvalitativ (kategorisk) CHI-2, Fisher’s exact test McNemar CHI-2 Cochran Q Kvantitativ, ej normalfördelad Mann-Whitney Wilcoxon’s Signed Kruskal-Wallis Friedman’s Test Normalfördelad Student’s t-Test Paired t-Test ANOVA (ensidig indelning) ANOVA / Repeated Measures (tvåsidig) Bo Hedblad Biostatistik T10

63 Students t-test Testet kan användas då:
man jämför en kvantitativ variabel (dvs medelvärden) mellan 2 grupper den kvantitativa variabeln bör vara normalfördelad Bo Hedblad Biostatistik T10

64 Bo Hedblad Biostatistik T10

65 Skilj på dessa p-värden!!!
Students t-test Skilj på dessa p-värden!!! Bo Hedblad Biostatistik T10

66 Students t-test Ange skillnader mellan grupperna som:
Medeldifferens (95% CI) Obs: Skilj på p-värdet mellan ”Levene’s Test for Equality of variances” och ”T-test for Equality of means” Levene’s test anger statistiskt om det genomsnittliga avvikelsen (SD) från medelvärdet skiljer sig mellan grupperna. Bo Hedblad Biostatistik T10

67 P-värde Urval Urval Variabel Rökare Ej rökare SBP (mmHg) 135±21 145±22
Poprök Pop ej rök Urval Urval Variabel Rökare Ej rökare SBP (mmHg) 135±21 145±22 DBP (mmHg) 81±14 88±14 Totalt (n) 436 267 HA: T- test Poprök Pop ej rök 703 T = 5.8 , p < 0.001 Bo Hedblad Biostatistik T10

68 H0: P-värde Poprök Pop ej rök Sannolikheten att de två stickproven kommer från två populationer med lika systoliskt blodtryck är < 1% = αlfa-fel Urval Urval Karakt Rökare Ej rökare SBP (mmHg) 135±21 145±22 DBP (mmHg) 81±14 88±14 Totalt (n) 436 267 HA: T- test Poprök Pop ej rök Om p>0.05 och konklusionen är att skillnaden man observerat är slumpmässigt betingad finns möjlighten till beta-fel. Risk för beta-fel kan beräknas via power-kalkylering 703 T = 18.1 , p < 0.001 Bo Hedblad Biostatistik T10

69 P-värde P: probability, sannolikhet. Kan variera från ~0 till 1.
Beskriver hur stor sannolikheten är att resultatet beror på slumpen. Om p<0.05 är resultatet ’signifikant’, dvs sannolikheten att resultatet beror på slumpen är <5%. Noll-hypotesen kan då förkastas och vi anser att skillnaden inte kan förklaras av slumpen. Exempel på signifikanta p-värden: p<0.05, p=0.49, p= Exempel på icke signifikanta p-värden: p>0.05; p=0.685;p=0.051 Bo Hedblad Biostatistik T10

70 Alfa och beta fel i en studie
Results of the Study Reality Exposure shows An Effect Exposure shows No Effect Exposure shows An effect Correct Type I error (α) “False positive” Exposure shows NO effect Type II error (β) 1 – β (Power) “False negative” Bo Hedblad Biostatistik T10

71 p = 0.049 ”VIVE LA DIFFERENCE”! p = 0.051 Bo Hedblad Biostatistik T10

72 P-värde: sammanfattning
Om p < 0.05 Vi förkastar nollhypotesen – alternativhypotesen gäller Vi antar att det finns en faktisk skillnad Om p ≥ 0.05 Vi kan inte förkasta nollhypotesen Vi har inte kunnat påvisa några samband, skillnader, effekter eller olika fördelningar Bo Hedblad Biostatistik T10

73 kvalitativa variabler
Hypotesprövning för kvalitativa variabler Fråga: Skiljer sig högt blodtryck mellan rökare och icke-rökare? Hur stor är sannolikheten att denna skillnad beror på slumpen? Eller: Hur ofta uppkommer en sådan skillnad om stickproven kommer från samma population? Bo Hedblad Biostatistik T10

74 Variabler Kvantitativa Kvalitativa Normalfördelade mätdata
Snedfördelade mätdata Icke parametriska test Exempel: CHI-2 Parametriska test Exempel: t-test, F-test, Anova Linjär regression Icke parametriska test Exempel: Rangkorrelation Bo Hedblad Biostatistik T10

75 Hypotesprövning: Gruppjämförselser
Två grupper av observationer Tre eller fler grupper av observationer Skalnivå Oberoende Beroende Kvalitativ (kategorisk) CHI-2, Fisher’s exact test McNemar CHI-2 Cochran Q Kvantitativ, ej normalfördelad Mann-Whitney Wilcoxon’s Signed Kruskal-Wallis Friedman’s Test Normalfördelad Student t-Test ANOVA (ensidig indelning) ANOVA / Repeated Measures (tvåsidig) Bo Hedblad Biostatistik T10

76 Chi2-testet (= Pearsons’ chi-square)
När man jämför kvalitativa variabler (dvs proportioner) i två eller fler grupper. Bo Hedblad Biostatistik T10

77 Chi2-testet Bo Hedblad Biostatistik T10

78 Chi2-testet Bo Hedblad Biostatistik T10

79 Bo Hedblad Biostatistik T10

80 PAUS Bo Hedblad Biostatistik T10

81 Hypotestestning Den akuta effekten av rökning innebär bl.a. ökad puls och ökat blodtryck. Emellertid har rökare lägre blodtryck än icke-rökare i de flesta befolkningsstudier. Frågor: Hur ser sambandet kroppsvikt (BMI i tre klasser: normalviktiga/överviktiga/obesa) och blodtryck ut? Har rökare lägre blodtryck pga lägre kroppsvikt? Bo Hedblad Biostatistik T10

82 Hypotesprövning: Gruppjämförselser
Två grupper av observationer Tre eller fler grupper av observationer Skalnivå Oberoende Beroende Kvalitativ (kategorisk) CHI-2, Fisher’s exact test McNemar CHI-2 Cochran Q Kvantitativ, Ej normalfördelad Mann-Whitney Wilcoxon’s Signed Kruskal-Wallis Friedman’s Test Normalfördelad Student t-Test Paired t-Test ANOVA (ensidig indelning) ANOVA / Repeated Measures (tvåsidig) Bo Hedblad Biostatistik T10

83 Hur ser sambandet ut mellan kroppsvikt och rökning?
Analys av 2 kategoriska variabler: här passar Chi-2 testet Bo Hedblad Biostatistik T10

84 Hypotesprövning för icke normalfördelade kvantitativa variabler
Frågeställning: Är triglyceridnivån högre hos obesa än överviktiga och normalviktiga? Hur ser variabeln triglycerider ut? Kontinuerliga eller kategoriska data? Om kontinuerliga data, normalfördelade eller ej? Bo Hedblad Biostatistik T10

85 Positiv snedfördelning
Testa normalfördelning: tex via histogram, kurtosis (’toppighet’), skewness (’skevhet’) Positiv snedfördelning A Variansanalys Logaritmera Tg 2 oberoende stickprov t.ex. Mann-Whitney B Icke parametriska test k oberoende stickprov t.ex. Kruskal-Wallis Bo Hedblad Biostatistik T10

86 ANOVA - Univariat Analys av Variansen
Logaritmera Tg ANOVA - Univariat Analys av Variansen Bo Hedblad Biostatistik T10

87 Hur ser sambandet ut mellan triglycerider och kroppsvikt?
Analys av en kvantitativ logaritmerad normalfördelad variabel i olika grupper (kategorisk variabel): här passar ANOVA (’variansanalys’) metoden Bo Hedblad Biostatistik T10

88 Bo Hedblad Biostatistik T10

89 Hypotesprövning för icke normalfördelade kvantitativa variabler
Frågeställning: Är triglyceridnivån högre hos obesa än överviktiga och normalviktiga? Hur ser variabeln triglycerider ut? Kontinuerliga data Ej normalfördelade Bo Hedblad Biostatistik T10

90 Hypotesprövning: Gruppjämförselser
Två grupper av observationer Tre eller fler grupper av observationer Skalnivå Oberoende Beroende Kvalitativ (kategorisk) CHI-2, Fisher’s exact test McNemar CHI-2 Cochran Q Kvantitativ, ej normalfördelad Mann-Whitney Wilcoxon’s Signed Kruskal-Wallis Friedman’s Test Normalfördelad Student t-Test Paired t-Test ANOVA (ensidig indelning) ANOVA / Repeated Measures (tvåsidig) Bo Hedblad Biostatistik T10

91 Icke parametriska test
Kruskal-Wallis Test Mann-Whitney Test Bo Hedblad Biostatistik T10

92 Bo Hedblad Biostatistik T10

93 Bakgrund: Den akuta effekten av rökning innebär bl.a. ökad puls och ökat blodtryck Emellertid har rökare lägre blodtryck än icke-rökare i de flesta studier Kan bero på att rökare har lägre kroppsvikt Frågeställning: Är blodtrycket relaterat till kroppsvikt? Fundera alltid på: Vilken typ av variabler ingår i analysen? Vilken statistiskt test är lämplig? Hur presentera data? Bo Hedblad Biostatistik T10

94 Är blodtrycket relaterat till kroppsvikt?
Frågeställning: Är blodtrycket relaterat till kroppsvikt? Vilken typ av variabler? Kontinuerliga, kategoriska Hur presentera data? Figur, tabell Vilken test? Korrelation, ANOVA, Chi-square Bo Hedblad Biostatistik T10

95 Hur ser sambandet ut mellan blodtryck och kroppsvikt?
Analys av en kvantitativ normalfördelad variabel i olika grupper (kategorisk variabel): här passar ANOVA (’variansanalys’) metoden Bo Hedblad Biostatistik T10

96 Bo Hedblad Biostatistik T10

97 Är blodtrycket relaterat till kroppsvikt?
Frågeställning: Är blodtrycket relaterat till kroppsvikt? Vilken typ av variabler? Kontinuerliga, kategoriska Hur presentera data? Figur, tabell Vilken test? Korrelation, ANOVA, Chi-square Bo Hedblad Biostatistik T10

98 Nonparametric correlations
Föutsättning: Normalfördelade variabler! Nonparametric correlations Vid snedfördelade variabler! Bo Hedblad Biostatistik T10

99 Bo Hedblad Biostatistik T10

100 Hypotesprövning av 2 kvantitativa variabler
Korrelationskoefficient (Pearsons’ correlation). Beskriver hur väl en scatterplot ansluter till en rät linje. Kan variera från –1 till +1. Fråga: Har blodtrycket ett samband med kroppsvikten? Scatterplot (spridningsdiagram) för systoliskt blodtryck och BMI. Korrelationskoefficienten r=0.26 (r2=0.07), n=696 (7 missing), p= (p<0.001) Bo Hedblad Biostatistik T10

101 Fråga: Har triglyceridnivån ett samband med kroppsvikten?
Hypotesprövning av 2 kvantitativa variabler: Fråga: Har triglyceridnivån ett samband med kroppsvikten? Scatterplot (spridningsdiagram) för triglycerider och BMI. r = 0.23, r2 = 0.05, p<0.001, n= KORREKT???? Bo Hedblad Biostatistik T10

102 Correlations Nonparametric correlations Bo Hedblad Biostatistik T10

103 Bo Hedblad Biostatistik T10

104 Exempel på olika korrelationer (r)
Beskrivning av relationen: Perfekt positivt samband Perfekt negativt samband Starkt positivt samband Starkt negativt samband Inget samband Icke-linjärt samband Exempel på r: 1.0 -1.0 0.75 -0.75 Korrelation ej lämplig Bo Hedblad Biostatistik T10

105 Scatterbilder säger mer än siffror och tabeller
10 20 30 40 50 60 70 80 14 16 18 22 24 26 28 32 34 36 r= -0.40 p= 0.003 Bo Hedblad Biostatistik T10

106 Samma r-värde men helt olika samband!
10 20 30 40 50 60 70 80 28 32 34 36 38 42 r=0.53 p<0.0001 Samma r-värde men helt olika samband! 10 20 30 40 50 60 70 80 -,05 ,05 ,1 ,15 ,2 ,25 ,3 ,35 ,4 r=0.51 p=0.0001 Bo Hedblad Biostatistik T10

107 Hypotesprövning av 2 normalfördelade kvantitativa variabler
Linjär regression Bo Hedblad Biostatistik T10

108 Enkel linjär regression
Kopierat ifrån Björk J, Praktisk statistik för medicin och hälsa, s. 209, Studentlitteratur Bo Hedblad Biostatistik T10

109 Enkel linjär regressionsmodell Genomsnittsmodell vs. Individuell modell
y = utfallsvariabel x = förklarande variabel  (ekvationens konstant, eller skärning (intercept)),  (ekvationens riktningskoefficient eller lutningskoefficient (slope)) är regressionsparametrar vilka uppskattas utifrån observerade data Individuell modell:  = naturlig variation i data (felterm (residual), dvs. avvikelse från modellen) y =  +  * x +  Avståndet från en observation till linjen kallas för observationens residual. Storleken ( ) blir ett mått på hur mycket av den naturliga variationen i y man kan förklara genom att känna till värdet på x. Bo Hedblad Biostatistik T10

110 Hur samvarierar FEV1.0 och BMI?
Hypotesprövning: 2 kvantitativa variabler Påverkas lungfunktionen av kroppsvikten? Hur samvarierar FEV1.0 och BMI? Är sambandet oberoende av rökning? Bo Hedblad Biostatistik T10

111 Bo Hedblad Biostatistik T10

112 Bo Hedblad Biostatistik T10

113 Bo Hedblad Biostatistik T10

114 Förklaringsgrad (här justerat r2) anger hur mycket av variationen i y (här FEV1.0) som förklaras av ingående variabler x (BMI) och z (rökning) Bo Hedblad Biostatistik T10

115 Massignifikans Om man gör ett statistiskt test är sannolikheten 5% att man får ett signifikant resultat även om nollhypotesen är sann (dvs om det inte finns någon skillnad mellan grupperna). Om man gör ytterligare ett test har man även denna gång 5% chans att få signifikant resultat. Om man gör 100 test kan 5 resultat förväntas bli signifikanta även om det inte finns någon skillnad mellan grupperna. Med datorns hjälp är det lätt att göra många analyser. Man bör undvika att göra många analyser utan en bra hypotes och att övertolka enstaka signifikanta värden. Bo Hedblad Biostatistik T10

116 ”The multifactorial web of causation”
Omgivning Livsstil Genetik Sjukdom = f (ax1 + bx2 + cx3 + ………) Bo Hedblad Biostatistik T10

117 Bo Hedblad Biostatistik T10

118 BIAS och CONFOUNDING Bo Hedblad Biostatistik T10

119 Två huvudsakliga typer av bias
Selection bias och information bias Dessa kan sedan delas in i ett stort antal specifika typer Confounding bias är en tredje typ som ofta hanteras separat Bo Hedblad Biostatistik T10

120 En störfaktor kan förklara
CONFOUNDING (“störfaktorer”) En störfaktor kan förklara ett skensamband Bo Hedblad Biostatistik T10

121 Confounding - Vad är en confounder?
- Hur känner man igen en confounder? - Vilka metoder finns att ta hänsyn till confounding? - När och hur skall man justera för en confounder? Bo Hedblad Biostatistik T10

122 Confounding ’ En störfaktor (’CF’) som förklarar relationen mellan exponering (’E’) och utfall (’O’)’ O E CF Bo Hedblad Biostatistik T10

123 Exempel på confounding
Ojusterad RR >> Sann RR=1 Gula fingrar Hjärtinfarkt Rökning Bo Hedblad Biostatistik T10

124 Exempel på confounding
Ojusterad risk << sann risk Hjärtinfarkt Högt BMI Rökning Bo Hedblad Biostatistik T10

125 Confounder ”Störfaktor”
CF En ”störfaktor” måste vara: En kausal riskfaktor för utfallet Samvariera med exponeringen Ska inte vara en effekt av utfallet eller en intermediär faktor ”Störfaktorns” effekt beror på: Styrkan på sambandet mellan ”störfaktorer” och utfall bland exponerade och oexponerade Prevalens av ”störfaktorn” Inte svårt i teorin, men ofta mycket komplext i verkliga livet !! Bo Hedblad Biostatistik T10

126 Hur väljer man ’confounding factors’?
A priori ? Datadriven strategi? Kombination av båda? CF Undvik justera för faktorer i orsakskedjan eller faktorer som inte är riktiga confounders! - Antal events som ingår i analysen? Inte svårt i teorin, men ofta mycket komplext i verkliga livet !! Bo Hedblad Biostatistik T10

127 Confounding – 2 senarios
A) CF = confounder B) CF = sannolikt ej confounder utan en mediator Bo Hedblad Biostatistik T10

128 Reverse confounding Exponeringsvariabeln påverkas av utfallet (som vid tidpunkten kan vara odiagnosticerat), och en del av orsakskedjan. Exempel: Är låg fysisk aktivitet (E) en risk faktor för övervikt (O) ? Eller är den fysiska aktiviteten låg eftersom individen är överviktig? Exempel: Hypertoni är en risk faktor för kranskärlssjukdom. Men antihypertensiv behandling är oftast indicerad för patienter med kranskärlssjukdom, dessa kommer att bli hypertensiva per definition. Bo Hedblad Biostatistik T10

129 Confounding p.g.a. omätta eller dåligt mätta variabler
Residual Confounding Confounding p.g.a. omätta eller dåligt mätta variabler De variabler vi justerar för korrigerar inte för confounding fullt ut Orsak: Variabeln har dålig precision Multivariatmodellen passar dåligt Frånvaro (“missing”) av data Bo Hedblad Biostatistik T10

130 Confounding by Indication
När ett symtom eller tecken på sjukdom kan ses som en indikation (eller kontraindikation) för en viss terapi och därför både är associaterad med terapi och sannolikhet för utfallet. Exempel – de effektivaste astmaläkemedlen skrivs ut till de svårast sjuka patienterna. Dessa läkemedel kan därför vara associerade med ökat insjuknande i astmaexacerbationer. Exempel – Statiner förskrivs till patienter med hög kardiovaskulär risk. Incidensen kan därför vara högre bland patienter med statiner. Bo Hedblad Biostatistik T10

131 Vilka metoder finns att ta hänsyn till confounding (’störfaktorer’)?
Bo Hedblad Biostatistik T10

132 Metoder att hantera confounding
Confounding (“störfaktorer”) Omätta confounders Mätta confounders Design Restriktion Matchning Analys Standardisering Stratifiering Regression Omätta, men kan mätas i en substudie 2-stegs insamling Imputering Omätbara Design Analys Fall-baserad design Aktiv jämförelsegrupp (restriktion) Instrumental variabel Proxy analys Sensitivitets analys Propensity scores Marginal Structural Models Bo Hedblad Biostatistik T10 Från Schneeweiss, PDS 2006

133 Sammanfattning: Vilka metoder finns att ta hänsyn till confounding?
Stratifiera (tex på en eller flera exponeringsvariabler) Randomisera (skapa jämföra grupper, tex RCT) Matcha (tex på ålder, kön, us-tid. Obs! övermatchning) Statistisk justering: tex, multivariat analys, imputering, Prop Sc Bo Hedblad Biostatistik T10

134 Statistisk metod att ta hänsyn till confounding (’störfaktorer’)?
Multivariat analys Bo Hedblad Biostatistik T10

135 Vilka metoder finns för statistisk justering av ’confounders’
Multipel linjär regression eller partiell korrelation (när vi studerar sambandet mellan 2 kvantitativa variabler) ANCOVA m.m. när vi jämför medelvärdet av kvantitativa normalfördelade variabler i olika grupper (kategorisk variabel) Logistisk regression (när vi studerar en ja / nej variabel) Cox proportional hazard regression vid en prospektiv studie av insjuknande (’incidens’) eller överlevnad (’mortalitet’) av sjukdom i olika grupper (tex kliniska försök, RCT) Bo Hedblad Biostatistik T10

136 Vilka metoder finns för statistisk justering av ’confounders’
Multipel linjär regression eller partiell korrelation (när vi studerar sambandet mellan 2 kvantitativa variabler) ANCOVA m.m. när vi jämför medelvärdet av kvantitativa normalfördelade variabler i olika grupper (kategorisk variabel) Logistisk regression (när vi studerar en ja / nej variabel) Cox proportional hazard regression vid en prospektiv studie av insjuknande (’incidens’) eller överlevnad (’mortalitet’) av sjukdom i olika grupper (tex kliniska försök, RCT) Bo Hedblad Biostatistik T10

137 Frågeställning: Är högt blodtryck (>=160/95 mm Hg eller BT-behandling) relaterat till rökning oberoende av kroppsvikt (BMI) och fysisk aktivitet (fys_akt) Bo Hedblad Biostatistik T10

138 Logistisk regression Jämfört med normalviktiga (BMI <25) har överviktiga (BMI 25-29) och obesa (BMI>=30) en statistiskt högre Odds kvot (OR) att ha högt blodtryck (>=160/95 mmHg), OR: 1.6; 95% CI: 1.2 – 2.3 och 2.6; 95% CI: 1.2 – 5.7. Sambandet är oberoende av fysisk aktivitet, kroppsvikt och rökning. OR är signifikant lägre för rökare (0.5; 95% CI: 0.3 – 0.7), oberoende av övriga faktorer. Bo Hedblad Biostatistik T10

139 Bo Hedblad Biostatistik T10

140 Vilka metoder finns för statistisk justering av ’confounders’
Multipel linjär regression eller partiell korrelation (när vi studerar sambandet mellan 2 kvantitativa variabler) ANCOVA m.m. när vi jämför medelvärdet av kvantitativa normalfördelade variabler i olika grupper (kategorisk variabel) Logistisk regression (när vi studerar en ja / nej variabel) Cox proportional hazard regression vid en prospektiv studie av insjuknande (’incidens’) eller överlevnad (’mortalitet’) av sjukdom i olika grupper (tex i kliniska försök, RCT) Bo Hedblad Biostatistik T10

141 Fråga: Dör rökare tidigare än icke-rökare?
Bo Hedblad Biostatistik T10

142 Skillnader mellan riskmåtten
Effektmått – Risk Skillnader mellan riskmåtten Absolut risk Utrycks i händelser per personår Utrycks som en kvot där man jämför med en referensgrupp Relativ risk Bo Hedblad Biostatistik T10

143 Sannolikhetsfunktionen f(t) (”sannolikheten att överleva en viss tid”)
Överlevnadsfunktionen s(t) Kaplan-Meier Hazardfunktionen k(t) (”sannolikheten att dö precis innan Du lever”) Cox regression Prop. Hazards Bo Hedblad Biostatistik T10

144 sannolikhetsfunktionen
överlevnadsfunktionen hazardsfunktionen Bo Hedblad Biostatistik T10

145 Överlevnadskurvor – Personår av observation
Ind. # 1 2 3 4 5 6 7 8 9 10 S=Screening MI S = 4.5 personår 1 S = 2 personår 2 3 S Em = 4.5 personår S 4 = 7.5 personår etc S 1000 CABG = 7.2 personår Bo Hedblad Biostatistik T10

146 Överlevnadskurvor ICKE RÖKARE RÖKARE Bo Hedblad Biostatistik T10

147 Bo Hedblad Biostatistik T10

148 Cox regression h(t) = h0(t)e –a+b1x1+b2x2+b3x3 h0(x) b1x1 (tex kön)
Bo Hedblad Biostatistik T10

149 Bo Hedblad Biostatistik T10

150 Överlevnadsanalys Risken att dö per person-år hos rökare och icke-rökare: Icke-rökarna: De 267 icke-rökarna levde sammanlagt i 3591 år mellan 55 och 68 års ålder. 44 dog. Antal döda per person-år var: 44 / 3591 = 0.012 Rökarna: De 436 rökarna levde sammanlagt i 5567 år mellan 55 och 68 års ålder. 112 dog. Antal döda per person-år var: 112 / 5567 = 0.020 Bo Hedblad Biostatistik T10

151 Överlevnadsanalys Icke-rökarna: Incidensen är: 44 / 3591 = 0.012
Relativ risk (RR, HR): 0.02 / = 1.67 Om risken är 1 hos icke-rökaren så är den 1.67 (67% högre) hos rökaren Bo Hedblad Biostatistik T10

152 Konfidensintervall Är detta signifikant?
Relativ risk: 1.67, 95% konfidensintervall (CI): CI = x±c·sd/√n Konfidensintervall: Vid upprepade stickprov från samma population kommer 95% av konfidensintervallen att innefatta det sanna värdet (medelvärde, proportion eller sjuklighet). 1.17 – 2.34 utgör en skattning på osäkerheten i vårt punktestimat. OBS!!! En relativ risk (eller odds kvot) är signifikant om 95% konfidensintervallet inte innefattar 1. Bo Hedblad Biostatistik T10

153 Absolut risk Icke-rökarna:
Incidensen är: 44 / 3591 = *1000 = 12 per 1000 personår Rökarna: Incidensen är: 112 / 5567 = *1000 = 20 per 1000 personår Absolut risk: = 8 per 1000 personår Relativ risk: 1.67 = 67% Bo Hedblad Biostatistik T10

154 BIAS “systematiskt fel” Bo Hedblad Biostatistik T10

155 Bias – ett systematiskt fel
Ger ett felaktigt estimat eller en felaktig uppskattning av sambandet Kan visa ett samband där det inte finns något Kan dölja ett samband där det finns ett Bias uppträder i design och genomförandefasen av en studie Kan ofta inte åtgärdas i analysfasen Finns i alla typer av studier - experimentella & observationsstudier Är inte antingen eller – bias är alltid närvarande. Mycket av träningen handlar om att värdera när bias är ett problem eller inte. Epidemiology is observational discipline, so uncontrolled variables abound Most of training is in recognizing and accounting for sources of bias, often extremely subtle Less emphasis on role of chance, often handed over to biostatisticians Bo Hedblad Biostatistik T10

156 Två huvudsakliga typer av bias
Selection bias och information bias. Dessa kan sedan delas in i ett stort antal specifika typer Confounding bias är en tredje typ som ofta hanteras separat Bo Hedblad Biostatistik T10

157 Typer av bias. Del 1 J Epidemiol Community Health 2004;58:635–641.
Bo Hedblad Biostatistik T10 J Epidemiol Community Health 2004;58:635–641.

158 Typer av bias. Del 2 Bo Hedblad Biostatistik T10

159 Types of bias part 3 J Epidemiol Community Health 2004;58:635–641.
Bo Hedblad Biostatistik T10

160 Selection bias Exempel: Felaktigt val av fall och kontroller
Frivillig-bias Healthy worker effect Exklusioner pga missing data Immortal time bias Incidence-prevalence bias (selektiv överlevnad) Health care access bias Bo Hedblad Biostatistik T10

161 Information bias Exempel Missklassificering av exponering
Missklassificering av utfall Recall bias Reporting bias Protopathic bias Ecological fallacy Numerator-denominator bias Bo Hedblad Biostatistik T10

162 Orsaker till bias ? Vilken är studiebasen? Har alla haft samma sannolikhet att komma med i studien? Har alla exponerade haft samma sannolikhet att bli identifierade som exponerade? Valida och enhetliga mätmetoder? Kan exponeringen ha påverkats av subklinisk sjukdom? Är alla endpoints med? Har alla utfall haft samma chans att bli identifierade och inkluderade i studien? Vid överlevnadsanalyser – när startar och när stoppar klockan? Finns det konkurrerande utfall? Bo Hedblad Biostatistik T10

163 Standardisering Bo Hedblad Biostatistik T10

164 Standardisering En metod att ta hänsyn till skillnader mellan grupper.
Oftast standardiserar man för skillnader i ålder och / eller kön, men det kan också gälla andra skillnader. DIREKT STANDARDISERING, exempel I två städer är befolkningen ungefär lika stor (79600 respektive 85000). Dödligheten är 14 respektive 11 per 1000 person-år. Det finns emellertid skillnader i ålder - i STAD 1 finns fler unga invånare medan STAD 2 utgör en äldre befolkning. Finns det någon skillnad i dödlighet om man tar hänsyn till åldersskillnaden? Räkna ut incidensen i varje åldersgrupp för sig (6 åldersgrupper). I detta fall låter vi alla åldersgrupper få samma vikt genom att multiplicera alla incidenser med (1 / 6). Bo Hedblad Biostatistik T10

165 Standardisering Standardiserad incidens:
STAD 1 STAD 2 Ålder (år) Vikt (andel) Antal döda Befolkning Incidens per 1000 person-år 25-34 0.166 70 14000 5 9 10000 0,9 35-44 150 23000 6,5 15 19000 0,79 45-54 190 18000 10,6 30 16000 1,9 55-64 200 13000 15,4 100 15000 6,7 65-74 300 8600 34,8 250 17,9 75-84 3000 66,7 500 11000 45,5 Totalt 1.00 1110 79600 14 904 85000 11 Standardiserad incidens: STAD 1: ( )* = 24 per 1000 personår STAD 2. ( )* = 12.3 per 1000 personår I detta exempel har alla åldersgrupper fått samma vikt (en sjättedel). Det är också möjligt att ge yngre åldersgrupper större betydelse genom att vikta på annat sätt. Bo Hedblad Biostatistik T10

166 Standardisering RR: 24 / 12.3 = 1.95 Standardiserad incidens:
STAD 1 STAD 2 Ålder (år) Vikt (andel) Antal döda Befolkning Incidens per 1000 person-år 25-34 0.166 70 14000 5 9 10000 0,9 35-44 150 23000 6,5 15 19000 0,79 45-54 190 18000 10,6 30 16000 1,9 55-64 200 13000 15,4 100 15000 6,7 65-74 300 8600 34,8 250 17,9 75-84 3000 66,7 500 11000 45,5 Totalt 1.00 1110 79600 14 904 85000 11 RR: 24 / 12.3 = 1.95 Standardiserad incidens: STAD 1: ( )* = 24 per 1000 personår STAD 2. ( )* = 12.3 per 1000 personår I detta exempel har alla åldersgrupper fått samma vikt (en sjättedel). Det är också möjligt att ge yngre åldersgrupper större betydelse genom att vikta på annat sätt.

167 Indirekt standardisering
SMR (standardized mortality rate) Anger dödlighet som observerats om det förväntade antalet är 100. Ofta jämför man med en stor population, tex Sveriges befolkning 1990, som alltså får talet SMR = 100. Bo Hedblad Biostatistik T10

168 Litet schema för val av statistisk metod
Två kvalitativa variabler (ex. kön, rökare, hypertoniker). Gör 4-fältstabell och Chi-2 test. Jämföra medelvärde i två grupper. (ex. vikt eller blodtryck hos rökare-ickerökare). Använd t-test, ANOVA Samband (”grad av rätlinjighet”) mellan två kvantitativa variabler. Använd Pearsons’ korrelation coefficient. Vid små material (<30 individer) och icke normalfördelade material: Använd icke-parametriska test. t-test ersätts med Mann-Whitney U-test eller Pearsons korrelation med Spearman. Om Du gjort upprepat test på samma individer, t.ex. blodtryck före och efter vårdtillfället. Använd parade tester, tex parat t-test. Bo Hedblad Biostatistik T10

169 Likabedömning Gör läkare samma bedömning av en grupp patienter?
2 läkare möter samma pat och oberoende av varandra föreslås beh A, B eller C. Läkarna föreslår beh på 25 patienter. Fråga: Gör läkarna samma bedömning i gruppen? Kappa (κ) test: Enligt Robert Altman: < 0.2 = slumpen = svag överenstämmelse = måttlig överenstämmelse = god överenstämmelse = stark överenstämmelse Bo Hedblad Biostatistik T10

170 Likabedömning Gör läkare samma bedömning av en grupp patienter?
2 läkare möter samma pat och oberoende av varandra föreslås beh A, B eller C. Läkarna föreslår beh på 25 patienter. Fråga: Gör läkarna samma bedömning i gruppen? Kappa (κ) test: Enligt Robert Altman: < 0.2 = slumpen = svag överenstämmelse = måttlig överenstämmelse = god överenstämmelse = stark överenstämmelse Bo Hedblad Biostatistik T10

171 MEDELVÄRDESREGRESSION
125 Mättillfälle 1 (M1, svart prick): 500 patienter: x= 95 ± 8 mmHg Mättillfälle 2 (M2, vit prick): 500 patienter: x = 95 mm Hg Korrelation (r) mellan mättillfälle 1 och 2 = 0.6 Om mäter bara patienter med DBP ≥ 95 mm Hg M1: mm Hg M2: 98.8 mm Hg 115 105 95 Mättillfälle 2 (DBP mmHg) 85 75 65 65 75 85 95 105 115 125 Mättillfälle 1 (DBP mmHg) -2.6 mmHg ”Fenomenet” orsakas av mätosäkerhet och inom patientvariation Bo Hedblad Biostatistik T10

172 MEDELVÄRDESREGRESSION KAN FÖRORSAKA MISSVISANDE RESULTAT SOM:
Relaterande av förändring mot ingångsvärdet Tex r = (M1 vs M2-M1) Undersökning av effekter i subgrupper Tex av grupper med ”extrema” värden Publikationsbias Tex många ”fynd” uppvisar påtaglig regression mot medelvärdet i senare jämförbara studier (t.ex. hsCRP och CV risk) Bo Hedblad Biostatistik T10

173 POWER BERÄKNING – några Web adresser
PS Power and Sample Size Calculation Enkelt, lätt att använda Kan laddas ned gratis via PowerSampleSize G*Power 3 Mer avancerat, något svårare att använda Kan laddas ned gratis via Episheet Epidemiologiska dimensioneringsberäkningar Bo Hedblad Biostatistik T10

174 ADRESS TILL KORT REDOVISNING AV STATISTISKA METODER
Bo Hedblad Biostatistik T10

175 selektions eller mätningsbias?
OBSERVERAT SAMBAND Kan det bero på selektions eller mätningsbias? NEJ Kan det bero på confounding? NEJ Kan det bero slumpen? SANNOLIKT NEJ Kan det vara kausalt? Bo Hedblad Biostatistik T10

176 En guideline för kausalitet
Tidsamband: Kommer orsak före effekten? Rimlighet: Är observerade samband i linje med annan kunskap? Mekanismer, djurförsök Konsistens: Har liknande resultat visats tidigare? Styrka: Vilken styrka finns mellan orsak och verkan? Relativ risk Dos-respons samband: Ger ökad exponering en ökad effekt? Reversibilitet: Ger minskad exponering en minskad risk? Studiedesign: Är resultaten baserade på en stark studiedesign? Bevisbedömning: Hur många olika typer av evidens leder till konklusionen? Bo Hedblad Biostatistik T10

177 I. Andersson. Studentlitteratur 2006
Värdering av samband Nej Statistiskt samband Samband saknas Ja Bias Påverkan på samband Ja Confounding Konsistens Orsakssamband Styrka Tidsamband Bidra till orsaks samband Rimlighet Dos-respons samband Studiedesign Kausalitet Reversibilitet Bo Hedblad Biostatistik T10 I. Andersson. Studentlitteratur 2006

178 Styrkan att påvisa kausalitet
Värdering av samband STUDIETYP Styrkan att påvisa kausalitet Ekologisk studie Mycket låg Låg Tvärsnittsstudie Fall-kontroll studie Måttlig Stor Kohort studie Stor – mycket stor RCT Låg – Måttlig Samhällsintervention I. Andersson. Studentlitteratur 2006 Bo Hedblad Biostatistik T10


Ladda ner ppt "SPSS baserad biostatistik"

Liknande presentationer


Google-annonser