Presentation laddar. Vänta.

Presentation laddar. Vänta.

Statistik Lars Valter Fil.lic. Statistik Centrum för hälso- och vårdutveckling Landstinget i Östergötland Linköping Academic Research Centre (LARC) Landstinget.

Liknande presentationer


En presentation över ämnet: "Statistik Lars Valter Fil.lic. Statistik Centrum för hälso- och vårdutveckling Landstinget i Östergötland Linköping Academic Research Centre (LARC) Landstinget."— Presentationens avskrift:

1 Statistik Lars Valter Fil.lic. Statistik Centrum för hälso- och vårdutveckling Landstinget i Östergötland Linköping Academic Research Centre (LARC) Landstinget i Östergötland och Lnköpings Universitet

2 Statistik

3 Statistik

4 ” … vetenskapen om hur data med inslag av slumpvariation eller osäkerhet skall insamlas, utvärderas och presenteras.” (National Encyklopedin) Statistik

5 “Statistics, the most important science in the whole world: for upon it depends the applications of every other science and of every art: the one science essential for all political and social administration, all education, all organization based on experience for it only gives results of our experiences” Statistik

6 I dag Grund (skalor och variabler) Deskriptiv statistik Statistisk inferens (analys) Statistisk styrka (poweranalys) Sensitivitet och specificitet Statistik

7 Variabler och skalor Nominalskala Ordinalskala Intervallskala Kvotskala Statistik

8 Nominal skala Egenskaper: Klassificerar objekt till en av flera kategorier Exempel: Födelseland, Yrke, etc Statistik

9 Ordinal skala Egenskaper: Naturlig rangordning mellan kategorier Exempel: Sf36 fråga1 Statistik

10 Ordinal skala Statistik

11 Nominal skala - alltid diskret (diskret = kategoridata, klassindelad) Ordinal skala – ofta diskret men inte alltid… Statistik

12 VAS, Visuell Analog Skala en kontinuerlig ordinal skala Statistik

13 Intervallskala Egenskaper: Ekvidistans Exempel: Temperatur (grader Celsius) Statistik

14 Kvotskala Egenskaper: Absolut nollpunkt Exempel: Vikt, temperatur (kelvin) Statistik

15 Intervall- och kvotskalor kan vara antingen kontinuerliga eller diskreta Alla fyra skalorna kan dikotomiseras Statistik

16 Vilka variabler kan vi mäta på oss här inne? Vilka skalor mäts variablerna med? Statistik

17 Centralmått (lägesmått) Spridningsmått Skevhet (skewness) Toppighet (curtosis) Statistik

18 Centralmått Typvärde Median Medelvärde Statistik

19 Spridningsmått Kvartiler och kvartilavstånd Min, max och range (vidd) Standardavvikelse Statistik

20 Nominalskala:Typvärde Ordinal skala: Median, kvartiler, min och max, range och kvartilavstånd Intervall-/kvotskala: Medelvärde, standardavvikelse Statistik

21 Två formler

22 En övning Beräkna: typvärde, median och medelvärde samt 1:a kvartilen och 3:e kvartilen

23 En övning

24 Beskriva med tabeller Korstabeller kan vara tvåvägsindelade eller trevägsindelade och innehålla absoluta frekvenser eller relativa frekvenser

25 Beskriva med tabeller Tvåvägstabell med absoluta och relativa frekvenser

26 Beskriva med tabeller Trevägstabell med relativa frekvenser

27 Beskriva med tabeller

28 Trevägsindelad kvottabell (4 variabler)

29 Statistikens bilder

30

31

32

33

34

35

36

37

38

39

40

41

42

43

44

45

46 Förvilla inte !

47

48

49 Inte så bra exempel Statistikens bilder

50

51 statistisk inferens, induktiv vetenskap där man drar slutsatser ur empiriska data under en osäkerhet orsakad av slumpmässighet i data. Systematisk och slumpmässig variation i data beskrivs i en statistisk modell (t.ex. en regressionsmodell) med en eller flera okända... Nationalencyklopedin Statistisk inferens

52 Population Stickprov Medelvärde: μ Standardavvikelse: σ Medelvärde: x Standardavvikelse: s _

53 Statistisk inferens Population Behandling A Population Behandling B Medelvärde: μ A Standardavvikelse: σ A Medelvärde: μ B Standardavvikelse: σ B Stickprov xAsAxAsA _ xBsBxBsB _

54 Samplingfördelning: Ett centralt begrepp i statistisk inferens Statistisk inferens

55 Samplingfördelning

56

57 medelvärde=54. 9 Samplingfördelning

58

59 medelvärde=54.9 Samplingfördelning

60

61

62

63

64

65

66

67

68

69

70 Centrala gränsvärdessatsen Ungefär så här: Om populationen är normalfördelad så blir samplingfördelningen för stickprovsmedelvärdet också normalfördelad Om populationen är symmetrisk så blir samplingfördelningen för stickprovsmedelvärdet nästan normalfördelad vid ganska liten stickprovsstorlek Om populationen inte är symmetrisk så blir samplingfördelningen för stickprovsmedelvärdet nästan normalfördelad vid ganska stor stickprovsstorlek

71 Samplingfördelning

72

73 Temperatur i en population

74 Samplingfördelning

75 Standardavvikelse eller standard error eller både och?

76 Hypotesprövning

77 Typiskt statistisk frågeställning: Är medelvärdet i den här populationen högre än 37 grader? Ställ upp statistiska hypoteser Ta ett stickprov Beräkna en testvariabel Räkna ut ett p-värde. Dra slutsats. Hypotesprövning

78 Statistiska hypoteser till grund för varje p-värde finns en statistisk hypotes Exempel Hypotesprövning eller

79 P-värde sannolikheten att, om nollhypotesen är sann, observera något som avviker mer från nollhypotesen än den observation som vi har fått Hypotesprövning 79 P-value Probability of obtaining a test statistic at least as extreme as the one that was actually observed, given that the null hypothesis is true

80 Nu vill vi undersöka om den genomsnittliga temperaturen i en population är högre än 37 grader. Ett stickprov ur populationen (n=16) resulterar i stickprovsmedelvärdet 37,3 och stickprovets standardavvikelse är 0,5 Statistiska hypoteser Hypotesprövning

81 Samplingfördelningen när nollhypotesen är sann

82 Testvariabel: Är 2,4 tillräckligt stort för att förkasta nollhypotesen? Se på p-värdet: Är p-värdet tillräckligt litet för att förkasta nollhypotesen? Hypotesprövning Är 37,3 tillräckligt stort för att förkasta nollhypotesen?

83 Hypotesprövning Hur litet ska p-värdet vara? < 0.20 < 0.10 < 0.05 eller < 0.01

84 Kan man dra fel slutsats? Javisst Hypotesprövning

85 Nollhypotesen förkastas Nollhypotesen förkastas inte Nollhypotesen är sann Nollhypotesen inte är sann Rätt Typ I-fel (α) Typ II-fel (β) Hypotesprövning

86 Konfidensintervall för µ (populationsmedelvärdet) Statistisk inferens Hypotesprövning:

87 Konfidensintervall Uppskatta populationens medelvärde med stickprovets medelvärde (37,3) eller bättre med ett (95%-igt) konfidensintervall 37,03-37,57

88 Konfidensintervall Konfidensintervallet tolkas: Med 95% säkerhet innefattar (täcker) intervallet den populationsparameter vi är intresserade av.

89 Power - Styrka Power-beräkningar är ett stöd inför planering och design av en studie En liten studie kan vara oetisk eller meningslös En stor studie kan vara oetisk eller onödigt stor En bra power-beräkning kräver en del antagande och därför kunskap om det som ska studeras Statistisk styrka: Sannolikheten att förkasta en felaktig noll-hypotes

90 Beräkna stickprovsstorlek 1.Vilken är den minsta kliniskt relevanta effekten/skillnaden som vi vill upptäcka? 2.Vilka är de statistiska hypoteserna? 3.Vilken signifikansnivå ska användas? 4.Vilken styrka vill vi ha? 5.Hur stor är variationen (standardavvikelsen).

91 Beräkna stickprovsstorlek Vilka är de statistiska hypoteserna? Vilken signifikansnivå ska användas? Vilken styrka vill vi ha? Hur stor är variationen (standardavvikelsen)?

92 61049,76784, ,44196, ,6487, ,9931, ,507,84 Power 0,90 0,80 Beräkna stickprovsstorlek

93 n μpμp

94 Power - Styrka Power-beräkningar kan vara lite besvärliga att göra för hand

95 Sensitivitet: Sannolikheten att klassificera en sjuk person som sjuk. Specificitet: Sannolikheten att klassificera en frisk person som frisk. Sensitivitet och specificitet

96 Ett exempel: Kroppstemperaturen i en frisk befolkning är i genomsnitt 37 grader med en standardavvikelse på 0,5 grader Sensitivitet och specificitet Specificitet

97 forts. exempel: Kroppstemperaturen i en sjuk befolkning är i genomsnitt 38,5 grader med en standardavvikelse på 2,5 grader Sensitivitet och specificitet Sensitivitet

98 Sensitivitet och specificitet

99 Temp.SensitivitetSpecificitet 380,690,98 Sensitivitet och specificitet

100

101 Temp.SensitivitetSpecificitet 37,50,84 38,00,690,98 38,50,501,00 Sensitivitet och specificitet

102 Sensitivitet: Sannolikheten att klassificera en sjuk person som sjuk. Specificitet: Sannolikheten att klassificera en frisk person som frisk. Positivt testNegativt test SjukaAB FriskaCD Sensitivitet och specificitet

103 För en slumpmässigt vald person ur en population definieras: Sannolikheten att personen är sjuk (Prevalens) Sannolikheten för sjukdom efter positivt test (Positivt prediktivt värde) Sannolikheten för frisk efter negativt test (Negativt prediktivt värde)

104 Sensitivitet och specificitet Ett exempel: I en studie för att bestämma sensitivitet och specificitet för en ny diagnostisk metod ingår 100 personer med den aktuella sjukdomen och 100 friska personer. Positivt testNegativt testTotalt Sjuka Friska Totalt sensitivitet: 90 % specificitet: 70%

105 Sensitivitet och specificitet Screening av sjukdomsförekomst Vid screening kan man vara intresserad av att beräkna följande: Andel personer i befolkningen som kommer att behandlas= Positivt prediktivt värde= Negativt prediktivt värde= Andel personer i befolkningen som felaktigt behandlas (falska positiva)= Andel personer i befolkningen som felaktivt inte behandlas (falska negativa)=

106 Sensitivitet och specificitet Exempel I en liten befolkning ( personer) är prevalensen för en viss sjukdom 5 %. Ett diagnostiskt instrument har sens.=90 % och spec.=70%. Positivt testNegativt testTotalt Sjuka Friska Totalt Beräkna: Andel personer i befolkningen som kommer att behandlas = 33000/ = 33% Positivt prediktivt värde = 4500/33000 = 13.6% Negativt prediktivt värde = 66500/67000 = 99.3% Andel personer i befolkningen som felaktigt behandlas = 28500/ = 28.5% Andel personer i befolkningen som felaktivt inte behandlas = 500/ = 0.5%

107

108 Det stora sjukhuset Det lilla sjukhuset Med kompl.Utan kompl. Simpsons paradox 50 % kompl. 40 % kompl.

109 Simpsons paradox Det stora sjukhuset Det lilla sjukhuset Med kompl.Utan kompl Det stora sjukhuset Det lilla sjukhuset Ej akut Akut 20 % kompl. 30 % kompl. 60 % kompl. 70 % kompl.

110 Simpsons paradox Resultat Sjukhus Akut/ej akut


Ladda ner ppt "Statistik Lars Valter Fil.lic. Statistik Centrum för hälso- och vårdutveckling Landstinget i Östergötland Linköping Academic Research Centre (LARC) Landstinget."

Liknande presentationer


Google-annonser