Presentation laddar. Vänta.

Presentation laddar. Vänta.

Statistik Lars Valter Fil.lic. Statistik

Liknande presentationer


En presentation över ämnet: "Statistik Lars Valter Fil.lic. Statistik"— Presentationens avskrift:

1 Statistik Lars Valter Fil.lic. Statistik
Centrum för hälso- och vårdutveckling Landstinget i Östergötland Linköping Academic Research Centre (LARC) Landstinget i Östergötland och Lnköpings Universitet

2 Statistik

3 Statistik

4 Statistik ” … vetenskapen om hur data med inslag av slumpvariation eller osäkerhet skall insamlas, utvärderas och presenteras.” (National Encyklopedin)

5 “Statistics, Statistik the most important science in the whole world:
for upon it depends the applications of every other science and of every art: the one science essential for all political and social administration, all education, all organization based on experience for it only gives results of our experiences”

6 Statistik I dag Grund (skalor och variabler) Deskriptiv statistik
Statistisk inferens (analys) Statistisk styrka (poweranalys) Sensitivitet och specificitet

7 Statistik Variabler och skalor Nominalskala Ordinalskala
Intervallskala Kvotskala

8 Klassificerar objekt till en av flera kategorier
Statistik Nominal skala Egenskaper: Klassificerar objekt till en av flera kategorier Exempel: Födelseland, Yrke, etc

9 Naturlig rangordning mellan kategorier
Statistik Ordinal skala Egenskaper: Naturlig rangordning mellan kategorier Exempel: Sf36 fråga1

10 Statistik Ordinal skala

11 Statistik Nominal skala - alltid diskret
(diskret = kategoridata, klassindelad) Ordinal skala – ofta diskret men inte alltid…

12 Statistik VAS, Visuell Analog Skala en kontinuerlig ordinal skala

13 Temperatur (grader Celsius)
Statistik Intervallskala Egenskaper: Ekvidistans Exempel: Temperatur (grader Celsius)

14 Vikt, temperatur (kelvin)
Statistik Kvotskala Egenskaper: Absolut nollpunkt Exempel: Vikt, temperatur (kelvin) 0 kelvin = -273,15 celsius

15 Alla fyra skalorna kan dikotomiseras
Statistik Intervall- och kvotskalor kan vara antingen kontinuerliga eller diskreta Alla fyra skalorna kan dikotomiseras

16 Statistik Vilka variabler kan vi mäta på oss här inne?
Vilka skalor mäts variablerna med?

17 Statistik Centralmått (lägesmått) Spridningsmått Skevhet (skewness)
Toppighet (curtosis)

18 Statistik Centralmått Typvärde Median Medelvärde

19 Statistik Spridningsmått Kvartiler och kvartilavstånd
Min, max och range (vidd) Standardavvikelse

20 Statistik Nominalskala:Typvärde
Ordinal skala: Median, kvartiler, min och max, range och kvartilavstånd Intervall-/kvotskala: Medelvärde, standardavvikelse

21 Två formler 

22 En övning Beräkna: typvärde, median och medelvärde samt 1:a kvartilen och 3:e kvartilen

23 En övning

24 Beskriva med tabeller Korstabeller kan vara
tvåvägsindelade eller trevägsindelade och innehålla absoluta frekvenser eller relativa frekvenser

25 Beskriva med tabeller Tvåvägstabell med absoluta och relativa frekvenser

26 Beskriva med tabeller Trevägstabell med relativa frekvenser

27 Beskriva med tabeller

28 Beskriva med tabeller Trevägsindelad kvottabell (4 variabler)

29 Statistikens bilder

30 Statistikens bilder

31 Statistikens bilder Dotplot

32 Statistikens bilder Histogram

33 Statistikens bilder Boxplot

34 Statistikens bilder

35 Statistikens bilder

36 Statistikens bilder Gör inte så här

37 Statistikens bilder

38 Statistikens bilder

39 Statistikens bilder

40 Statistikens bilder

41 Statistikens bilder

42 Statistikens bilder

43 Statistikens bilder

44 Statistikens bilder

45 Statistikens bilder

46 Förvilla inte !

47 Förvilla inte !

48 Förvilla inte !

49 Statistikens bilder Inte så bra exempel

50 Statistikens bilder

51 Statistisk inferens statistisk inferens, induktiv vetenskap där man drar slutsatser ur empiriska data under en osäkerhet orsakad av slumpmässighet i data. Systematisk och slumpmässig variation i data beskrivs i en statistisk modell (t.ex. en regressionsmodell) med en eller flera okända ... Nationalencyklopedin

52 Statistisk inferens Population Stickprov Medelvärde: μ _
Standardavvikelse: σ _ Medelvärde: x Standardavvikelse: s

53 Statistisk inferens Population Behandling A Population Behandling B
Medelvärde: μA Standardavvikelse: σA Medelvärde: μB Standardavvikelse: σB Stickprov Stickprov _ _ xA sA xB sB

54 Ett centralt begrepp i statistisk inferens
Samplingfördelning: Ett centralt begrepp i statistisk inferens

55 Samplingfördelning

56 Samplingfördelning

57 Samplingfördelning medelvärde=54.9

58 Samplingfördelning

59 Samplingfördelning medel 50, stdev 5 medelvärde=54.9

60 Samplingfördelning

61 Samplingfördelning

62 Samplingfördelning

63 Samplingfördelning

64 Samplingfördelning

65 Samplingfördelning

66 Samplingfördelning

67 Samplingfördelning

68 Samplingfördelning

69 Samplingfördelning

70 Centrala gränsvärdessatsen
Ungefär så här: Om populationen är normalfördelad så blir samplingfördelningen för stickprovsmedelvärdet också normalfördelad Om populationen är symmetrisk så blir samplingfördelningen för stickprovsmedelvärdet nästan normalfördelad vid ganska liten stickprovsstorlek Om populationen inte är symmetrisk så blir samplingfördelningen för stickprovsmedelvärdet nästan normalfördelad vid ganska stor stickprovsstorlek

71 Samplingfördelning

72 Samplingfördelning

73 Samplingfördelning Temperatur i en population

74 Samplingfördelning

75 Standardavvikelse eller standard error eller både och?

76 Hypotesprövning

77 Typiskt statistisk frågeställning:
Hypotesprövning Typiskt statistisk frågeställning: Är medelvärdet i den här populationen högre än 37 grader? Ställ upp statistiska hypoteser Ta ett stickprov Beräkna en testvariabel Räkna ut ett p-värde. Dra slutsats.

78 Hypotesprövning Statistiska hypoteser
till grund för varje p-värde finns en statistisk hypotes Exempel eller

79 Hypotesprövning P-värde P-value
sannolikheten att, om nollhypotesen är sann, observera något som avviker mer från nollhypotesen än den observation som vi har fått P-value Probability of obtaining a test statistic at least as extreme as the one that was actually observed, given that the null hypothesis is true

80 Hypotesprövning Nu vill vi undersöka om den genomsnittliga temperaturen i en population är högre än 37 grader. Ett stickprov ur populationen (n=16) resulterar i stickprovsmedelvärdet 37,3 och stickprovets standardavvikelse är 0,5 Statistiska hypoteser

81 Hypotesprövning Samplingfördelningen när nollhypotesen är sann

82 Hypotesprövning Är 37,3 tillräckligt stort för att förkasta nollhypotesen? Testvariabel: Är 2,4 tillräckligt stort för att förkasta nollhypotesen? Se på p-värdet: Är p-värdet tillräckligt litet för att förkasta nollhypotesen?

83 Hypotesprövning Hur litet ska p-värdet vara? < 0.20 < 0.10
< 0.05 eller < 0.01

84 Hypotesprövning Kan man dra fel slutsats? Javisst 

85 Hypotesprövning Rätt Rätt Typ I-fel (α) Typ II-fel (β)
Nollhypotesen förkastas Nollhypotesen förkastas inte Nollhypotesen är sann Nollhypotesen inte är sann Typ I-fel (α) Rätt Typ II-fel (β) Rätt

86 Statistisk inferens Hypotesprövning:
Konfidensintervall för µ (populationsmedelvärdet)

87 Konfidensintervall 37,03-37,57 Uppskatta populationens medelvärde med
stickprovets medelvärde (37,3) eller bättre med ett (95%-igt) konfidensintervall 37,03-37,57

88 Konfidensintervallet tolkas:
Med 95% säkerhet innefattar (täcker) intervallet den populationsparameter vi är intresserade av.

89 Power - Styrka Power-beräkningar är ett stöd inför planering och design av en studie En liten studie kan vara oetisk eller meningslös En stor studie kan vara oetisk eller onödigt stor En bra power-beräkning kräver en del antagande och därför kunskap om det som ska studeras Statistisk styrka: Sannolikheten att förkasta en felaktig noll-hypotes

90 Beräkna stickprovsstorlek
Vilken är den minsta kliniskt relevanta effekten/skillnaden som vi vill upptäcka? Vilka är de statistiska hypoteserna? Vilken signifikansnivå ska användas? Vilken styrka vill vi ha? Hur stor är variationen (standardavvikelsen).

91 Beräkna stickprovsstorlek
Vilka är de statistiska hypoteserna? Vilken signifikansnivå ska användas? Vilken styrka vill vi ha? Hur stor är variationen (standardavvikelsen)?

92 Beräkna stickprovsstorlek
Power 0, ,80 6 1049,76 784,00 7 262,44 196,00 8 116,64 87,11 10 41,99 31,36 15 10,50 7,84

93 Beräkna stickprovsstorlek

94 Power-beräkningar kan vara lite besvärliga att göra för hand 
Power - Styrka Power-beräkningar kan vara lite besvärliga att göra för hand 

95 Sensitivitet och specificitet
Sannolikheten att klassificera en sjuk person som sjuk. Specificitet: Sannolikheten att klassificera en frisk person som frisk.

96 Sensitivitet och specificitet
Ett exempel: Kroppstemperaturen i en frisk befolkning är i genomsnitt 37 grader med en standardavvikelse på 0,5 grader Specificitet

97 Sensitivitet och specificitet
forts. exempel: Kroppstemperaturen i en sjuk befolkning är i genomsnitt 38,5 grader med en standardavvikelse på 2,5 grader Sensitivitet

98 Sensitivitet och specificitet

99 Sensitivitet och specificitet
Temp. Sensitivitet Specificitet 38 0,69 0,98

100 Sensitivitet och specificitet

101 Sensitivitet och specificitet
Temp. Sensitivitet Specificitet 37,5 0,84 38,0 0,69 0,98 38,5 0,50 1,00

102 Sensitivitet och specificitet
Sensitivitet: Sannolikheten att klassificera en sjuk person som sjuk. Specificitet: Sannolikheten att klassificera en frisk person som frisk. Positivt test Negativt test Sjuka A B Friska C D

103 Sensitivitet och specificitet
För en slumpmässigt vald person ur en population definieras: Sannolikheten att personen är sjuk (Prevalens) Sannolikheten för sjukdom efter positivt test (Positivt prediktivt värde) Sannolikheten för frisk efter negativt test (Negativt prediktivt värde)

104 Sensitivitet och specificitet
Ett exempel: I en studie för att bestämma sensitivitet och specificitet för en ny diagnostisk metod ingår 100 personer med den aktuella sjukdomen och 100 friska personer. Positivt test Negativt test Totalt Sjuka 90 10 100 Friska 30 70 120 80 200 sensitivitet: 90 % specificitet: 70%

105 Sensitivitet och specificitet
Screening av sjukdomsförekomst Vid screening kan man vara intresserad av att beräkna följande: Andel personer i befolkningen som kommer att behandlas= Positivt prediktivt värde= Negativt prediktivt värde= Andel personer i befolkningen som felaktigt behandlas (falska positiva)= Andel personer i befolkningen som felaktivt inte behandlas (falska negativa)=

106 Sensitivitet och specificitet
Exempel I en liten befolkning ( personer) är prevalensen för en viss sjukdom 5 %. Ett diagnostiskt instrument har sens.=90 % och spec.=70%. Positivt test Negativt test Totalt Sjuka 4500 500 5000 Friska 28500 66500 95000 33000 67000 100000 Beräkna: Andel personer i befolkningen som kommer att behandlas = 33000/ = 33% Positivt prediktivt värde = 4500/33000 = 13.6% Negativt prediktivt värde = 66500/67000 = 99.3% Andel personer i befolkningen som felaktigt behandlas = 28500/ = 28.5% Andel personer i befolkningen som felaktivt inte behandlas = 500/ = 0.5%

107

108 Simpsons paradox 20 16 24 Med kompl. Utan kompl. Det stora sjukhuset
Det lilla sjukhuset 40 % kompl.

109 Simpsons paradox Ej akut Akut 2 8 9 21 18 12 7 3 Med kompl.
Utan kompl. Ej akut Det stora sjukhuset 2 8 9 21 20 % kompl. Det lilla sjukhuset 30 % kompl. Akut Det stora sjukhuset 18 12 7 3 60 % kompl. Det lilla sjukhuset 70 % kompl.

110 Simpsons paradox Akut/ej akut Resultat Sjukhus


Ladda ner ppt "Statistik Lars Valter Fil.lic. Statistik"

Liknande presentationer


Google-annonser